Utf 8 кодиране в excel. Ами ако експортираният csv файл не показва руски символи? Различни кодировки за различни азбуки

Често, когато работите с различни файлове в програмата Excel, потребителят може да се сблъска с факта, че вместо разбираеми букви ще има неразбираем шрифт, който не може да се чете. Виновно е неправилното кодиране. В тази статия ще говорим как да промените кодирането в Excel, така че думите да могат да се четат.

Метод първи: с помощта на Notepad ++

Така се случи, че е по-лесно да промените кодирането на текст в програма на трета страна, отколкото в самия Excel. Ето защо сега ще разгледаме начин за промяна на кодирането в Excel с помощта на програмата Notepad ++.

Така че, за да изпълните правилно всички стъпки, следвайте инструкциите:

  1. Стартирайте програмата "Notepad ++".
  2. Кликнете върху бутона "Файл".
  3. В менюто, което се показва, изберете "Отваряне" (можете също да направите това, като натиснете клавишната комбинация CTRL + O).
  4. В прозореца на Explorer, който се показва, потърсете желания файл, чието кодиране е неправилно, и щракнете върху бутона „Отваряне“.
  5. Във файла, който се отваря, щракнете върху бутона "Кодиране", разположен над лентата с инструменти.
  6. В менюто изберете елемента "Преобразуване в UTF-8", тъй като това е кодирането, което Excel приема с гръм и трясък.
  7. Щракнете върху бутона "Запазване" от лявата страна на лентата с инструменти и затворете прозореца на програмата.

Това е всичко, сега знаете как да промените кодирането в Excel по един от начините. Въпреки че е най-бързият, най-удобният и прост, все пак има и други, за които не може да се мълчи.

Втори метод: използване на "Помощника за текст"

Директно в самата програма Microsoft Excel има и инструменти, които ще ви позволят да промените кодирането. Ето какво ще бъде обсъдено сега, или по-скоро за "Майстор на текстове":

  1. Отворете Excel. Моля, имайте предвид, че той трябва да се стартира не чрез двукратно щракване върху файла, който се показва неправилно, а директно от програмата с празен лист.
  2. Отидете в раздела "Данни".
  3. Щракнете върху бутона Получаване на външни данни и изберете От текст от падащото меню.
  4. В прозореца на Explorer, който се показва, посочете пътя до файла, който има проблеми с кодирането, и щракнете върху бутона „Импортиране“.
  5. Сега самият прозорец "Съветник за текст" ще се отвори директно. В него трябва да промените файловия формат, поради което кликнете върху едноименния файл и изберете "Unicode (UTF-8)" от там.
  6. Щракнете върху Напред.
  7. Също така пропуснете следващия прозорец, като щракнете върху бутона "Напред", всички настройки в него трябва да са по подразбиране.
  8. Сега трябва да дефинирате формата на данните на колоната на файла и в съответствие с него да изберете един от елементите в списъка със същото име. В резултат на това щракнете върху "Край".

След всичко това трябва да посочите първата клетка, така че данните да се поберат в началото на таблицата.

Ясно е как да промените кодирането в Excel по втория начин. Да преминем към третото.

Трети метод: спестяване

Как да промените кодирането в Excel? За да приложите третия метод, е необходимо да изпълните редица от следните действия:

  1. Отворете файла в програма.
  2. Щракнете върху "Файл".
  3. Изберете „Запазване като“.
  4. В менюто, което се показва, изберете разширението и щракнете върху "Инструменти", от падащото меню - "Опции за уеб документ".
  5. В прозореца, който се показва, отидете на раздела "Кодиране" и го изберете от списъка "Запазване на документа като".
  6. Щракнете върху OK.

Сега остава само да посочите папката, в която ще бъде записан файлът. Следващият път, когато го отворите, текстът трябва да се покаже правилно.

Когато отворите текстов файл в Microsoft Word или друга програма (например на компютър, чийто език на операционната система се различава от този, на който е написан текстът във файла), кодирането помага на програмата да определи как трябва да се показва текстът на екрана, за да може да се чете.

В тази статия

Разбиране на кодирането на текст

Информацията, която се показва като текст, всъщност се съхранява в текстов файл като числови стойности. Компютърът преобразува тези стойности в показваеми знаци с помощта на кодиране.

Кодирането е схема за номериране, при която всеки текстов символ в набор съответства на определена числова стойност. Кодирането може да съдържа букви, цифри и други знаци. Различните езици често използват различни набори от знаци, така че много от съществуващите кодировки са предназначени да показват наборите от знаци на съответните езици.

Различни кодировки за различни азбуки

Информацията за кодиране, запазена с текстовия файл, се използва от компютъра за показване на текста на екрана. Например при кодиране на кирилица (Windows) „Y“ съответства на числовата стойност 201. Когато отворите файл, съдържащ този знак, на компютър, който използва кодиране на кирилица (Windows), компютърът чете 201 и показва знак „Y“.

Въпреки това, ако същият файл се отвори на компютър, който използва различно кодиране по подразбиране, на екрана ще се покаже знак, съответстващ на числото 201 в това кодиране. Например, ако компютърът използва кодирането "Западноевропейски (Windows)", символът "Y" от оригиналния текстов файл на кирилица ще бъде показан като "É", тъй като този знак съответства на числото 201 в това кодиране.

Unicode: едно кодиране за различни азбуки

За да избегнете проблеми с кодирането и декодирането на текстови файлове, можете да ги запишете в Unicode. Това кодиране включва повечето знаци от всички езици, които обикновено се използват на съвременните компютри.

Тъй като Word е базиран на Unicode, всички файлове в него се записват автоматично в това кодиране. Unicode файловете могат да се отварят на всеки компютър с английска операционна система, независимо от езика на текста. Освен това на такъв компютър можете да записвате файлове в Unicode, съдържащи знаци, които не са в западноевропейските азбуки (например гръцки, кирилски, арабски или японски).

Избор на кодиране при отваряне на файл

Ако текстът в отворен файл е изкривен или изглежда като въпросителни знаци или квадратчета, Word може да е открил неправилно кодирането. Можете да посочите кодирането, което да се използва за показване (декодиране) на текста.

    Отворете раздела Файл.

    Избери предмет Настроики.

    Избери предмет Освен това.

    Отидете в раздел Общи поставете отметка в квадратчето Потвърдете преобразуването на файлов формат при отваряне.

    Забележка:Ако това квадратче е отметнато, Word показва диалогов прозорец Преобразуване на файловевсеки път, когато отворите файл във формат, различен от Word (тоест файл, който няма разширението DOC, DOT, DOCX, DOCM, DOTX или DOTM). Ако често работите с тези файлове, но обикновено не е необходимо да избирате кодиране, не забравяйте да деактивирате тази опция, за да не се показва този диалогов прозорец.

    Затворете и след това отворете отново файла.

    В диалоговия прозорец Преобразуване на файловеИзбери предмет Кодиран текст.

    В диалоговия прозорец Преобразуване на файловенастройте превключвателя Другои изберете желаното кодиране от списъка.

    В района на Проба

Ако по-голямата част от текста изглежда една и съща (като квадратчета или точки), възможно е на компютъра ви да не е инсталиран правилният шрифт. В този случай можете да инсталирате допълнителни шрифтове.

За да инсталирате допълнителни шрифтове, направете следното:

    Щракнете върху бутона Започнетеи изберете елемента Контролен панел.

    Направете едно от следните неща:

    На Windows 7

    1. Премахване на програма.

      Промяна.

    В Windows Vista

      В контролния панел изберете секцията Премахване на програма.

      В списъка с програми щракнете върху Microsoft Office или Microsoft Word, ако е инсталиран отделно от Microsoft Office, и след това щракнете върху Промяна.

    На Windows XP

      На контролния панел щракнете Инсталиране и премахване на програми.

      В списъка Инсталирани програмищракнете върху Microsoft Office или Microsoft Word, ако е инсталиран отделно от Microsoft Office, и след това щракнете върху Промяна.

    В група Променете вашата инсталация на Microsoft OfficeНатисни бутона Добавете или премахнете компонентии след това натиснете бутона Продължете.

    В гл Опции за инсталиранеразширете артикула Общи инструменти за офиса, и тогава - Многоезична поддръжка.

    Изберете шрифта, който искате, щракнете върху стрелката до него и след това щракнете Пусни от моя компютър.

съвет:Когато отваря текстов файл в определено кодиране, Word използва шрифтовете, дефинирани в диалоговия прозорец Опции за уеб документ... (За да изведете диалогов прозорец Опции за уеб документ, щракнете Бутон на Microsoft Officeслед това щракнете Опции за думии изберете категория Освен това... В гл ОбщНатисни бутона Опции за уеб документ.) Използване на опциите в раздела Шрифтоведиалогов прозорец Опции за уеб документможете да персонализирате шрифта за всяко кодиране.

Избор на кодиране при запис на файл

Ако не изберете кодиране при записване на файла, ще се използва Unicode. Обикновено се препоръчва Unicode, тъй като поддържа повечето знаци на повечето езици.

Ако планирате да отворите документа в програма, която не поддържа Unicode, можете да изберете желаното кодиране. Например, на английска операционна система можете да създадете китайски (традиционен) документ с помощта на Unicode. Въпреки това, ако такъв документ ще бъде отворен в програма, която поддържа китайски, но не поддържа Unicode, файлът може да бъде запазен в традиционен китайски (Big5) кодиране. В резултат на това текстът ще се показва правилно, когато отворите документа в китайска (традиционна) програма.

Забележка:Тъй като Unicode е най-изчерпателният стандарт, някои знаци може да не се показват, когато се съхранява текст в други кодировки. Например, да предположим, че документ в Unicode съдържа текст на иврит и кирилица. Ако запазите файла в кодиране на кирилица (Windows), текстът на иврит няма да се показва, а ако го запазите в кодиране на иврит (Windows), текстът на кирилица няма да се показва.

Ако изберете стандарт за кодиране, който не поддържа някои знаци във файла, Word ще ги маркира в червено. Можете да прегледате текста в избраното кодиране, преди да запишете файла.

Когато запазите файла като кодиран текст, текстът, за който е избран шрифтът Symbol, и кодовете на полетата се премахват от файла.

Избор на кодиране

    Отворете раздела Файл.

    На полето Име на файлвъведете име за новия файл.

    На полето Тип файлизбирам Обикновен текст.

    Ако се появи диалогов прозорец Microsoft Office Word - Проверка на съвместимостта, Натисни бутона Продължете.

    В диалоговия прозорец Преобразуване на файловеизберете подходящото кодиране.

    • За да използвате стандартно кодиране, изберете опцията Windows (по подразбиране).

      За да използвате MS-DOS кодиране, изберете опцията MS-DOS.

      За да зададете различно кодиране, изберете бутона за избор Другои изберете желания елемент от списъка. В района на Пробаможете да видите текста и да проверите дали се показва правилно в избраното кодиране.

      Забележка:За да увеличите площта за показване на документа, можете да преоразмерите диалоговия прозорец Преобразуване на файлове.

    Ако се появи съобщението „Текстът в червено не може да бъде запазен правилно в избраното кодиране“, можете да изберете друго кодиране или да поставите отметка в квадратчето Разрешаване на заместване на знаци.

    Ако заместването на знаци е разрешено, знаците, които не могат да бъдат показани, ще бъдат заменени с най-близкия еквивалентен знак в избраното кодиране. Например, многоточината се заменят с три точки, а ъгловите кавички се заменят с прави.

    Ако избраното кодиране няма еквивалентни знаци за знаците, подчертани в червено, те ще бъдат запазени като извън контекста (например под формата на въпросителни).

    Ако документът ще се отвори в програма, която не обвива текст от един ред в друг, можете да включите твърди прекъсвания на реда в документа. За да направите това, поставете отметка в квадратчето Вмъкване на прекъсвания на редовеи въведете желания символ за прекъсване (връщане на карета (CR), преместване на ред (LF) или и двете) в полето Крайни линии.

Намерете наличните кодировки в Word

Word разпознава няколко кодировки и поддържа кодировки, които идват със системния софтуер.

По-долу е даден списък със скриптове и свързани кодировки (кодови страници).

Система за писане

Кодировки

Използван шрифт

Многоезичен

Unicode (големи числа UCS-2, UTF-8, UTF-7)

Стандартен шрифт за "Нормалния" стил на локализираната версия на Word

арабски

Windows 1256, ASMO 708

Опростен китайски)

GB2312, GBK, EUC-CN, ISO-2022-CN, HZ

Традиционен китайски

BIG5, EUC-TW, ISO-2022-TW

кирилица

Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866

Английски, западноевропейски и други на базата на латинската азбука

Windows 1250, 1252-1254, 1257, ISO8859-x

Гръцки

японски

Shift-JIS, ISO-2022-JP (JIS), EUC-JP

корейски

Wansung, Johab, ISO-2022-KR, EUC-KR

виетнамски

Индийски: тамилски

Индийски: непалски

ISCII 57002 (деванагари)

Индийски: Конкани

ISCII 57002 (деванагари)

Индийски: хинди

ISCII 57002 (деванагари)

Индийски: асамски

Индийски: бенгалски

Индийски: гуджарати

Индийски: каннада

Индийски: малаялам

Индиец: Ория

Индийски: маратхи

ISCII 57002 (деванагари)

Индийски: пенджаби

Индийски: санскрит

ISCII 57002 (деванагари)

Индийски: телугу

    Използването на индийски езици изисква поддръжка на операционна система и подходящи шрифтове OpenType.

    Налична е само ограничена поддръжка за непалски, асамски, бенгалски, гуджарати, малаялам и ория.

Необходимостта от промяна на кодирането на текста често се сблъсква с потребителите, работещи в браузъри, текстови редактори и процесори. Въпреки това, когато работите в процесор за електронни таблици на Excel, може да възникне и такава необходимост, тъй като тази програма обработва не само числа, но и текст. Нека да видим как да променим кодирането в Excel.

Урок: Кодиране в Microsoft Word


Кодирането на текст е набор от електронни цифрови изрази, които се преобразуват в знаци, които са разбираеми за потребителя. Има много видове кодиране, всеки със свои собствени правила и език. Способността на програмата да разпознава конкретен език и да го превежда в знаци, разбираеми за обикновения човек (букви, цифри, други символи) определя дали приложението може да работи с конкретен текст или не. Сред популярните текстови кодировки трябва да се подчертае следното:

  • Windows-1251;
  • KOI-8;
  • ASCII;
  • ANSI;
  • УКС-2;
  • UTF-8 (Unicode).

Фамилното име е най-често срещаното сред кодировките в света, тъй като се счита за един вид универсален стандарт.

Най-често самата програма разпознава кодирането и автоматично превключва към него, но в някои случаи потребителят трябва да каже на приложението неговия тип. Само тогава той ще може да работи правилно с кодирани знаци.

Най-голям брой проблеми с декодирането на кодирането в Excel се срещат при опит за отваряне на CSV файлове или експортиране на txt файлове. Често, вместо обичайните букви при отваряне на тези файлове чрез Excel, можем да наблюдаваме неразбираеми знаци, така наречените "кракозябри". В тези случаи потребителят трябва да извърши определени манипулации, за да може програмата да започне да показва правилно данните. Има няколко начина за решаване на този проблем.

Метод 1: променете кодирането с Notepad ++

За съжаление, Excel няма пълноправен инструмент, който би ви позволил бързо да промените кодирането във всякакъв тип текст. Следователно, за тези цели трябва да използвате многоетапни решения или да прибягвате до помощта на приложения на трети страни. Един от най-надеждните начини е да използвате текстовия редактор Notepad ++.


Въпреки факта, че този метод се основава на използването на софтуер на трети страни, той е една от най-лесните опции за транскодиране на съдържанието на файлове за Excel.

Метод 2: използване на текстовия съветник

Освен това преобразуването може да се извърши с помощта на вградените инструменти на програмата, а именно Text Wizard. Колкото и да е странно, използването на този инструмент е малко по-сложно от използването на програма на трета страна, описана в предишния метод.

Метод 3: запишете файла в определено кодиране

Има и обратната ситуация, когато файлът не трябва да се отваря с коректно показване на данни, а да се записва в посоченото кодиране. В Excel можете да изпълните и тази задача.


Документът ще бъде записан на вашия твърд диск или сменяем носител в кодирането, което сте дефинирали сами. Но имайте предвид, че сега документите, записани в Excel, винаги ще се записват в това кодиране. За да промените това, ще трябва да преминете през прозореца отново. "Опции за уеб документ"и променете настройките.

Има и друг начин да промените настройките за кодиране на запазения текст.

Всъщност въпросът не е толкова тривиален, колкото може да изглежда на пръв поглед. Форматът CSV, както подсказва името му, използва знака запетая (,) като разделител. Въпреки това, много програми и услуги позволяват използването на други символи. Те включват MS Excel, особено когато става въпрос за неговата русифицирана версия. В тази статия искам да предложа решение на проблема с отварянето на CSV файла за експортиране на Google Webmaster Tool в MS Excel. Темата обаче е актуална и за други варианти.

  • Проблемът с експортирането на заявки за търсене (PZ) от уеб администратора на Google
    • Проблем с кодирането
    • Разделител на запетая в CSV
    • Какво помогна
  • Нека обобщим

Проблемът с експортирането на PP от уеб администратора на Google

Много от нас използват Инструмент за уеб администратори на Googleсамо за добавяне на сайт. Това е погрешно, тук има много полезна информация, например списък със заявки за търсене, чрез които потребителите намират и влизат в сайта. Вижте репортажа: Търсене Трафик> Думи за търсене- след като изберете желания сайт в списъка.

Тук можете също да експортирате данни във формат CSV, с възможност да ги отворите в Google Таблици. (онлайн аналог на Excel)... Потърсете бутона " Изтеглете тази таблица". Между другото, броят на показаните заявки на страница не влияе върху пълнотата на експортираните данни.

Проблемът е, че CSV файлът използва разделител запетая и UTF-8 кодиране. Така че дори в Google Sheets, вместо на кирилица, получавате само набор от въпроси.

С други думи, трябва да променим кодирането на ANSI. И за да отворите CSV файл в Excel, заменете разделителя запетая (,) с точка и запетая (;).

CSV, разделен със запетая в UTF-8

Проблем с кодирането

Най-лесният начин за решаване проблем с кодирането... За да направите това, можете да използвате всеки текстов редактор с тази функция, като Notepad ++. Можете да го изтеглите безплатно на официалния сайт: unotepad-plus-plus.org... След това стартирайте редактора и отворете нашия CSV файл в него, след което щракнете върху елемента от менюто „ Кодировки„И го сменете с желаното, т.е параграф " Преобразуване в ANSI».

Картината показва обратния процес: преобразуване от ANSI в UTF-8 - но мисля, че вие ​​сами сте го забелязали, но принципът е същият.

Разделител на запетая в CSV

Сега, що се отнася до разделител запетая... По принцип не е нужно да променяте нищо за Google Таблици. И в англоезичната версия на MS Excel може да работи, проверете го. Въпреки това, ако имате нужда от подмяна, тогава трябва да имате предвид, че простото замяна на запетая (,) с точка и запетая (;) няма да работи, т.к. файлът може да съдържа стойности, съдържащи този символ. Обикновено те са затворени в кавички. Например:

стойност, 1, "стойност, точка и запетая",

На теория, настройката на самата операционна система Windows би трябвало да помогне тук: Старт> Контролен панел> Регионални и езикови опции... В раздела „Формати“ щракнете върху „ Променете този формат...„В прозореца, който се отваря, в раздела „Числа“, заменете“ Разделител на списъчни елементи„На желаното, т.е. символът точка и запетая (;) се заменя със запетая (,).

Вярно, не ми се получи. А смяната на настройките на операционната система, както за мен, не е добро нещо. Въпреки това реших да посоча това решение на проблема, т.к повечето специализирани форуми препращат към него.

Какво помогна

Уви, не открих никаква допълнителна обработка на файлове с разширението .csv в MS Excel. Въпреки това има възможност за обработка, но само ако промените разширението на файла, например на .txt. Така че променяме разширението на файла и го отваряме в Excel.

Появява се прозорецът "Помощник за текст (импорт)". Тук можете да изберете формата на изходните данни, началния ред на импортирането и кодирането на файла. (трябва ни 1251: кирилица)... Между другото, защо трябваше да промените кодирането, когато можете да го изберете в съветника? Защото UTF-8 кодиране, поне за мен, го няма. Щракнете върху бутона " По-нататък».

На следващата стъпка можем да изберем разделителен знак и няколко. Поставете отметка в квадратчето „ запетая"И премахнете отметката от" раздел". Тук можете също да изберете символа за прекратяване на реда. Това е този, който се използва за стойности, които съдържат специални знаци. (двойни кавички, запетая, точка и запетая, нов ред и т.н.)... Опцията за двойни кавички в моя случай е това, от което се нуждаете. Обърнете внимание на полето "Разбор на примерни данни", данните се превърнаха в таблица. Щракнете върху бутона " По-нататък».

На последната стъпка можете да посочите формата на данните в колоната, въпреки че изборът тук не е голям: общ (по подразбиране), текст, дата и пропускане на колона. Последният вариант ми се струва най-интересен, т.к ви позволява незабавно да изключите ненужните колони. Просто изберете подходящата колона и щракнете върху опцията за нея “ пропускане на колона". Щракнете върху бутона " Готов».

Excel ще формира таблицата, от която се нуждаем, където можем да зададем желаната ширина на колоната и формат на клетката, но това е съвсем различна история. Само ще отбележа, че има проблем с разпознаването на едни и същи проценти.

Онлайн услуга за нормализиране на CSV файлове

Всички горепосочени проблеми обаче се решават от обикновена онлайн услуга за нормализиране CSV. Позволява ви да промените кодирането и разделителния знак. Вярно е, че има ограничение в 64 000 байтове (колко е в KB?)за файл за изтегляне, но CSV файловете обикновено не тежат много, би трябвало да са достатъчни. Резултатът от обработката се извежда като обикновен текстов файл, може да бъде записан с разширението .csv.

Между другото, скриптът преобразува процентната стойност, например: 95% - в желаната стойност за колоната "процент" в Excel, т.е. се дели на 100 и получаваме число с плаваща запетая, например: 0,95. Ако имате нужда от още трансформации: пишете, ние ще се опитаме да го променим.

Е, ако предлаганата онлайн услуга не ви устройва, винаги можете да използвате горните инструкции.

Нека обобщим

Някои онлайн услуги предоставят възможност за експортиране на данни в прост и удобен CSV формат. Както подсказва името, това предполага разделител запетая (,). Въпреки това, много приложения интерпретират този формат донякъде произволно, което води до естествени проблеми. Освен това UTF-8 става все по-популярен сега, докато Excel или Google Sheets използват ANSI.

Например Notepad ++ ще ви помогне да решите проблема с кодирането и за да се справите с разделителя, е достатъчно да промените разширението на файла на .txt и да използвате съветника за текст в Excel. Всички тези задачи обаче могат да бъдат решени от безплатна онлайн услуга. CSV за нормализиране, въпреки че си струва да се има предвид неговото ограничение за размера на качения файл. Това е всичко за мен. Благодаря за вниманието. Късмет!

в 19:44ч Промяна на съобщението 16 коментара

Имам файл на Excel, който има някои испански символи (Tildes и т.н.), които трябва да конвертирам в CSV файл за използване като файл за импортиране. Въпреки това, когато запазя като CSV, той разваля "специалните" испански знаци, които не са ASCII знаци. Това също изглежда се случва с леви и десни кавички и тирета, които изглежда идват от първоначалния потребител, създаващ файла на Excel на Mac.

тъй като CSV е само текстов файл, сигурен съм, че може да се справи с UTF8 кодиране, така че предполагам, че това е ограничение на Excel, но търся начин да стигна от Excel до CSV и да запазя не-ASCII знаци.

30 отговора

Забележка: Внимавайте с чувствителни данни от Google Таблици.

след като запазите в CSV под Excel, в командния ред задайте:

Iconv -f cp1250 -t utf-8 file-encoded-cp1250.csv> file-encoded-utf8.csv

(Не забравяйте да замените cp1250 с вашето кодиране).

работи бързо и е чудесно за големи файлове като база данни с пощенски кодове, които не могат да бъдат импортирани в GoogleDocs (ограничение от 400 000 клетки).

като приемем Windows среда, запазете и работете с файла както обикновено в Excel, но след това отворете запазения файл на Excel в Gnome Gnumeric (безплатно). Запазете електронната таблица Gnome Gnumeric като CSV, което - за мен така или иначе - я записва като UTF-8 CSV.

лесен начин да го направите: изтеглете open office (), изтеглете електронна таблица и отворете файл на excel (.xls или .xlsx). След това просто го запазете като текстов CSV файл и ще се отвори прозорец с молба да запишете текущия формат или да запазите като формат ODF. изберете "Save Current Format" и в новия прозорец изберете опцията, която работи най-добре за вас според езика, на който е написан вашият файл. За испански изберете Западна Европа (Windows-1252 / WinLatin 1) и файлът работи само добре. Ако изберете Unicode (UTF-8), той няма да работи с испански знаци.

И аз се сблъсках със същия проблем, но има просто решение за това.

  1. отворете файла xlsx в Excel 2016 или по-нова версия.
  2. В „Запазване като“ изберете тази опция: „(CSV UTF-8 (разделен със запетая) *. Csv)“

Работи добре и се генерира csv файл, който може да бъде импортиран във всеки софтуер. Импортирах този csv файл в моята SQLITE база данни и той работи добре с всички символи на Unicode.

Написах малък скрипт на Python, който може да експортира листове в UTF-8.

просто трябва да предоставите файла на Excel като първи параметър и след това листовете, които искате да експортирате. Ако не са предоставени листове, скриптът експортира всички листове във файла на Excel.

#! / usr / bin / env python # експортиране на листове с данни от xlsx към csv от openpyxl импорт load_workbook импортиране на csv от os import sys презареждане (sys) sys.setdefaultencoding ("utf-8") def get_all_sheets (excel_file): листове = работна книга = load_workbook (excel_file, use_iterators = True, data_only = True) all_worksheets = workbook.get_sheet_names () за worksheet_name във all_worksheets: sheets.append (worksheet_name) return sheets def csv_from_excel (excel_file, sheets_workbook): workbook_sheet_sheet_workbook (excel_sheet_work): работна книга excel_file, sheets): workbook = load_workbook (excel_file, sheets): workbook = load_workbook (excel_file_name) , data_only = True) за worksheet_name в листове: print („Export“ + worksheet_name + „...“) опитайте: worksheet = workbook. get_sheet_by_name (worksheet_name) с изключение на KeyError: print ("Не може да се намери" + име на работен лист) sys.exit (1) your_csv_file = open ("". Join (), "wb") wr = csv.writer (вашият_csv_file, цитиране = csv. QUOTE_ALL) за ред в worksheet.iter_rows (): lrow = за клетка в ред: lrow. добавете (cell.value) wr.writerow (lrow) print ("... done") your_csv_file.close () ако не е 2<= len(sys.argv) <= 3: print("Call with " + sys.argv + " ") sys.exit (1) else: листове = ако len (sys.argv) == 3: листове = списък (sys.argv.split (", ")) else: листове = get_all_sheets (sys.argv) assert ( листове! = Няма и len (листове)> 0) csv_from_excel (sys.argv, листове)