utf- все статьи тега


Какая кодировка правильно открывает CSV-файлы в Excel как на Mac, так и на Windows?

У нас есть веб-приложение, которое экспортирует CSV-файлы, содержащие иностранные символы с UTF-8, без BOM. Пользователей Windows и Mac сделать символы в Excel. Я попробовал конвертировать в UTF-8 с помощью BOM; Excel / Win-это нормально, Excel/Mac показывает тарабарщину. Я использую Excel 2003 / Win, Excel 2011 / Mac. Вот все кодировки, которые я пробовал: Encoding BOM Win Mac -------- --- ---------------------------- ------------ utf-8 -- sc ...

Как конвертировать 'u00e9' в символ utf8, в mysql или php?

Я делаю некоторую очистку данных на некоторых грязных данных, которые импортируются в mysql. Данные содержат "псевдо" символы юникода, которые фактически встроены в строки как "u00e9" и т. д. Таким образом, одно поле может быть.. 'Jalostotitlu00e1n' Мне нужно вырвать эту неуклюжую 'u00e1n' и заменить ее соответствующим символом utf Я могу сделать это в любом mysql, используя substring и CHR, возможно, но я предварительно обрабатываю данные через PHP, поэтому я мог бы сделать это там тоже. Я ...

Python psycopg2 не в utf-8

Я использую Python для подключения к моей базе данных postgresql следующим образом: conn=psycopg2.connect(database="fedour", user="fedpur", password="***", host="127.0.0.1", port="5432") Для этого нет проблем. Но когда я делаю запрос и хочу напечатать курсор, у меня получается примерно следующее: "Franxc3xa7ois "вместо " François", и это вызывает проблемы, когда я хочу создать XML-документ с этим. Я думаю, что это произошло из-за моей кодировки, но я нашел какое-то решение. Я пытаюсь ...

В чем смысл UTF-16?

Я никогда не понимал смысл кодировки UTF-16. Если вам нужно иметь возможность обрабатывать строки как произвольный доступ (т. е. кодовая точка совпадает с кодовой единицей), вам нужен UTF-32, поскольку UTF-16 по-прежнему является переменной длиной. Если вам это не нужно, то UTF-16 кажется колоссальной тратой пространства по сравнению с UTF-8. Каковы преимущества UTF-16 перед UTF-8 и UTF-32 и почему Windows и Java используют его в качестве своей собственной кодировки? ...