unicode- все статьи тега ➜ страница 4
Как заменить акцентированные латинские символы в Ruby?
у меня есть ActiveRecord модель Foo, которая имеет ...
UnicodeEncodeError: кодек 'latin-1' не может кодировать символ
что может быть причиной этой ошибки, когда я пытаюсь вставить чужой персонаж в базу данных? >>UnicodeEncodeError: 'latin-1' codec can't encode character u'u201c' in position 0: ordinal not in range(256) и как мне его решить? спасибо! ...
Когда мы должны использовать NVARCHAR / NCHAR вместо VARCHAR / CHAR в SQL Server?
есть ли правило, когда мы должны использовать типы Unicode? Я видел, что большинство европейских языков (немецкий, итальянский, английский, ...) отлично в той же базе данных в Столбцах VARCHAR. Я ищу что-то вроде: если у вас есть китайский -- > используйте NVARCHAR если у вас есть немецкий и арабский -- > используйте NVARCHAR Как насчет сортировки сервера / базы данных? Я не хочу используйте всегда NVARCHAR, как предложено здесь Каковы основные различия в производительности между ...
Почему 'U+' используется для обозначения кодовой точки Юникода?
Почему кодовые точки Юникода отображаются как U+<codepoint>? например, U+2202 обозначает символ ∂. Почему бы и нет U- (тире или дефис) или что-нибудь еще? ...
Список всех открытых / закрытых скобок Юникода?
что такое список всех скобочных символов Юникода (включая, например:{}[]()<>)? Что такое хороший способ поиска символов Юникода? ...
Исправление сломанной кодировки UTF8
Я нахожусь в процессе исправления некоторых плохих кодировок UTF8. В настоящее время я использую PHP 5 и MySQL в моей базе данных у меня есть несколько экземпляров плохих кодировок, которые печатают как: î параметры сортировки базы данных utf8_general_ci PHP использует правильный заголовок UTF8 Notepad++ настроен на использование UTF8 без BOM управление базами данных осуществляется в phpMyAdmin не все случаи акцентированных символов являются сломанный Что мне нужно, так это какая-то функц ...
Как подсчитать символы в строке юникода в C
допустим у меня есть строка: char theString[] = "你们好āa"; учитывая, что моя кодировка utf-8, эта строка имеет длину 12 байт (три символа hanzi-три байта каждый, латинский символ с Макроном-два байта, а " a " - один байт: strlen(theString) == 12 как я могу подсчитать количество символов? Как я могу сделать эквивалент подписки, чтобы: theString[3] == "好" как я могу нарезать, и кошка такие строки? ...
Что мне нужно знать о Unicode?
будучи разработчиком приложений, мне нужно знать Unicode? ...
Java regex для поддержки Unicode?
чтобы сопоставить A с Z, мы будем использовать регулярное выражение: [A-Za-z] Как разрешить регулярное выражение для соответствия utf8 символов, введенных пользователем? Например, китайские слова, такие как 环保部 ...
Как сравнить строку Юникода, которая имеет разные байты, но одно и то же значение?
я сравниваю строки Юникода между объектами JSON. Они имеют одинаковое значение: a = '人口じんこうに膾炙かいしゃする' b = '人口じんこうに膾炙かいしゃする' но у них разные представления Юникода: String a : u'u4ebau53e3u3058u3093u3053u3046u306bu81beu7099u304bu3044u3057u3083u3059u308b' String b : u'u4ebau53e3u3058u3093u3053u3046u306bu81beuf9fbu304bu3044u3057u3083u3059u308b' Как я могу сравнить между двумя строками Юникода по их значению? ...
Должен ли я использовать акцентированные символы в URL-адресах?
при создании веб-контента на языках, отличных от английского, возникает проблема поиска оптимизированных и удобных для пользователя URL-адресов. Мне интересно, является ли лучшей практикой использовать де-акцентированные Буквы в URL-адресах-рискуя, что некоторые слова имеют совершенно разные значения с определенными акцентами и без них-или лучше придерживаться использования неанглийских символов, где это уместно, жертвуя читаемостью этих URL-адресов в менее продвинутых средах (например, MSIE, v ...