unicode- все статьи тега ➜ страница 4

Как заменить акцентированные латинские символы в Ruby?

у меня есть ActiveRecord модель Foo, которая имеет ...

806

24 июля 2019 г.

UnicodeEncodeError: кодек 'latin-1' не может кодировать символ

что может быть причиной этой ошибки, когда я пытаюсь вставить чужой персонаж в базу данных? >>UnicodeEncodeError: 'latin-1' codec can't encode character u'u201c' in position 0: ordinal not in range(256) и как мне его решить? спасибо! ...

754

24 июля 2019 г.

mysql python unicode

Когда мы должны использовать NVARCHAR / NCHAR вместо VARCHAR / CHAR в SQL Server?

есть ли правило, когда мы должны использовать типы Unicode? Я видел, что большинство европейских языков (немецкий, итальянский, английский, ...) отлично в той же базе данных в Столбцах VARCHAR. Я ищу что-то вроде: если у вас есть китайский -- > используйте NVARCHAR если у вас есть немецкий и арабский -- > используйте NVARCHAR Как насчет сортировки сервера / базы данных? Я не хочу используйте всегда NVARCHAR, как предложено здесь Каковы основные различия в производительности между ...

979

24 июля 2019 г.

sql-server unicode collation

Почему 'U+' используется для обозначения кодовой точки Юникода?

Почему кодовые точки Юникода отображаются как U+<codepoint>? например, U+2202 обозначает символ ∂. Почему бы и нет U- (тире или дефис) или что-нибудь еще? ...

896

24 июля 2019 г.

unicode

Список всех открытых / закрытых скобок Юникода?

что такое список всех скобочных символов Юникода (включая, например:{}[]()<>)? Что такое хороший способ поиска символов Юникода? ...

623

24 июля 2019 г.

unicode square-bracket braces parentheses curly-brackets

Исправление сломанной кодировки UTF8

Я нахожусь в процессе исправления некоторых плохих кодировок UTF8. В настоящее время я использую PHP 5 и MySQL в моей базе данных у меня есть несколько экземпляров плохих кодировок, которые печатают как: ÃƒÂ® параметры сортировки базы данных utf8_general_ci PHP использует правильный заголовок UTF8 Notepad++ настроен на использование UTF8 без BOM управление базами данных осуществляется в phpMyAdmin не все случаи акцентированных символов являются сломанный Что мне нужно, так это какая-то функц ...

912

24 июля 2019 г.

PHP mysql utf-8 unicode

Как подсчитать символы в строке юникода в C

допустим у меня есть строка: char theString[] = "你们好āa"; учитывая, что моя кодировка utf-8, эта строка имеет длину 12 байт (три символа hanzi-три байта каждый, латинский символ с Макроном-два байта, а " a " - один байт: strlen(theString) == 12 как я могу подсчитать количество символов? Как я могу сделать эквивалент подписки, чтобы: theString[3] == "好" как я могу нарезать, и кошка такие строки? ...

905

24 июля 2019 г.

c string ascii unicode

Что мне нужно знать о Unicode?

будучи разработчиком приложений, мне нужно знать Unicode? ...

484

24 июля 2019 г.

internationalization unicode

Java regex для поддержки Unicode?

чтобы сопоставить A с Z, мы будем использовать регулярное выражение: [A-Za-z] Как разрешить регулярное выражение для соответствия utf8 символов, введенных пользователем? Например, китайские слова, такие как 环保部 ...

638

24 июля 2019 г.

java regex unicode cjk

Как сравнить строку Юникода, которая имеет разные байты, но одно и то же значение?

я сравниваю строки Юникода между объектами JSON. Они имеют одинаковое значение: a = '人口じんこうに膾炙かいしゃする' b = '人口じんこうに膾炙かいしゃする' но у них разные представления Юникода: String a : u'u4ebau53e3u3058u3093u3053u3046u306bu81beu7099u304bu3044u3057u3083u3059u308b' String b : u'u4ebau53e3u3058u3093u3053u3046u306bu81beuf9fbu304bu3044u3057u3083u3059u308b' Как я могу сравнить между двумя строками Юникода по их значению? ...

646

24 июля 2019 г.

python unicode

Должен ли я использовать акцентированные символы в URL-адресах?

при создании веб-контента на языках, отличных от английского, возникает проблема поиска оптимизированных и удобных для пользователя URL-адресов. Мне интересно, является ли лучшей практикой использовать де-акцентированные Буквы в URL-адресах-рискуя, что некоторые слова имеют совершенно разные значения с определенными акцентами и без них-или лучше придерживаться использования неанглийских символов, где это уместно, жертвуя читаемостью этих URL-адресов в менее продвинутых средах (например, MSIE, v ...

694

24 июля 2019 г.

internationalization unicode diacritics friendly-url