diacritics- все статьи тега


Печать символов с ударением в Python 2.7

Я новичок в python. Я пытаюсь печатать символы с ударением, например: # -*- coding: utf-8 -*- print 'éàÇÃãéèï' Но когда я выполняю этот код, я получаю: >> ├®├á├ç├â├ú├®├¿├» Я использую 64-битную Windows 7 и Python 2.7.5, у меня есть код в file.py и выполняю его с python file.py ...

Что является лучшим способом, чтобы удалить акценты в строку Python Юникод?

У меня есть строка Unicode в Python, и я хотел бы удалить все акценты (диакритические знаки). Я нашел в Интернете элегантный способ сделать это в Java: преобразуйте строку Юникода в ее длинную нормализованную форму (с отдельным символом для букв и диакритических знаков) удалите все символы, тип Юникода которых является "диакритическим". Мне нужно установить библиотеку, такую как pyICU, или это возможно только с помощью python стандартная библиотека? А как насчет python 3? важное примечание ...

Как удалить диакритические знаки (акценты) из строки in.NET?

Я пытаюсь преобразовать некоторые строки, которые находятся на французском канадском языке и в основном, я хотел бы иметь возможность вынуть французские акцентные знаки в буквах, сохраняя письмо. (Например, преобразовать é до e, Так что crème brûlée станет creme brulee) каков наилучший метод для достижения этой цели? ...

Списки в латексе с UTF-8 (или, по крайней мере, немецкие умлауты)

пытаясь включить исходный файл в мой документ latex с помощью пакета listings, у меня возникли проблемы с немецкими umlauts внутри комментариев в коде. Используя lstset{ extendedchars=true, inputencoding=utf8x } Umlauts в исходных файлах (закодированных в UTF-8 без спецификации) обрабатываются, но они каким-то образом перемещаются в начало слова, в котором они содержатся. Так что // die Größe muss berücksichtigt werden во входном исходном файле становится // die ößGre muss übercksichtig ...

Должен ли я использовать акцентированные символы в URL-адресах?

при создании веб-контента на языках, отличных от английского, возникает проблема поиска оптимизированных и удобных для пользователя URL-адресов. Мне интересно, является ли лучшей практикой использовать де-акцентированные Буквы в URL-адресах-рискуя, что некоторые слова имеют совершенно разные значения с определенными акцентами и без них-или лучше придерживаться использования неанглийских символов, где это уместно, жертвуя читаемостью этих URL-адресов в менее продвинутых средах (например, MSIE, v ...