utf-8- все статьи тега ➜ страница 2
В чем разница между Unicode и UTF-8? [дубликат]
этот вопрос уже есть ответ здесь: в чем разница между UTF-8 и Unicode 13 ответов считаем: Это правда, что unicode=utf16? многие говорят, что Unicode-это стандарт, а не кодировка, но большинство редакторов поддерживают сохранение как Unicode кодирование на самом деле. ...
Закодировать строку в UTF-8
У меня есть строка с "-" характер и у меня есть некоторые проблемы с ним. Мне нужно закодировать эту строку в кодировку UTF-8. Я пробовал это таким образом, но это не работает: byte ptext[] = myString.getBytes(); String value = new String(ptext, "UTF-8"); Как мне закодировать эту строку в utf-8? ...
Почему бы нам не использовать sys.setdefaultencoding ("utf-8") в скрипте py?
Я видел несколько скриптов py, которые используют это в верхней части скрипта. В каких случаях следует использовать? import sys reload(sys) sys.setdefaultencoding("utf-8") ...
Ошибка MySQL "неверное строковое значение" при сохранении строки unicode в Django
я получил странное сообщение об ошибке при попытке сохранить first_name, last_name для модели auth_user Django. неудачные примеры user = User.object.create_user(username, email, password) user.first_name = u'Rytis' user.last_name = u'Slatkevičius' user.save() >>> Incorrect string value: 'xC4x8Dius' for column 'last_name' at row 104 user.first_name = u'Валерий' user.last_name = u'Богданов' user.save() >>> Incorrect string value: 'xD0x92xD0xB0xD0xBB...' for column 'fir ...
PHP: преобразуйте любую строку в UTF-8, не зная исходного набора символов, или хотя бы попробуйте
у меня есть приложение, которое работает с клиентами со всего мира, и, естественно, я хочу, чтобы все, что входит в мои базы данных, было закодировано UTF-8. основная проблема для меня заключается в том, что я не знаю, какая кодировка источника любой строки будет - это может быть из текстового поля (используя <form accept-charset="utf-8"> полезно только в том случае, если пользователь действительно отправил форму), или это может быть из загруженного текстового файла, поэтому у меня дейст ...
Символы юникода в URL-адресах
в 2010 году вы бы обслуживали URL-адреса, содержащие символы UTF-8, на большом веб-портале? символы Юникода запрещены в соответствии с RFC на URL-адресах (см. здесь). Они должны быть закодированы в процентах, чтобы соответствовать стандартам. мой основной момент, однако, служит некодированным символам с единственной целью иметь красивые URL-адреса, поэтому процентное кодирование отсутствует. все основные браузеры, похоже, разбирают эти URL-адреса в порядке, независимо от того, что говорит RF ...
Прогноз autocleaning мои разрывы строк и испортил мой электронный формат
Я отправляю электронное письмо с помощью платформы dotnet. Вот шаблон, который я использую для создания сообщения: Date of Hire: %HireDate% Annual Salary: %AnnualIncome% Reason for Request: %ReasonForRequest% Name of Voluntary Employee: %FirstName% %LastName% Total Coverage Applied For: %EECoverageAmount% Guaranteed Coverage Portion: %GICoveragePortion% Amount Subject to Medical Evident: %GIOverage% когда сообщения получены в outlook, outlook говорит мне "дополнительные разрывы строк в этом ...
Элегантный способ поиска файлов UTF-8 с помощью BOM?
для целей отладки мне нужно рекурсивно искать каталог для всех файлов, которые начинаются с метки порядка байтов UTF-8 (BOM). Мое текущее решение-это простой скрипт: find -type f | while read file do if [ "`head -c 3 -- "$file"`" == $'xefxbbxbf' ] then echo "found BOM in: $file" fi done или, если вы предпочитаете короткие, читается острот: find -type f|while read file;do [ "`head -c3 -- "$file"`" == $'xefxbbxbf' ] && echo "found BOM in: $file";done Он не раб ...
Чтение файла CSV UTF8 с помощью Python
Я пытаюсь прочитать CSV-файл с акцентированными символами с Python (только французские и/или испанские символы). На основе документации Python 2.5 для csvreader (http://docs.python.org/library/csv.html), я придумал следующий код для чтения CSV-файла, так как csvreader поддерживает только ASCII. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py doesn't do Unicode; encode temporarily as UTF-8: csv_reader = csv.reader(utf_8_encoder(unicode_csv_data), ...
UnicodeDecodeError: кодек 'ascii' не может декодировать байт 0xd1 в позиции 2: порядковый номер не в диапазоне (128)
Я пытаюсь работать с очень большим набором данных, который имеет некоторые нестандартные символы в нем. Мне нужно использовать unicode, согласно спецификациям работы, но я озадачен. (И вполне возможно, что делает все это неправильно.) Я открываю CSV с помощью: 15 ncesReader = csv.reader(open('geocoded_output.csv', 'rb'), delimiter='t', quotechar='"') затем я пытаюсь закодировать его с помощью: name=school_name.encode('utf-8'), street=row[9].encode('utf-8'), city=row[10].encode('utf-8' ...
Использование использовать utf8;' дает мне 'широкий характер в печати
если я запускаю следующую программу Perl: perl -e 'use utf8; print "鸡n";' Я получаю это предупреждение: Wide character in print at -e line 1. если я запускаю эту программу Perl: perl -e 'print "鸡n";' Я не получаю предупреждение. Я думал use utf8 требуется использовать символы UTF-8 в скрипте Perl. Почему это не работает и как я могу это исправить? Я использую Perl 5.16.2. У меня такая же проблема, если это в файле, а не один лайнер в командной строке. ...
Установить кодировку файла в UTF8 с BOM в Sublime Text 3
когда я открываю файл в Sublime Text 3, внизу у меня есть возможность установить кодировку символов, как показано на скриншоте. есть возможность установить его в UTF-8, что после проведения некоторых исследований означает UTF-8 без спецификации, но я хочу установить его в UTF-8 С BOM как показано ниже: Как я могу сделать это из ST3? Любая помощь будет очень большой оцененный. спасибо ...
Java-преобразование строки в допустимый объект URI
Я пытаюсь получить java.net.URI объект String. Строка содержит некоторые символы, которые должны быть заменены их процентными escape-последовательностями. Но когда я использую URLEncoder для кодирования строки с кодировкой UTF-8, даже / заменяются их escape-последовательностями. Как я могу получить допустимый закодированный URL-адрес из строкового объекта? http://www.google.com?q=a b дает http%3A%2F%2www.google.com... тогда как Я хочу, чтобы выход был http://www.google.com?q=a%20b может кто-т ...
Кодирование FPDF utf-8 (HOW-TO)
кто-нибудь знает, как установить кодировку в пакете FPDF в utf-8? Или, по крайней мере, ISO-8859-7 (греческий), которые поддерживают греческие символы? в основном я хочу создать pdf-файл, содержащий греческие символы. любые предложения помочь. Джордж ...
u 'ufeff ' в строке Python
Я получаю сообщение об ошибке со следующей скороговоркой: UnicodeEncodeError: 'ascii' codec can't encode character u'ufeff' in position 155: ordinal not in range(128) не уверен, что u'ufeff' это, он появляется, когда я веб-скребок. Как я могу исправить ситуацию? Элемент .replace() строковый метод не работает на нем. ...
Сколько символов можно хранить в 4KB?
сколько символов я могу хранить в 4kb, когда символы находятся в кодировке utf-8 ? ...
Как заменить акцентированные латинские символы в Ruby?
у меня есть ActiveRecord модель Foo, которая имеет ...
Списки в латексе с UTF-8 (или, по крайней мере, немецкие умлауты)
пытаясь включить исходный файл в мой документ latex с помощью пакета listings, у меня возникли проблемы с немецкими umlauts внутри комментариев в коде. Используя lstset{ extendedchars=true, inputencoding=utf8x } Umlauts в исходных файлах (закодированных в UTF-8 без спецификации) обрабатываются, но они каким-то образом перемещаются в начало слова, в котором они содержатся. Так что // die Größe muss berücksichtigt werden во входном исходном файле становится // die ößGre muss übercksichtig ...
Сколько символов может кодировать UTF-8?
Если UTF-8 имеет 8 бит, не означает ли это, что может быть только максимум 256 различных символов? первые 128 кодовых точек такие же, как в ASCII. Но он говорит, что UTF-8 может поддерживать до миллиона знаков? Как это работает? ...
Как конвертировать между ISO-8859-1 и UTF-8 в Java?
кто-нибудь знает, как преобразовать строку из ISO-8859-1 в UTF-8 и обратно в Java? Я получаю строку из интернета и сохраняю ее в RMS (J2ME), но я хочу сохранить специальные символы и получить строку из RMS, но с кодировкой ISO-8859-1. Как мне это сделать? ...