Articles of unicode

конвертировать unicode в html сущности hex

Как преобразовать строку Unicode в объекты HTML? ( HEX не десятичный) Например, Français Français на Français .

php iconv translit для удаления акцентов: не работает как исключено?

рассмотрите этот простой код: echo iconv('UTF-8', 'ASCII//TRANSLIT', 'è'); он печатает `e а не просто e Знаете ли вы, что я делаю неправильно? после добавления setlocale ничего не изменилось setlocale(LC_COLLATE, 'en_US.utf8'); echo iconv('UTF-8', 'ASCII//TRANSLIT', 'è');

Как получить номер кодовой точки для заданного символа в строке utf-8?

Я хочу получить коды UCS-2 для данной строки UTF-8. Например, слово «привет» должно стать чем-то вроде «0068 0065 006C 006C 006F». Обратите внимание, что символы могут быть с любого языка, включая сложные скрипты, такие как восточно-азиатские языки. Таким образом, проблема сводится к «преобразованию заданного символа в его кодовую точку UCS-2», Но как? Пожалуйста, любая помощь […]

regexp с русским языком

Я не могу решить проблему с регулярным выражением. Хорошо, когда я печатаю: $string = preg_replace("#\[name=([a-zA-Z0-9 .-]+)*]#","$name_start $1 $name_end",$string); все в порядке, кроме ситуации с русским языком. поэтому, я пытаюсь переписать этот reg-exp: $string = preg_replace("#\[name=([a-zA-Z0-9**а-яА-Я** .-]+)*]#","$name_start $1 $name_end",$string); но это не работает, я знаю какую-то идею, просто напишу: $string = preg_replace("#\[name=([a-zA-Z0-9йцукенгшщзхъфывапролджэячсмитьбю .-]+)*]#","$name_start $1 $name_end",$string); но […]

Как вы печатаете необработанные символы UTF-8 из их номеров?

Скажем, я хотел напечатать ÿ (латинский маленький y с диарезисом) из его номера Unicode / UTF-8 U+00FF или hex c3 bf . Как я могу это сделать в PHP? Причина в том, что мне нужно иметь возможность создавать определенные символы UTF-8 для тестирования в моих регулярных выражениях и строковых функциях. Однако, поскольку у меня на […]

Unicode в MySQL Regex?

У меня есть следующая задача: Создайте личный словарь для китайских персонажей. Пользователи выбирают одиночных китайских символов из списка. Затем программное обеспечение просматривает список комбинаций символов и фильтрует все, содержащие символы, которые не входят в список пользователей из отдельных символов. Поэтому, если пользователь изучил 1 (一) и 10 (十), тогда следует показать 11 (十一), но не […]

PHP: конвертировать кодировку unicode в UTF-8

У меня есть данные в этом формате: U+597D или как этот U+6211 . Я хочу преобразовать их в UTF-8 (исходные символы – 好 и 我). Как мне это сделать?

Обрезать пробелы unicode в PHP 5.2

Как я могу обрезать string(6) " page" , где первое пробельное пространство является неразрывным пробелом 0xc2a0? Я пробовал trim() и preg_match('/^\s*(.*)\s*$/u', $key, $m); , Другой вопрос: как я могу достоверно копировать эти персонажи? Они, похоже, преобразуются в «нормальные» пространства, что затрудняет отладку.

Проверьте язык строки на основе глифов в PHP

У меня есть база данных MySQL с названиями книг на английском и арабском языках, и я использую класс PHP, который может автоматически транслитерировать арабский текст в латинский. Я бы хотел, чтобы мой выходной HTML выглядел примерно так: <h3>A book</h3> <h3>كتاب <em>(kitaab)</em></h3> <h3>Another book</h3> Есть ли способ PHP определить язык строки на основе символов Unicode и […]

Преобразование Unicode из строки JSON с помощью PHP

Я читал несколько решений, но пока ничего не смог заставить работать. У меня есть строка JSON, которую я читаю из вызова API, и она содержит символы Unicode – например, символ \u00c2\u00a3 . Я бы хотел использовать PHP, чтобы преобразовать их в £ или &pound; , Я изучаю проблему и нашел следующий код (используя мой фунт-символ […]