Articles of unicode

Обрезать пробелы unicode в PHP 5.2

Как я могу обрезать string(6) " page" , где первое пробельное пространство является неразрывным пробелом 0xc2a0? Я пробовал trim() и preg_match('/^\s*(.*)\s*$/u', $key, $m); , Другой вопрос: как я могу достоверно копировать эти персонажи? Они, похоже, преобразуются в «нормальные» пространства, что затрудняет отладку.

Проверьте язык строки на основе глифов в PHP

У меня есть база данных MySQL с названиями книг на английском и арабском языках, и я использую класс PHP, который может автоматически транслитерировать арабский текст в латинский. Я бы хотел, чтобы мой выходной HTML выглядел примерно так: <h3>A book</h3> <h3>كتاب <em>(kitaab)</em></h3> <h3>Another book</h3> Есть ли способ PHP определить язык строки на основе символов Unicode и […]

Преобразование Unicode из строки JSON с помощью PHP

Я читал несколько решений, но пока ничего не смог заставить работать. У меня есть строка JSON, которую я читаю из вызова API, и она содержит символы Unicode – например, символ \u00c2\u00a3 . Я бы хотел использовать PHP, чтобы преобразовать их в £ или &pound; , Я изучаю проблему и нашел следующий код (используя мой фунт-символ […]

Любой способ вернуть PHP `json_encode` с кодировкой UTF-8, а не Unicode?

Любой способ вернуть PHP json_encode с кодировкой UTF-8, а не Unicode? $arr=array('a'=>'á'); echo json_encode($arr); mb_internal_encoding('UTF-8'); и $arr=array_map('utf8_encode',$arr); не исправляет это. Результат: {"a":"\u00e1"} Ожидаемый результат: {"a":"á"}

Имена файлов UTF8 в PHP и различные кодировки Unicode

У меня есть файл, содержащий символы Unicode на сервере с Linux. Если я использую SSH на сервере и использую tab-completion для перехода к файлу / папке, содержащей символы Unicode, у меня нет проблем с доступом к файлу / папке. Проблема возникает, когда я пытаюсь получить доступ к файлу через PHP (функция, к которой я обращалась […]

PHP: Как создать имена файлов в Юникоде

Я пытаюсь создать файлы с символами Unicode в именах файлов. Я не совсем понимаю, какую кодировку я должен использовать, или если это вообще возможно. У меня есть этот файл, сохраненный в латинской кодировке: $h = fopen("unicode_♫.txt", 'w'); fclose($h); В UTF-8 это будет декодироваться как «unicode_ ♫ .txt». Он записывает его в версии latin1 на диск […]

Проблема с Unicode с PHP

Я использовал функцию dirscan php для получения массива имени файла, он возвращает массив следующим образом: [8] => ?????? ?????.js [9] => ???????? ????? ??? ?????.js [10] => ???????? ???????????? ????????.js [11] => ?????????? ???.js [12] => A Contra Corriente.js [13] => ABC-CLIO Serials Web.js [14] => ACL.js первые три – это файлы, имена которых на […]

Как извлечь текст из документа PDF?

Как извлечь текст из PDF-документа с помощью PHP ? (Я не могу использовать другие инструменты, у меня нет доступа root) Я нашел некоторые функции, работающие для простого текста, но они не хорошо обрабатывают символы Unicode: http://www.hashbangcode.com/blog/zend-lucene-and-pdf-documents-part-2-pdf-data-extraction-437.html

Подготовка приложения PHP для использования с UTF-8

UTF-8 является стандартом де-факто для веб-приложений, но PHP это не стандартная кодировка для PHP (до 6.0). По умолчанию большинство серверов настроено для кодировки ISO-8859-1. Как перегрузить настройки по умолчанию в .htaccess чтобы убедиться, что все хорошо для UTF-8, локали и т. Д.? Любые опции для веб-сервера, Unix OS? Есть ли исчерпывающий список этих настроек? Например, […]

конвертировать персидские / арабские цифры на английские номера

Как я могу конвертировать персидские / арабские цифры на английские номера с простой функцией? Персидские / арабские цифры: ۰ // -> 0 ۱ // -> 1 ۲ // -> 2 ۳ // -> 3 ۴ // -> 4 ۵ // -> 5 ۶ // -> 6 ۷ // -> 7 ۸ // -> 8 ۹ […]