Articles of unicode

PHP: Как создать имена файлов в Юникоде

Я пытаюсь создать файлы с символами Unicode в именах файлов. Я не совсем понимаю, какую кодировку я должен использовать, или если это вообще возможно. У меня есть этот файл, сохраненный в латинской кодировке: $h = fopen("unicode_♫.txt", 'w'); fclose($h); В UTF-8 это будет декодироваться как «unicode_ ♫ .txt». Он записывает его в версии latin1 на диск […]

Как изменить строку Unicode

Это было намечено в комментарии к ответу на этот вопрос, что PHP не может отменить строки Unicode. Что касается Unicode, он работает на PHP, потому что большинство приложений обрабатывают его как двоичный. Да, PHP 8-битный. Попробуйте эквивалент этого в PHP: perl -Mutf8 -e 'print scalar reverse («ほ げ ほ げ») «Вы получите мусор, а не« […]

Как извлечь текст из документа PDF?

Как извлечь текст из PDF-документа с помощью PHP ? (Я не могу использовать другие инструменты, у меня нет доступа root) Я нашел некоторые функции, работающие для простого текста, но они не хорошо обрабатывают символы Unicode: http://www.hashbangcode.com/blog/zend-lucene-and-pdf-documents-part-2-pdf-data-extraction-437.html

Подготовка приложения PHP для использования с UTF-8

UTF-8 является стандартом де-факто для веб-приложений, но PHP это не стандартная кодировка для PHP (до 6.0). По умолчанию большинство серверов настроено для кодировки ISO-8859-1. Как перегрузить настройки по умолчанию в .htaccess чтобы убедиться, что все хорошо для UTF-8, локали и т. Д.? Любые опции для веб-сервера, Unix OS? Есть ли исчерпывающий список этих настроек? Например, […]

конвертировать персидские / арабские цифры на английские номера

Как я могу конвертировать персидские / арабские цифры на английские номера с простой функцией? Персидские / арабские цифры: ۰ // -> 0 ۱ // -> 1 ۲ // -> 2 ۳ // -> 3 ۴ // -> 4 ۵ // -> 5 ۶ // -> 6 ۷ // -> 7 ۸ // -> 8 ۹ […]

Список каталогов, содержащих символы Unicode в Windows

Я использую Windows 2003 для написания кода PHP. Я использую XAMPP Portable (копируем в D :). Проблема: $path = 'D:\ebooks'; $all_file = scandir($path); foreach ($all_file as $file) { if (is_dir("$path/$file") && $file != '.' && $file != '..') { echo $file . "<br />\n"; } } Когда я вызываю скрипт (с браузером), я не видел […]

Какие факторы делают PHP Unicode несовместимым?

Я могу использовать символы UTF-8 в моих скриптах. По сути , имена переменных и функций могут содержать символы Unicode . Существует также расширение mb_string, которое имеет дело с многобайтными строками, но в бесчисленных статьях PHP критикует за отсутствие поддержки Unicode. Я не понимаю; почему PHP не поддерживает Unicode?

Алгоритм естественной сортировки в PHP с поддержкой Unicode?

Можно ли отсортировать массив с символами Unicode / UTF-8 в PHP с использованием алгоритма естественного порядка? Например (порядок в этом массиве правильно упорядочен): $array = array ( 0 => 'Agile', 1 => 'Ágile', 2 => 'Àgile', 3 => 'Âgile', 4 => 'Ägile', 5 => 'Ãgile', 6 => 'Test', ); Если я попытаюсь с asort ($ […]

Заменить символ Юникода

Я пытаюсь заменить определенный символ в строке на другой. Это довольно неясные латинские символы. Я хочу заменить символ (шестнадцатеричный) 259 на 4d9, поэтому я попробовал это: str_replace("\x02\x59","\x04\xd9",$string); Это не сработало. Как мне это сделать? ** РЕДАКТИРОВАТЬ: Дополнительная информация. Спасибо bobince, что сделал трюк. Хотя, я хочу также заменить верхний регистр schwa, и он почему-то не […]

PHP – быстрый способ удалить все символы, не отображаемые в браузере из строки utf8

У меня есть небольшая грязная база данных, содержащая имена многих учреждений по всему миру. Я хочу отображать их, включая национальные символы, но без недопустимых символов – те, которые отображаются в firefox как номера юникода. Как их отфильтровать? База данных имеет кодировку utf8, но некоторые строки были вставлены с неправильными кодировками или были беспорядок уже в […]