Articles of unicode

Должен ли я использовать многобайтную перегрузку (mbstring.func_overload)?

Я в процессе создания моего сайта PHP Unicode. Мне интересно, есть ли у кого-нибудь опыт работы с параметром mbstring.func_overload , который заменяет обычные строковые функции (например, strlen ) их многобайтовыми эквивалентами ( mb_strlen ). На странице руководства PHP нет комментариев. Есть ли какие-то потенциальные проблемы, о которых я должен знать? Любые случаи, когда вызов многобайтовой […]

Разверните строку с помощью \ r \ n & \ n & \ r сразу?

Я хочу разделить строку по строкам, но я хочу, чтобы она была основана на всех основных используемых символах разрыва строки: \ п \ Г \ п \р И верните массив, содержащий каждую строку.

Как преобразовать несколько многобайтовых символов в его числовой объект html с помощью PHP?

Тестовая строка: $s = "convert this: "; $s .= "–, —, †, ‡, •, ≤, ≥, μ, ₪, ©, ® y ™, ⅓, ⅔, ⅛, ⅜, ⅝, ⅞, ™, Ω, ℮, ∑, ⌂, ♀, ♂ "; $s .= "but, not convert ordinary characters to entities";

PHP utf8_encode () преобразует пробелы в неразрывные пробелы

Совершенно просто: utf8_encode ($ string) заменяет регулярные пробелы неразрывными пробелами ("\ u00a0"). Я попытался фильтровать результат с помощью str_replace: str_replace("\u00a0", " ", utf8_encode($string)) Но это не исправить. EDIT: Вздох, я идиот. Это не проблема с utf8_encode (). Я думал, что использую эту функцию, забыл, что я отключил ее в своем коде. Мои данные запускаются через […]

Как правильно обрабатывать международный характер в PHP / MySQL / Apache

Мне нужно создать приложение на PHP, которое может обрабатывать все символы Unicode во всех местах – редактировать поля, статический HTML, базу данных. Может ли кто-нибудь рассказать мне полный список всех параметров / функций, которые необходимо установить / использовать для достижения этой цели?

Как совместить с regex все специальные символы, кроме «-» в PHP?

Как я могу сопоставить все «специальные» символы (например, +_*&^%$#@!~ ), Кроме char – in PHP? Я знаю, что \W будет соответствовать всем «специальным» символам, в том числе – . Любые предложения в отношении писем Unicode?

PHP: преобразовать вывод curl_exec в UTF8

Я хотел бы работать только с UTF8. Проблема в том, что я не знаю кодировку каждой веб-страницы. Как я могу его обнаружить и преобразовать в UTF8? <?php $url = "http://vkontakte.ru"; $ch = curl_init($url); $options = array( CURLOPT_RETURNTRANSFER => true, ); curl_setopt_array($ch, $options); $data = curl_exec($ch); // $data = magic($data); print $data; См. Это по адресу: […]

ord () не работает с utf-8

согласно ISO 8859-1 € Символ имеет десятичное значение 128 Моя кодировка php-скрипта по умолчанию echo mb_internal_encoding(); //ISO-8859-1 Итак, теперь, когда PHP echo chr(128); //Output exactly what i want '€' Но echo ord('€'); //opposite it returns 226, it should be 128 почему это так?

StrRev () Дозированная поддержка UTF-8

Я пытаюсь сделать код, который заменит арабский текст, который будет поддерживаться в программах, поддерживаемых не арабскими в том, что мне нужно будет отменить текст после замены, но в нем отображаются некоторые мусорные материалы вместо желаемого результата Вот код: <?php $string = "اهلا بك"; echo "$string <br>"; $Reversed = strrev($string); echo "<br><b>After Reverse</b><br><br>"; echo "<br> $Reversed"; […]

PHP: преобразование строк Unicode в строки ANSI

Есть ли у PHP какие-либо стандартные функции для преобразования строк Unicode в простые, добрые старомодные строки ANSI (или любой другой формат, htmlentities понимает PHP- htmlentities ? Есть ли какая-либо функция, которая преобразует строки UTF-8 в HTML, которые могут быть поняты самыми популярными браузерами?