Код, над которым я работаю, отлично работает в Windows XP и Mac OS X. При тестировании на CentOS (и на Fedora и Ubuntu) он работает неправильно. Поиск сетей привел меня к выводу, что это проблема glibc iconv которая вызывает проблему. Так что теперь мне нужна версия libiconv iconv для Zend Lucene для правильной работы. Я […]
Поэтому у меня есть странная проблема усечения! Невозможно найти конкретный ответ на это. Таким образом, в основном возникает проблема с очевидным символом ISO ½, который обрезает остальную часть текста при вставке в столбец с указанным UTF-8. Давайте скажем, что моя строка: «Вам нужно добавить ½ стакана воды». MySQL усекает это, чтобы «вам нужно добавить», Если […]
Кодирование конвертирования из windows-1255 в utf-8 было задано, прежде чем я узнаю, но у меня все еще разные результаты, и я не могу его решить. Первой проблемой является «php iconv () или mb_convert_encoding () поддержка windows-1255 ????» Во время тестирования он возвращает несколько выходов (играя с // ignore & // translate), но он вообще не […]
Я меняю название, потому что я не знал о специальных сломанных персонажах, которые вызывали у меня проблемы, поэтому вопрос выглядел как дубликат. Как преобразовать объекты HTML, символьные ссылки типа & # [0-9] +; и & # x [a-fA-F0-9] + ;, недопустимые ссылки на символы – и недопустимые символы Windows chr (151) на их эквиваленты UTF-8? […]
Я получаю страницу в utf-8 с русским языком, используя curl. если я эхо текст, это хорошо. то я использую такой код $dom = new domDocument; /*** load the html into the object ***/ @$dom->loadHTML($html); /*** discard white space ***/ $dom->preserveWhiteSpace = false; /*** the table by its tag name ***/ $tables = $dom->getElementsByTagName('table'); /*** get […]
$string = iconv("UTF-8", "UTF-8//IGNORE", $string); Я думал, что этот код удалит недопустимые символы UTF-8, но он выдает [E_NOTICE] "iconv(): Detected an illegal character in input string" . Что мне не хватает, как правильно удалить строку из незаконных символов?
У меня возникают некоторые проблемы, используя следующий код для ввода пользователя: htmlentities($string, ENT_COMPAT, 'UTF-8'); Когда обнаружен недопустимый многобайтовый символ, PHP выдает уведомление: PHP Warning: htmlentities (): Неверная многобайтовая последовательность в аргументе в /path/to/file.php в строке 123 Моя первая мысль заключалась в том, чтобы подавить ошибку, но это медленная и плохая практика: http://derickrethans.nl/five-reasons-why-the-shutop-operator-should-be-avoided.html Моя вторая мысль […]
У меня есть куча файлов, которые не входят в кодировку UTF-8, и я конвертирую сайт в кодировку UTF-8. Я использую простой скрипт для файлов, которые я хочу сохранить в utf-8, но файлы сохраняются в старой кодировке: header('Content-type: text/html; charset=utf-8'); mb_internal_encoding('UTF-8'); $fpath="folder"; $d=dir($fpath); while (False !== ($a = $d->read())) { if ($a != '.' and $a […]
Я пытаюсь удалить акценты из символов в строке PHP в качестве первого шага к тому, чтобы использовать строку в URL-адресе. Я использую следующий код: $input = "Fóø Bår"; setlocale(LC_ALL, "en_US.utf8"); $output = iconv("utf-8", "ascii//TRANSLIT", $input); print($output); Результат, который я ожидал бы, будет примерно таким: F'oo Bar Однако вместо акцентированных символов, транслитерированных, они заменяются вопросительными знаками: […]
Функция iconv иногда дает мне ошибку: Notice: iconv() [function.iconv]: Detected an incomplete multibyte character in input string in […] Есть ли способ обнаружить, что в строке utf-8 есть недопустимые символы, прежде чем помещать данные в inconv?