Articles of encoding

Греческая кодировка символов работает в HTML, но не в PHP

У меня очень странная проблема, которая не может понять. Я использую notepad ++, и если я сохраняю файл как .php с греческими символами (символы не из базы данных), он отображает греческие символы в качестве вопросительных знаков в веб-браузерах, но если я сохраню тот же файл символов, что и .html, он правильно отобразит символы. если греческие […]

Как определить, нужно ли применять utf8 декодировать или кодировать строку?

У меня есть фид, взятый с сторонних сайтов, и иногда мне приходится применять utf8_decode и другие времена utf8_encode для получения нужного видимого результата. Если по ошибке один и тот же материал применяется дважды / или используется неправильный метод, я получаю что-то более уродливое, это то, что я хочу изменить. Как я могу определить, когда нужно […]

У меня есть строка с "\ u00a0", и мне нужно заменить ее на "" str_replace не удается

Мне нужно очистить строку, которая приходит (копировать / вставлять) из различных приложений Microsoft Office Suite ( Excel , Access и Word ), каждая из которых имеет свой собственный набор кодировок. Я использую json_encode для целей отладки, чтобы иметь возможность видеть каждый отдельный кодированный символ. Я могу очистить все, что я нашел до сих пор (\ […]

json_encode () non utf-8 строки?

Поэтому у меня есть массив строк, и все строки используют кодировку ANSI по умолчанию и вытаскиваются из базы данных sql. Таким образом, существует 256 различных возможных значений байтовых символов (однобайтная кодировка). Есть ли способ, которым я могу заставить json_encode () работать и отображать эти символы вместо того, чтобы использовать utf8_encode () для всех моих строк […]

PHP-кодировка символов для чтения csv-файла с fgets

У меня есть веб-сайт, который получает файл CSV по FTP один раз в месяц. В течение многих лет это был файл ASCII. Теперь я получаю UTF-8 один месяц, затем UTF-16BE следующий и UTF-16LE через месяц. Возможно, я получу UTF-32 в следующем месяце. Fgets возвращает отметку порядка байтов в начале файлов UTF. Как я могу заставить […]

Исправить неправильно отображаемую кодировку в html-документе с помощью php

Есть ли способ исправить символы, которые отображаются некорректно после запуска этой разметки html через phpquery :: newDocument? Есть двойные кавычки вокруг «Классы с современной женщиной» в исходном документе, которые в конечном итоге отображаются неправильно после создания нового документа с помощью phpquery. //Original document is UTF-8 encoded $raw_html = '<html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /></head><body><p>Mr. Smith of […]

Soap – base64 двоичные данные в PHP

У меня есть клиент SOAP на PHP, который вызывает вызовы службы WSDL. Одна из функций возвращает двоичные данные base64 . Я пытался декодировать его без везения. base64_decode ($ encoded_base64data) не будет работать. Я попытался использовать base_convert () и mv_convert_encoding () с различными параметрами, но не смог получить правильный результат. Закодированные данные результата начинаются с: `I […]

PHP / MySQL с проблемами кодирования

У меня возникают проблемы с PHP в отношении кодирования. У меня есть страница JavaScript HTML / jQuery HTML5, взаимодействующая с моим PHP-скриптом с использованием $ .post. Однако PHP сталкивается со странной проблемой, вероятно, связанной с кодировкой. Когда я пишу htmlentities("í") Я ожидаю PHP для вывода &iacute; , Однако вместо этого он выводит &Atilde;&shy; Вначале я […]

Что такое (по умолчанию) кодировка для функции md5 () в PHP?

Когда я проверил этот маленький скрипт: $str = "apple"; echo md5($str); Результат соответствовал результату md5 с использованием utf8 (проверен с использованием C #) Должен ли я полагать, что это всегда будет иметь место в любой другой среде? Если мне разместить этот скрипт на любом веб-хосте, окнах или Linux, будет ли он всегда UTF8 кодировкой UTF8 […]

Обеспечение правильного utf-8 в PHP

Я использую PHP для обработки текста из разных источников. Я не ожидаю, что это будет нечто иное, чем UTF-8, ISO-8859-1 или, возможно, WINDOWS-1252. Если это что-то другое, кроме одного из них, мне просто нужно убедиться, что текст превращается в действительную строку UTF-8, даже если символы потеряны. Опция // TRANSLIT для iconv разрешает это? Например, сохранит […]