У меня есть PHP-скрипт, который имеет дело с широким разнообразием языков. К сожалению, всякий раз, когда я пытаюсь использовать json_encode
, любой выход Unicode преобразуется в шестнадцатеричные сущности. Это ожидаемое поведение? Есть ли способ конвертировать вывод в символы UTF-8?
Вот пример того, что я вижу:
ВХОД
echo $text;
ВЫВОД
База данни грешка.
ВХОД
json_encode($text);
ВЫВОД
"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."
Начиная с PHP / 5.4.0, есть опция "JSON_UNESCAPED_UNICODE"
. Проверьте это:
http://se2.php.net/json_encode
Поэтому вы должны попробовать:
json_encode( $text, JSON_UNESCAPED_UNICODE );
JSON_UNESCAPED_UNICODE доступен на PHP версии 5.4 или новее.
Следующий код предназначен для версии 5.3.
ОБНОВЛЕНО
html_entity_decode
немного эффективнее, чем pack
+ mb_convert_encoding
. (*SKIP)(*FAIL)
пропускает обратную косую черту и заданные символы с JSON_HEX_*
флагов JSON_HEX_*
. function raw_json_encode($input, $flags = 0) { $fails = implode('|', array_filter(array( '\\\\', $flags & JSON_HEX_TAG ? 'u003[CE]' : '', $flags & JSON_HEX_AMP ? 'u0026' : '', $flags & JSON_HEX_APOS ? 'u0027' : '', $flags & JSON_HEX_QUOT ? 'u0022' : '', ))); $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/"; $callback = function ($m) { return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8'); }; return preg_replace_callback($pattern, $callback, json_encode($input, $flags)); }
Поскольку вы спросили:
Есть ли способ конвертировать вывод в символы UTF-8?
Другое решение – использовать utf8_encode .
Это будет кодировать вашу строку в UTF-8
.
например
foreach ($rows as $key => $row) { $rows[$key]["keyword"] = utf8_encode($row["keyword"]); } echo json_encode($rows);
Это ожидаемое поведение?
json_encode()
работает только с кодированными данными UTF-8.
возможно, вы можете получить ответ, чтобы преобразовать его здесь: cyrillic-characters-in-phps-json-encode