Ответ 1
С PHP/5.4.0 есть опция "JSON_UNESCAPED_UNICODE"
. Проверьте это:
http://se2.php.net/json_encode
Поэтому вы должны попробовать:
json_encode( $text, JSON_UNESCAPED_UNICODE );
У меня есть PHP script, который имеет дело с широким разнообразием языков. К сожалению, всякий раз, когда я пытаюсь использовать json_encode
, любой выход Unicode преобразуется в шестнадцатеричные сущности. Это ожидаемое поведение? Есть ли способ конвертировать вывод в символы UTF-8?
Вот пример того, что я вижу:
ВХОД
echo $text;
ВЫХОД
База данни грешка.
ВХОД
json_encode($text);
ВЫХОД
"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."
С PHP/5.4.0 есть опция "JSON_UNESCAPED_UNICODE"
. Проверьте это:
http://se2.php.net/json_encode
Поэтому вы должны попробовать:
json_encode( $text, JSON_UNESCAPED_UNICODE );
JSON_UNESCAPED_UNICODE доступен на PHP версии 5.4 или новее.
Следующий код предназначен для версии 5.3.
ОБНОВЛЕНО
html_entity_decode
является более эффективным, чем pack
+ mb_convert_encoding
.(*SKIP)(*FAIL)
пропускает обратную косую черту и заданные символы с помощью флагов JSON_HEX_*
.
function raw_json_encode($input, $flags = 0) {
$fails = implode('|', array_filter(array(
'\\\\',
$flags & JSON_HEX_TAG ? 'u003[CE]' : '',
$flags & JSON_HEX_AMP ? 'u0026' : '',
$flags & JSON_HEX_APOS ? 'u0027' : '',
$flags & JSON_HEX_QUOT ? 'u0022' : '',
)));
$pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/";
$callback = function ($m) {
return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8');
};
return preg_replace_callback($pattern, $callback, json_encode($input, $flags));
}
Одним из решений является сначала кодировать данные, а затем декодировать их в том же файле:
$string =json_encode($input, JSON_UNESCAPED_UNICODE) ;
echo $decoded = html_entity_decode( $string );
Вам нравится устанавливать кодировку и unicced unicode
header('Content-Type: application/json;charset=utf-8');
json_encode($data,JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT);
Функция raw_json_encode() выше не решить мне проблему (по какой - то причине, функция обратного вызова подняла ошибку на моем сервере PHP 5.2.5).
Но это другое решение действительно сработало.
https://www.experts-exchange.com/questions/28628085/json-encode-fails-with-special-characters.html
Кредиты должны идти к Марко Гаси. Я просто вызываю его функцию вместо вызова json_encode():
function jsonRemoveUnicodeSequences( $json_struct )
{
return preg_replace( "/\\\\u([a-f0-9]{4})/e", "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode( $json_struct ) );
}
json_encode($text, JSON_UNESCAPED_UNICODE|JSON_UNESCAPED_SLASHES);
Вот мое комбинированное решение для различных версий PHP.
В моей компании мы работаем с разными серверами с разными версиями PHP, поэтому мне пришлось искать решение, подходящее для всех.
$phpVersion = substr(phpversion(), 0, 3)*1;
if($phpVersion >= 5.4) {
$encodedValue = json_encode($value, JSON_UNESCAPED_UNICODE);
} else {
$encodedValue = preg_replace('/\\\\u([a-f0-9]{4})/e', "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode($value));
}
Кредиты должны идти к Марко Гаси и Абу. Решение для PHP> = 5.4 представлено в документации по json_encode.
Поскольку вы спросили:
Есть ли способ конвертировать вывод в символы UTF-8?
Другим решением является использование utf8_encode.
Это будет закодировать вашу строку до UTF-8
.
например.
foreach ($rows as $key => $row) {
$rows[$key]["keyword"] = utf8_encode($row["keyword"]);
}
echo json_encode($rows);
Является ли это ожидаемым поведением?
json_encode()
работает только с кодированными данными в формате UTF 8.
возможно, вы можете получить ответ, чтобы преобразовать его здесь: cyrillic-characters-in-phps-json-encode