Обнаружение плохих json-данных в PHP json_decode()?
Я пытаюсь обрабатывать плохие данные json при анализе через json_decode(). Я использую следующий script:
if(!json_decode($_POST)) {
echo "bad json data!";
exit;
}
Если $_POST равно:
'{ bar: "baz" }'
Затем json_decode обрабатывает ошибку и выдает "плохие данные json!";
Однако, если я устанавливаю $_POST на что-то вроде "недопустимых данных", это дает мне:
Warning: json_decode() expects parameter 1 to be string, array given in C:\server\www\myserver.dev\public_html\rivrUI\public_home\index.php on line 6
bad json data!
Нужно ли писать пользовательский script для обнаружения действительных данных json или есть какой-то другой отличный способ обнаружить это?
Ответы
Ответ 1
Вот пара вещей о json_decode
:
- он возвращает данные или
null
, когда есть ошибка
- он также может возвращать
null
, когда нет ошибки: когда строка JSON содержит null
- появляется предупреждение, в котором есть предупреждение - предупреждение о том, что вы хотите исчезнуть.
Для решения проблемы предупреждения было бы использовать оператор @
(я не часто рекомендую его использовать, поскольку он делает отладку намного сложнее... Но здесь не так много выбора):
$_POST = array(
'bad data'
);
$data = @json_decode($_POST);
Затем вам нужно будет проверить, если $data
is null
- и, чтобы избежать случая, когда json_decode
возвращает null
для null
в строке JSON, вы можете проверить json_last_error
, который (цитирование):
Возвращает последнюю ошибку (если она есть) произошел в результате последнего разбора JSON.
Это означает, что вам придется использовать какой-то код, например:
if ($data === null
&& json_last_error() !== JSON_ERROR_NONE) {
echo "incorrect data";
}
Ответ 2
Вы также можете использовать json_last_error: http://php.net/manual/en/function.json-last-error.php
который, как говорится в документации:
Возвращает последнюю ошибку (если она есть) во время последнего JSON кодирование/декодирование.
вот пример
json_decode($string);
switch (json_last_error()) {
case JSON_ERROR_NONE:
echo ' - No errors';
break;
case JSON_ERROR_DEPTH:
echo ' - Maximum stack depth exceeded';
break;
case JSON_ERROR_STATE_MISMATCH:
echo ' - Underflow or the modes mismatch';
break;
case JSON_ERROR_CTRL_CHAR:
echo ' - Unexpected control character found';
break;
case JSON_ERROR_SYNTAX:
echo ' - Syntax error, malformed JSON';
break;
case JSON_ERROR_UTF8:
echo ' - Malformed UTF-8 characters, possibly incorrectly encoded';
break;
default:
echo ' - Unknown error';
break;
}
Ответ 3
Вот как Guzzle обрабатывает json
/**
* Parse the JSON response body and return an array
*
* @return array|string|int|bool|float
* @throws RuntimeException if the response body is not in JSON format
*/
public function json()
{
$data = json_decode((string) $this->body, true);
if (JSON_ERROR_NONE !== json_last_error()) {
throw new RuntimeException('Unable to parse response body into JSON: ' . json_last_error());
}
return $data === null ? array() : $data;
}
Ответ 4
Я просто сломал себе голову над синтаксической ошибкой json в том, что оказалось совершенным json: {"test1":"car", "test2":"auto"}
из строки с кодировкой url.
Но в моем случае некоторые из вышеперечисленных были закодированы html, так как добавление html_entity_decode($string)
делало трюк.
$ft = json_decode(html_entity_decode(urldecode(filter_input(INPUT_GET, 'ft', FILTER_SANITIZE_STRING))));
Надеюсь, это спасет кого-то еще некоторое время.
Ответ 5
Начиная с PHP 7.3, функция json_decode будет принимать новую опцию JSON_THROW_ON_ERROR, которая позволит json_decode генерировать исключение вместо возврата null при ошибке.
Пример:
try {
json_decode("{", false, 512, JSON_THROW_ON_ERROR);
}
catch (\JsonException $exception) {
echo $exception->getMessage(); // displays "Syntax error"
}
Ответ 6
/**
*
* custom json_decode
* handle json_decode errors
*
* @param type $json_text
* @return type
*/
public static function custom_json_decode($json_text) {
$decoded_array = json_decode($json_text, TRUE);
switch (json_last_error()) {
case JSON_ERROR_NONE:
return array(
"status" => 0,
"value" => $decoded_array
);
case JSON_ERROR_DEPTH:
return array(
"status" => 1,
"value" => 'Maximum stack depth exceeded'
);
case JSON_ERROR_STATE_MISMATCH:
return array(
"status" => 1,
"value" => 'Underflow or the modes mismatch'
);
case JSON_ERROR_CTRL_CHAR:
return array(
"status" => 1,
"value" => 'Unexpected control character found'
);
case JSON_ERROR_SYNTAX:
return array(
"status" => 1,
"value" => 'Syntax error, malformed JSON'
);
case JSON_ERROR_UTF8:
return array(
"status" => 1,
"value" => 'Malformed UTF-8 characters, possibly incorrectly encoded'
);
default:
return array(
"status" => 1,
"value" => 'Unknown error'
);
}
}
Ответ 7
Я только что провел час, рассматривая все возможные решения на этой странице. Я взял на себя смелость объединить все эти возможные решения в одну функцию, чтобы сделать ее более быстрой и легкой для отладки и отладки.
Я надеюсь, что это может быть полезным для кого-то еще.
<?php
/**
* Decontaminate text
*
* Primary sources:
* - https://stackoverflow.com/info/17219916/json-decode-returns-json-error-syntax-but-online-formatter-says-the-json-is-ok
* - https://stackoverflow.com/info/2348152/detect-bad-json-data-in-php-json-decode
*/
function decontaminate_text(
$text,
$remove_tags = true,
$remove_line_breaks = true,
$remove_BOM = true,
$ensure_utf8_encoding = true,
$ensure_quotes_are_properly_displayed = true,
$decode_html_entities = true
){
if ( '' != $text && is_string( $text ) ) {
$text = preg_replace( '@<(script|style)[^>]*?>.*?</\\1>@si', '', $text );
$text = str_replace(']]>', ']]>', $text);
if( $remove_tags ){
// Which tags to allow (none!)
// $text = strip_tags($text, '<p>,<strong>,<span>,<a>');
$text = strip_tags($text, '');
}
if( $remove_line_breaks ){
$text = preg_replace('/[\r\n\t ]+/', ' ', $text);
$text = trim( $text );
}
if( $remove_BOM ){
// Source: https://stackoverflow.com/a/31594983/1766219
if( 0 === strpos( bin2hex( $text ), 'efbbbf' ) ){
$text = substr( $text, 3 );
}
}
if( $ensure_utf8_encoding ){
// Check if UTF8-encoding
if( utf8_encode( utf8_decode( $text ) ) != $text ){
$text = mb_convert_encoding( $text, 'utf-8', 'utf-8' );
}
}
if( $ensure_quotes_are_properly_displayed ){
$text = str_replace('"', '"', $text);
}
if( $decode_html_entities ){
$text = html_entity_decode( $text );
}
/**
* Other things to try
* - the chr-function: https://stackoverflow.com/a/20845642/1766219
* - stripslashes (THIS ONE BROKE MY JSON DECODING, AFTER IT STARTED WORKING, THOUGH): https://stackoverflow.com/a/28540745/1766219
* - This (improved?) JSON-decoder didn't help me, but it sure looks fancy: https://stackoverflow.com/a/43694325/1766219
*/
}
return $text;
}
// Example use
$text = decontaminate_text( $text );
// $text = decontaminate_text( $text, false ); // Debug attempt 1
// $text = decontaminate_text( $text, false, false ); // Debug attempt 2
// $text = decontaminate_text( $text, false, false, false ); // Debug attempt 3
$decoded_text = json_decode( $text, true );
echo json_last_error_msg() . ' - ' . json_last_error();
?>
Я буду поддерживать это здесь: https://github.com/zethodderskov/decontaminate-text-in-php/blob/master/decontaminate-text-preparing-it-for-json-decode.php