Python json.loads ValueError, ожидающий разделитель

Я извлекаю таблицу postgres как json. Выходной файл содержит строки, такие как:

{"data": {"test": 1, "hello": "I have \" !"}, "id": 4}

Теперь мне нужно загрузить их в свой код python с помощью json.loads, но я получаю эту ошибку:

Traceback (most recent call last):
  File "test.py", line 33, in <module>
    print json.loads('''{"id": 4, "data": {"test": 1, "hello": "I have \" !"}}''')
  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/__init__.py", line 338, in loads
    return _default_decoder.decode(s)
  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/decoder.py", line 365, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/decoder.py", line 381, in raw_decode
    obj, end = self.scan_once(s, idx)
ValueError: Expecting , delimiter: line 1 column 50 (char 49)

Я понял, что исправление заключается в добавлении еще одного \ в \". Итак, если я прохожу

{"data": {"test": 1, "hello": "I have \\" !"}, "id": 4}

до json.loads, я получаю следующее:

{u'data': {u'test': 1, u'hello': u'I have " !'}, u'id': 4}

Есть ли способ сделать это без добавления дополнительного \? Как передать параметр в json.loads или что-то?

Ответы

Ответ 1

Вы можете указать так называемые "необработанные строки":

>>> print r'{"data": {"test": 1, "hello": "I have \" !"}, "id": 4}'
{"data": {"test": 1, "hello": "I have \" !"}, "id": 4}

Они не интерпретируют обратную косую черту.

Обычные строки меняют \" на ", поэтому вы можете иметь символы " в строках, которые сами ограничены двойными кавычками:

>>> "foo\"bar"
'foo"bar'

Таким образом, преобразование от \" до " не выполняется json.loads, а само Python.

Ответ 2

Попробуйте следующее:

json.loads(r'{"data": {"test": 1, "hello": "I have \" !"}, "id": 4}')

Если у вас есть эта строка внутри переменной, просто:

json.loads(data.replace("\\", r"\\"))

Надеюсь, что это поможет!

Ответ 3

Попробуйте использовать source.replace('""', '') или sub it, причина "" в источнике сделает json.loads(source) не может их отличить.