Почему Python не может проанализировать эти данные JSON?
У меня есть этот JSON в файле:
{
"maps": [
{
"id": "blabla",
"iscategorical": "0"
},
{
"id": "blabla",
"iscategorical": "0"
}
],
"masks": [
"id": "valore"
],
"om_points": "value",
"parameters": [
"id": "valore"
]
}
Я написал этот скрипт для печати всех данных JSON:
import json
from pprint import pprint
with open('data.json') as f:
data = json.load(f)
pprint(data)
Эта программа вызывает исключение, хотя:
Traceback (most recent call last):
File "<pyshell#1>", line 5, in <module>
data = json.load(f)
File "/usr/lib/python3.5/json/__init__.py", line 319, in loads
return _default_decoder.decode(s)
File "/usr/lib/python3.5/json/decoder.py", line 339, in decode
obj, end = self.raw_decode(s, idx=_w(s, 0).end())
File "/usr/lib/python3.5/json/decoder.py", line 355, in raw_decode
obj, end = self.scan_once(s, idx)
json.decoder.JSONDecodeError: Expecting ',' delimiter: line 13 column 13 (char 213)
Как я могу проанализировать JSON и извлечь его значения?
Ответы
Ответ 1
Ваши данные не в формате JSON. У вас есть []
когда вы должны иметь {}
:
-
[]
для массивов JSON, которые называются list
в Python -
{}
для объектов JSON, которые называются dict
в Python
Вот как должен выглядеть ваш JSON файл:
{
"maps": [
{
"id": "blabla",
"iscategorical": "0"
},
{
"id": "blabla",
"iscategorical": "0"
}
],
"masks": {
"id": "valore"
},
"om_points": "value",
"parameters": {
"id": "valore"
}
}
Тогда вы можете использовать свой код:
import json
from pprint import pprint
with open('data.json') as f:
data = json.load(f)
pprint(data)
С данными теперь вы также можете найти такие значения:
data["maps"][0]["id"]
data["masks"]["id"]
data["om_points"]
Попробуйте это и посмотрите, начнет ли это иметь смысл.
Ответ 2
Ваш data.json
должен выглядеть следующим образом:
{
"maps":[
{"id":"blabla","iscategorical":"0"},
{"id":"blabla","iscategorical":"0"}
],
"masks":
{"id":"valore"},
"om_points":"value",
"parameters":
{"id":"valore"}
}
Ваш код должен быть:
import json
from pprint import pprint
with open('data.json') as data_file:
data = json.load(data_file)
pprint(data)
Обратите внимание, что это работает только в Python 2.6 и выше, так как это зависит от with
-statement. В Python 2.5 используйте from __future__ import with_statement
, в Python <= 2.4, см. ответ Джастина Пила, на котором основан этот ответ.
Теперь вы можете также получить доступ к следующим значениям:
data["maps"][0]["id"] # will return 'blabla'
data["masks"]["id"] # will return 'valore'
data["om_points"] # will return 'value'
Ответ 3
Ответ Джастина Пила действительно полезен, но если вы используете Python 3, чтение JSON должно быть сделано следующим образом:
with open('data.json', encoding='utf-8') as data_file:
data = json.loads(data_file.read())
Примечание: используйте json.loads
вместо json.load
. В Python 3 json.loads
принимает строковый параметр. json.load
принимает файловый параметр объекта. data_file.read()
возвращает строковый объект.
Честно говоря, я не считаю проблемой загружать все данные json в память в большинстве случаев.
Ответ 4
data = []
with codecs.open('d:\output.txt','rU','utf-8') as f:
for line in f:
data.append(json.loads(line))
Ответ 5
"Ultra JSON" или просто "ujson" могут обрабатывать наличие []
в вашем файле ввода JSON. Если вы читаете входной файл JSON в вашу программу в виде списка элементов JSON; например, [{[{}]}, {}, [], etc...]
ujson может обрабатывать произвольный порядок списков словарей, словари списков.
Вы можете найти ujson в индексе пакета Python, и API практически идентичен встроенной библиотеке json
Python.
ujson также намного быстрее, если вы загружаете большие файлы JSON. Вы можете увидеть подробности производительности по сравнению с другими библиотеками Python JSON по той же ссылке, что и предоставленная.
Ответ 6
Если вы используете Python3, вы можете попробовать изменить JSON (файл connection.json
) на:
{
"connection1": {
"DSN": "con1",
"UID": "abc",
"PWD": "1234",
"connection_string_python":"test1"
}
,
"connection2": {
"DSN": "con2",
"UID": "def",
"PWD": "1234"
}
}
Затем с помощью следующего кода:
connection_file = open('connection.json', 'r')
conn_string = json.load(connection_file)
conn_string['connection1']['connection_string_python'])
connection_file.close()
>>> test1
Ответ 7
Здесь вы идете с измененным файлом data.json
:
{
"maps": [
{
"id": "blabla",
"iscategorical": "0"
},
{
"id": "blabla",
"iscategorical": "0"
}
],
"masks": [{
"id": "valore"
}],
"om_points": "value",
"parameters": [{
"id": "valore"
}]
}
Вы можете позвонить или распечатать данные на консоли, используя следующие строки:
import json
from pprint import pprint
with open('data.json') as data_file:
data_item = json.load(data_file)
pprint(data_item)
Ожидаемый вывод для print(data_item['parameters'][0]['id'])
:
{'maps': [{'id': 'blabla', 'iscategorical': '0'},
{'id': 'blabla', 'iscategorical': '0'}],
'masks': [{'id': 'valore'}],
'om_points': 'value',
'parameters': [{'id': 'valore'}]}
Ожидаемый вывод для print(data_item['parameters'][0]['id'])
:
valore
Ответ 8
Есть два типа в этом разборе.
- Разбор данных из файла по системному пути
- Парсинг JSON с удаленного URL.
Из файла вы можете использовать следующее
import json
json = json.loads(open('/path/to/file.json').read())
value = json['key']
print json['value']
Эта статья объясняет полный анализ и получение значений с использованием двух сценариев. Разбор JSON с использованием Python
Ответ 9
Как пользователь python3,
Разница между методами load
и loads
важна, особенно когда вы читаете данные json из файла.
Как указано в документах:
json.load:
Десериализовать fp (текстовый файл .read() -supporting или двоичный файл, содержащий документ JSON) в объект Python, используя эту таблицу преобразования.
json.loads:
json.loads: десериализовать s (экземпляр str, bytes или bytearray, содержащий документ JSON) в объект Python, используя эту таблицу преобразования.
Метод json.load может непосредственно читать открытый документ json, так как он может читать двоичный файл.
with open('./recipes.json') as data:
all_recipes = json.load(data)
В результате ваши данные json доступны в формате, указанном в соответствии с таблицей преобразования:
https://docs.python.org/3.7/library/json.html#json-to-py-table
Ответ 10
При чтении json из файла всегда полезно очистить файлы и получить строку в файле, разделив символы новой строки и вкладки
clean_document = json_file.read().replace('\n', '').replace('\t', '')
json_document = json.loads(clean_document)
print("Len of Json ", len(json_document))