Заказ JSON sort_keys в Python

Есть ли какой-либо способ в Python 2.6 предоставить пользовательский ключ или функцию cmp для JSON sort_keys?

У меня есть список dicts, исходящий от JSON, например:

[
  {
    "key": "numberpuzzles1",
    "url": "number-puzzle-i.html",
    "title": "Number Puzzle I",
    "category": "nestedloops",
    "points": "60",
    "n": "087"
  },
  {
     "key": "gettingindividualdigits",
     "url": "getting-individual-digits.html",
     "title": "Getting Individual Digits",
     "category": "nestedloops",
     "points": "80",
     "n": "088"
  }
]

... который я сохранил в переменной списка assigndb. Я хотел бы иметь возможность загружать в JSON, изменять его и сериализовывать его обратно с помощью dumps (или что-то еще), сохраняя порядок ключей без изменений.

До сих пор я пробовал что-то вроде этого:

ordering = {'key': 0, 'url': 1, 'title': 2, 'category': 3,
             'flags': 4, 'points': 5, 'n': 6}

def key_func(k):
    return ordering[k]

# renumber assignments sequentially
for (i, a) in enumerate(assigndb):
    a["n"] = "%03d" % (i+1)

s = json.dumps(assigndb, indent=2, sort_keys=True, key=key_func)

... но, конечно, dumps не поддерживает настраиваемый ключ, например list.sort(). Что-то с пользовательским JSONEncoder может быть? Кажется, я не понимаю.

Ответы

Ответ 1

Это отвратительно, но в случае, если решение tokland не работает для вас:

data = [{'category': 'nestedloops', 'title': 'Number Puzzle I', 'url': 'number-puzzle-i.html', 'n': '087', 'points': '60', 'key': 'numberpuzzles1'}, {'category': 'nestedloops', 'title': 'Getting Individual Digits', 'url': 'getting-individual-digits.html', 'n': '088', 'points': '80', 'key': 'gettingindividualdigits'}]
ordering = {'key': 0, 'url': 1, 'title': 2, 'category': 3,
            'flags': 4, 'points': 5, 'n': 6}
outlist = []
for d in data:
    outlist.append([])
    for k in sorted(d.keys(), key=lambda k: ordering[k]):
        outlist[-1].append(json.dumps({k: d[k]}))

for i, l in enumerate(outlist):
    outlist[i] = "{" + ",".join((s[1:-1] for s in outlist[i])) + "}"

s = "[" + ",".join(outlist) + "]"

Ответ 2

Идея (протестирована с 2.7):

import json
import collections
json.encoder.c_make_encoder = None
d = collections.OrderedDict([("b", 2), ("a", 1)])
json.dumps(d)
# '{"b": 2, "a": 1}'

Смотрите: OrderedDict + issue6105. Патч c_make_encoder, кажется, нужен только для Python 2.x. Не прямое решение, потому что вы должны изменить dict для OrderedDict s, но он может быть еще полезен. Я проверил библиотеку json (encode.py), и упорядоченный жестко запрограммирован:

if _sort_keys:
    items = sorted(dct.items(), key=lambda kv: kv[0])

Ответ 3

У меня была та же проблема, и collections.OrderedDict просто не подходит для задачи, потому что она упорядочивала все по алфавиту. Поэтому я написал нечто подобное решению Эндрю Кларка:

def json_dumps_sorted(data, **kwargs):
    sorted_keys = kwargs.get('sorted_keys', tuple())
    if not sorted_keys:
        return json.dumps(data)
    else:
        out_list = []
        for element in data:
            element_list = []
            for key in sorted_keys:
                if key in element:
                    element_list.append(json.dumps({key: element[key]}))
            out_list.append('{{{}}}'.format(','.join((s[1:-1] for s in element_list))))
        return '[{}]'.format(','.join(out_list))

Вы используете его следующим образом:

json_string = json_dumps_sorted([
    {
        "key": "numberpuzzles1",
        "url": "number-puzzle-i.html",
        "title": "Number Puzzle I",
        "category": "nestedloops",
        "points": "60",
        "n": "087"
    }, {
        "key": "gettingindividualdigits",
        "url": "getting-individual-digits.html",
        "title": "Getting Individual Digits",
        "category": "nestedloops",
        "points": "80",
        "n": "088"
    }
], sorted_keys=(
    'key', 
    'url', 
    'title', 
    'category',
    'flags', 
    'points', 
    'n'
))

Ответ 4

Спасибо. Мне нужно было поставить ключ метки времени: значение в верхней части моего объекта JSON независимо от того, что. Очевидно, сортировка клавиш привинчивается вверх, так как начинается с "t".

Используя что-то вроде этого, сразу же нажав клавишу timestamp в dict_data:

d = collections.OrderedDict(dict_data)