Как это сделать - трассировка и поиск словаря python

У меня есть вложенные словари:

{'key0': {'attrs': {'entity': 'p', 'hash': '34nj3h43b4n3', 'id': '4130'},
          u'key1': {'attrs': {'entity': 'r',
                              'hash': '34njasd3h43b4n3',
                              'id': '4130-1'},
                    u'key2': {'attrs': {'entity': 'c',
                                        'hash': '34njasd3h43bdsfsd4n3',
                                        'id': '4130-1-1'}}},
          u'key3': {'attrs': {'entity': 'r',
                              'hash': '34njasasasd3h43b4n3',
                              'id': '4130-2'},
                    u'key4': {'attrs': {'entity': 'c',
                                        'hash': '34njawersd3h43bdsfsd4n3',
                                        'id': '4130-2-1'}},
                    u'key5': {'attrs': {'entity': 'c',
                                        'hash': '34njawersd3h43bdsfsd4n3',
                                        'id': '4130-2-2'}}}},
 'someohterthing': 'someothervalue',
 'something': 'somevalue'}

при условии id - одного из всех ids, как 4130 - 4130-2-2.
Самый простой способ перейти к правильному словарю?

Как если бы данный id был 4130-2-1, тогда он должен был достигнуть словаря с помощью key=key5

Не подходит xml.

Изменить (1):. Вложенность находится между уровнями 1 до 4, но я знаю, что вложенность перед анализом.

Изменить (2). Исправлен код.

** Изменить (3): ** Исправлен код для строковых значений ids. Пожалуйста, извините за созданную путаницу. На этом я надеюсь:)

Ответы

Ответ 1

Ваша структура неприятно нерегулярна. Здесь версия с функцией Посетитель, которая пересекает под-словари attrs.

def walkDict( aDict, visitor, path=() ):
    for  k in aDict:
        if k == 'attrs':
            visitor( path, aDict[k] )
        elif type(aDict[k]) != dict:
            pass
        else:
            walkDict( aDict[k], visitor, path+(k,) )

def printMe( path, element ):
    print path, element

def filterFor( path, element ):
    if element['id'] == '4130-2-2':
        print path, element

Вы бы использовали его вот так.

walkDict( myDict, filterFor )

Это можно превратить в генератор вместо Посетителя; это вместо yield path, aDict[k] вместо вызова функции посетителя.

Вы использовали бы его в цикле for.

for path, attrDict in walkDictIter( aDict ):
    # process attrDict...

Ответ 2

Если вы хотите решить проблему в общем виде, независимо от того, сколько уровней вложенности вы имеете в своем dict, тогда создайте рекурсивную функцию, которая пересечет дерево:

def traverse_tree(dictionary, id=None):
    for key, value in dictionary.items():
        if key == 'id':
            if value == id:
                print dictionary
        else:
             traverse_tree(value, id)
    return

>>> traverse_tree({1: {'id': 2}, 2: {'id': 3}}, id=2)
{'id': 2}

Ответ 3

Эта проблема часто лучше решается с помощью соответствующих определений классов, а не общих словарей.

class ProperObject( object ):
    """A proper class definition for each "attr" dictionary."""
    def __init__( self, path, attrDict ):
        self.path= path
        self.__dict__.update( attrDict )
    def __str__( self ):
        return "path %r, entity %r, hash %r, id %r" % (
            self.path, self.entity, self.hash, self.id )

masterDict= {} 
def builder( path, element ):
    masterDict[path]= ProperObject( path, element )

# Use the Visitor to build ProperObjects for each "attr"
walkDict( myDict, builder )

# Now that we have a simple dictionary of Proper Objects, things are simple
for k,v in masterDict.items():
    if v.id == '4130-2-2':
        print v

Кроме того, теперь, когда у вас есть правильные определения объектов, вы можете сделать следующее

# Create an "index" of your ProperObjects
import collections
byId= collections.defaultdict(list)
for k in masterDict:
    byId[masterDict[k].id].append( masterDict[k] )

# Look up a particular item in the index
print map( str, byId['4130-2-2'] )

Ответ 4

Это старый вопрос, но по-прежнему лучший результат Google, поэтому я обновлю:

Я и мой друг опубликовали библиотеку, чтобы решить (почти) эту точную проблему. dpath-python (никакого отношения к модулю perl dpath, который делает подобные вещи).

http://github.com/akesterson/dpath-python

Все, что вам нужно сделать, это что-то вроде этого:

$ easy_install dpath
>>> import dpath.util
>>> results = []
>>> for (path, value) in dpath.util.search(my_dictionary, "*/attrs/entity/4130*", yielded=True):
>>> ... parent = dpath.util.search("/".join(path.split("/")[:-2])
>>> ... results.append(parent)

... это даст вам список всех объектов словаря, которые соответствуют вашему поиску, т.е. всех объектов, которые имели (ключ = 4130 *). Родительский бит немного дергается, но это сработает.

Ответ 5

Поскольку рекурсия, как известно, ограничена в python (см. Какова максимальная глубина рекурсии в Python и как ее увеличить?) Я бы предпочел ответить на этот вопрос на основе петли, поэтому ответ может быть адаптирован к любому уровню глубины словаря. Для этого функция

def walkDict( aDict, visitor, path=() ):
    for  k in aDict:
        if k == 'attrs':
            visitor( path, aDict[k] )
        elif type(aDict[k]) != dict:
            pass
        else:
            walkDict( aDict[k], visitor, path+(k,) )

Может быть заменен на:

def walkDictLoop(aDict, visitor, path=()):
    toProcess = [(aDict, path)]
    while toProcess:
        dictNode, pathNode = toProcess.pop(0)
        for k in dictNode:
            if k == 'attrs':
                visitor(pathNode, dictNode[k])
            if isinstance(dictNode[k], dict):
                toProcess.append( (dictNode[k], pathNode+(k,)) )

Ответ 6

Ну, если вам нужно сделать это всего несколько раз, вы можете просто использовать вложенный dict.iteritems(), чтобы найти то, что ищете.

Если вы планируете делать это несколько раз, спектакли быстро станут проблемой. В этом случае вы можете:

измените способ возврата данных вам к чему-то более подходящему.
если вы не можете, преобразовать данные после мухи в dict между id и ключами (используя iteritems). Затем используйте его.

Ответ 7

Я верю, что pydash даст вам самый эффективный способ достичь этого.

Например:

data = {'a': {'b': {'c': [0, 0, {'d': [0, {1: 2}]}]}}, 'names': {'first': 'gus', 'second': 'parvez'}}

pydash.get(data, 'a.b.c.2.d.1.[1]')

# output: 2

Подробную документацию вы можете найти здесь: https://pydash.readthedocs.io/en/latest/quickstart.html