Как сравнить два списка dicts в Python?
Как сравнить два списка dict
? Результат должен быть нечетным из списка dict B.
Пример:
ldA = [{'user':"nameA", 'a':7.6, 'b':100.0, 'c':45.5, 'd':48.9},
{'user':"nameB", 'a':46.7, 'b':67.3, 'c':0.0, 'd':5.5}]
ldB =[{'user':"nameA", 'a':7.6, 'b':99.9, 'c':45.5, 'd':43.7},
{'user':"nameB", 'a':67.7, 'b':67.3, 'c':1.1, 'd':5.5},
{'user':"nameC", 'a':89.9, 'b':77.3, 'c':2.2, 'd':6.5}]
Здесь я хочу сравнить ldA с ldB. Он должен напечатать приведенный ниже результат.
ldB -> {user:"nameA", b:99.9, d:43.7}
ldB -> {user:"nameB", a:67.7, c:1.1 }
ldb -> {user:"nameC", a:89.9, b:77.3, c:2.2, d:6.5}
Я перешел по ссылке ниже, но там он возвращает только имя, но мне нужно имя и значение, как указано выше.
Список сопоставлений Dicts для сопоставления списков и обнаружения изменений значений в Python
Ответы
Ответ 1
Для общего решения рассмотрим следующее. Он будет корректно отличаться, даже если пользователи не в порядке в списках.
def dict_diff ( merge, lhs, rhs ):
"""Generic dictionary difference."""
diff = {}
for key in lhs.keys():
# auto-merge for missing key on right-hand-side.
if (not rhs.has_key(key)):
diff[key] = lhs[key]
# on collision, invoke custom merge function.
elif (lhs[key] != rhs[key]):
diff[key] = merge(lhs[key], rhs[key])
for key in rhs.keys():
# auto-merge for missing key on left-hand-side.
if (not lhs.has_key(key)):
diff[key] = rhs[key]
return diff
def user_diff ( lhs, rhs ):
"""Merge dictionaries using value from right-hand-side on conflict."""
merge = lambda l,r: r
return dict_diff(merge, lhs, rhs)
import copy
def push ( x, k, v ):
"""Returns copy of dict `x` with key `k` set to `v`."""
x = copy.copy(x); x[k] = v; return x
def pop ( x, k ):
"""Returns copy of dict `x` without key `k`."""
x = copy.copy(x); del x[k]; return x
def special_diff ( lhs, rhs, k ):
# transform list of dicts into 2 levels of dicts, 1st level index by k.
lhs = dict([(D[k],pop(D,k)) for D in lhs])
rhs = dict([(D[k],pop(D,k)) for D in rhs])
# diff at the 1st level.
c = dict_diff(user_diff, lhs, rhs)
# transform to back to initial format.
return [push(D,k,K) for (K,D) in c.items()]
Затем вы можете проверить решение:
ldA = [{'user':"nameA", 'a':7.6, 'b':100.0, 'c':45.5, 'd':48.9},
{'user':"nameB", 'a':46.7, 'b':67.3, 'c':0.0, 'd':5.5}]
ldB =[{'user':"nameA", 'a':7.6, 'b':99.9, 'c':45.5, 'd':43.7},
{'user':"nameB", 'a':67.7, 'b':67.3, 'c':1.1, 'd':5.5},
{'user':"nameC", 'a':89.9, 'b':77.3, 'c':2.2, 'd':6.5}]
import pprint
if __name__ == '__main__':
pprint.pprint(special_diff(ldA, ldB, 'user'))
Ответ 2
Мой подход: постройте поиск на основе ldA значений для исключения, затем определите результат исключения соответствующих значений из каждого списка в ldB.
lookup = dict((x['user'], dict(x)) for x in ldA)
# 'dict(x)' is used here to make a copy
for v in lookup.values(): del v['user']
result = [
dict(
(k, v)
for (k, v) in item.items()
if item['user'] not in lookup or lookup[item['user']].get(k, v) == v
)
for item in ldB
]
Вы должны, однако, знать, что сравнивать значения с плавающей запятой, на которые нельзя положиться.
Ответ 3
Я собираюсь предположить, что соответствующие dict
находятся в одном порядке в обоих списках.
В этом предположении вы можете использовать следующий код:
def diffs(L1, L2):
answer = []
for i, d1 in enumerate(L1):
d = {}
d2 = L2[i]
for key in d1:
if key not in d1:
print key, "is in d1 but not in d2"
elif d1[key] != d2[key]:
d[key] = d2[key]
answer.append(d)
return answer
непроверенная. Прокомментируйте, если есть ошибки, и я исправлю их.
Ответ 4
Еще одно решение немного странно (извините, если я что-то пропустил), но он также позволяет вам настроить свою проверку равенства (вам просто нужно изменить isEqual lambda для этого), а также дать вам два разных варианта: в случае, если ключи отличаются:
ldA = [{'user':"nameA", 'a':7.6, 'b':100.0, 'c':45.5, 'd':48.9},
{'user':"nameB", 'a':46.7, 'b':67.3, 'c':0.0, 'd':5.5}]
ldB =[{'user':"nameA", 'a':7.6, 'b':99.9, 'c':45.5, 'd':43.7},
{'user':"nameB", 'a':67.7, 'b':67.3, 'c':1.1, 'd':5.5},
{'user':"nameC", 'a':89.9, 'b':77.3, 'c':2.2, 'd':6.5}]
ldA.extend((ldB.pop() for i in xrange(len(ldB)))) # get the only one list here
output = []
isEqual = lambda x,y: x != y # add your custom equality check here, for example rounding values before comparison and so on
while len(ldA) > 0: # iterate through list
row = ldA.pop(0) # get the first element in list and remove it from list
for i, srow in enumerate(ldA):
if row['user'] != srow['user']:
continue
res = {'user': srow['user']} #
# next line will ignore all keys of srow which are not in row
res.update(dict((key,val) for key,val in ldA.pop(i).iteritems() if key in row and isEqual(val, row[key])))
# next line will include the srow.key and srow.value into the results even in a case when there is no such pair in a row
#res.update(dict(filter(lambda d: isEqual(d[1], row[d[0]]) if d[0] in row else True ,ldA.pop(i).items())))
output.append(res)
break
else:
output.append(row)
print output
Ответ 5
Это определенно принимает некоторые предположения из ваших выборочных данных, главным образом, что в ldA
не будет пользователей, которые не находятся в ldB
, если это недопустимое предположение, сообщите мне.
Вы бы назвали это как dict_diff(ldA, ldB, user)
.
def dict_diff(ldA, ldB, key):
for i, dA in enumerate(ldA):
d = {key: dA[key]}
d.update(dict((k, v) for k, v in ldB[i].items() if v != dA[k]))
print "ldB -> " + str(d)
for dB in ldB[i+1:]:
print "ldB -> " + str(dB)
Ответ 6
Я написал этот инструмент некоторое время назад, теперь он может справиться с вложенными списками, dicts и sets. Дает вам вывод terser (.
в . > i:1 > 'c'
относится к верхнему уровню, а i:1
относится к индексу 1 сравниваемого списка):
compare(ldA, ldB)
. > i:0 > 'b' dict value is different:
100.0
99.9
. > i:0 > 'd' dict value is different:
48.9
43.7
. > i:1 > 'a' dict value is different:
46.7
67.7
. > i:1 > 'c' dict value is different:
0.0
1.1
. lists differed at positions: 2
['<not present>']
[{'c': 2.2, 'd': 6.5, 'a': 89.9, 'user': 'nameC', 'b': 77.3}]