Поиск равных значений из списка списка кортежей в Python
После многократного поиска мне нужна помощь.
У меня есть список списков кортежей. Каждый список внутри списка списка представляет собой определенное количество формул в моей системе. Любой элемент в этом списке является кортежем, который представляет тип элемента (переменная, параметр, константа, операция...) и имя элемента. Например, для формул x1 + x2 + A1, x1-x3 и sin (x2) + A1 мы будем иметь:
[
[('VAR', 'x1'), ('PLUS', '+'), ('VAR', 'x2'), ('PLUS', '+'), ('PAR', 'A1')],
[('VAR', 'x1'), ('LESS', '-'), ('VAR', 'x3')],
[('SIN', 'sin'), ('VAR', 'x2'), ('PLUS', '+'), ('PAR', 'A1')]
]
Я пытаюсь определить, в какой формуле появляется каждая переменная. В приведенном выше примере я имею, что переменная x1 имеет формулу 1 и 2, переменная x2 находится по формуле 1 и 3 и x3 в формуле 2, поэтому мой вывод будет примерно таким:
[
['x1', 1, 2],
['x2', 1, 3],
['x3', 2],
]
В настоящий момент у меня очень неэффективный код, который вообще не работает, но вот он:
cont = 0
for subL1 in L:
for subL2 in L:
if len(subL1) != 1 and len(subL2) != 1:
if subL1 != subL2 and subL2:
for x,y in subL1:
for z,t in subL2:
if ( x == 'VAR'
and z == 'VAR'
and y == t
):
print "Variable", y , "repeated"
else:
print "list with 1 lenght\n"
subL1.pop(0)
cont = cont + 1
Ответы
Ответ 1
Вы можете использовать collections.defaultdict
для хранения формул (фактически индексов внутри списка списков) для каждой переменной:
from collections import defaultdict
dd = defaultdict(set) # use a set as factory so we don't keep duplicates
for idx, subl in enumerate(l, 1): # iterate over the sublists with index starting at 1
for subt in subl: # iterate over each tuple in each sublist
label, val = subt # unpack the tuple
if label == 'VAR': # if it a VAR save the index in the defaultdict
dd[val].add(idx)
Например:
l = [[('VAR', 'x1'), ('PLUS', '+'), ('VAR', 'x2'), ('PLUS', '+'), ('PAR', 'A1')],
[('VAR', 'x1'), ('LESS', '-'), ('VAR', 'x3')],
[('SIN', 'sin'), ('VAR', 'x2'), ('PLUS', '+'), ('PAR', 'A1')]
]
Он дает:
print(dd)
# defaultdict(set, {'x1': {1, 2}, 'x2': {1, 3}, 'x3': {2}})
Чтобы получить желаемый результат, вам нужно только преобразовать его в список, например (только для python-3.x):
>>> [[name, *sorted(formulas)] for name, formulas in sorted(dd.items())]
[['x1', 1, 2], ['x2', 1, 3], ['x3', 2]]
Ответ 2
formula = [
[('VAR', 'x1'), ('PLUS', '+'), ('VAR', 'x2'), ('PLUS', '+'), ('PAR', 'A1')],
[('VAR', 'x1'), ('LESS', '-'), ('VAR', 'x3')],
[('SIN', 'sin'), ('VAR', 'x2'), ('PLUS', '+'), ('PAR', 'A1')]
]
variables = collections.defaultdict(set)
for line_no, line in enumerate(formula):
for typ, value in line:
if typ == 'VAR':
variables[value].add(line_no)
variables
defaultdict (set, {'x1': {0, 1}, 'x2': {0, 2}, 'x3': {1}})