Удаление дубликатов списка наборов
У меня есть список наборов:
L = [set([1, 4]), set([1, 4]), set([1, 2]), set([1, 2]), set([2, 4]), set([2, 4]), set([5, 6]), set([5, 6]), set([3, 6]), set([3, 6]), set([3, 5]), set([3, 5])]
(фактически в моем случае преобразование списка взаимных кортежей)
и я хочу удалить дубликаты, чтобы получить:
L = [set([1, 4]), set([1, 2]), set([2, 4]), set([5, 6]), set([3, 6]), set([3, 5])]
Но если я попробую:
>>> list(set(L))
TypeError: unhashable type: 'set'
или
>>> list(np.unique(L))
TypeError: cannot compare sets using cmp()
Как получить список наборов с различными наборами?
Ответы
Ответ 1
Лучший способ - преобразовать ваши наборы в frozenset
(которые являются хешируемыми), а затем использовать set
для получения только уникальных наборов, таких как
>>> list(set(frozenset(item) for item in L))
[frozenset({2, 4}),
frozenset({3, 6}),
frozenset({1, 2}),
frozenset({5, 6}),
frozenset({1, 4}),
frozenset({3, 5})]
Если вы хотите, чтобы они были как наборы, вы можете преобразовать их обратно в set
следующим образом
>>> [set(item) for item in set(frozenset(item) for item in L)]
[{2, 4}, {3, 6}, {1, 2}, {5, 6}, {1, 4}, {3, 5}]
Если вы хотите, чтобы заказ также поддерживался, удаляя дубликаты, вы можете использовать collections.OrderedDict
, например
>>> from collections import OrderedDict
>>> [set(i) for i in OrderedDict.fromkeys(frozenset(item) for item in L)]
[{1, 4}, {1, 2}, {2, 4}, {5, 6}, {3, 6}, {3, 5}]
Ответ 2
Альтернатива с использованием цикла:
result = list()
for item in L:
if item not in result:
result.append(item)
Ответ 3
Вот еще одна альтернатива
yourNewSet = map(set,list(set(map(tuple,yourSet))))
Ответ 4
Есть и другая альтернатива.
import itertools
list_sets = [set(['a', 'e', 'f']), set(['c', 'b', 'f']), set(['a', 'e', 'f']), set(['a', 'd']), set(['a', 'e', 'f'])]
lists = [list(s) for s in list_sets] # convert a list of sets to a list of lists
lists.sort()
lists_remove_duplicates = [lists for lists,_ in itertools.groupby(lists)]
print(lists_remove_duplicates)
# output
[['a', 'd'], ['a', 'e', 'f'], ['c', 'b', 'f']]