Ответ 1
sorted_by_second = sorted(data, key=lambda tup: tup[1])
или
data.sort(key=lambda tup: tup[1]) # sorts in place
У меня есть некоторые данные в списке списков или в списке кортежей, например:
data = [[1,2,3], [4,5,6], [7,8,9]]
data = [(1,2,3), (4,5,6), (7,8,9)]
И я хочу отсортировать по 2-му элементу в подмножестве. Имеется в виду сортировка по 2,5,8, где 2
из (1,2,3)
, 5
из (4,5,6)
. Каков общий способ сделать это? Должен ли я хранить кортежи или списки в моем списке?
sorted_by_second = sorted(data, key=lambda tup: tup[1])
или
data.sort(key=lambda tup: tup[1]) # sorts in place
from operator import itemgetter
data.sort(key=itemgetter(1))
Я просто хочу добавить к Стивену ответ, если вы хотите отсортировать массив с высокой до низкой, иначе, чем в комментариях выше, просто добавьте это в строку:
reverse = True
и результат будет следующим:
data.sort(key=lambda tup: tup[1], reverse=True)
Для сортировки по нескольким критериям, а именно, например, вторым и третьим элементами в кортеже, пусть
data = [(1,2,3),(1,2,1),(1,1,4)]
и поэтому определите лямбда, которая возвращает кортеж, который описывает приоритет, например
sorted(data, key=lambda tup: (tup[1],tup[2]) )
[(1, 1, 4), (1, 2, 1), (1, 2, 3)]
Ответ Стивена - тот, который я бы использовал. Для полноты, вот шаблон DSU (decorate-sort-undecorate) со списком:
decorated = [(tup[1], tup) for tup in data]
decorated.sort()
undecorated = [tup for second, tup in decorated]
Или, более кратко:
[b for a,b in sorted((tup[1], tup) for tup in data)]
Как отмечено в Python Sorting HowTo, это было ненужным со времен Python 2.4, когда стали доступны ключевые функции.
Чтобы отсортировать список кортежей (<word>, <count>)
, для count
в порядке убывания и word
в алфавитном порядке:
data = [
('betty', 1),
('bought', 1),
('a', 1),
('bit', 1),
('of', 1),
('butter', 2),
('but', 1),
('the', 1),
('was', 1),
('bitter', 1)]
Я использую этот метод:
sorted(data, key=lambda tup:(-tup[1], tup[0]))
и это дает мне результат:
[('butter', 2),
('a', 1),
('betty', 1),
('bit', 1),
('bitter', 1),
('bought', 1),
('but', 1),
('of', 1),
('the', 1),
('was', 1)]
Без лямбды
def sec_elem(s): return s[1]
sorted(data, key=sec_elem)
@Стефен ответ в точку! Вот пример лучшей визуализации,
Кричите поклонников Ready Player One! =)
>>> gunters = [('2044-04-05', 'parzival'), ('2044-04-07', 'aech'), ('2044-04-06', 'art3mis')]
>>> gunters.sort(key=lambda tup: tup[0])
>>> print gunters
[('2044-04-05', 'parzival'), ('2044-04-06', 'art3mis'), ('2044-04-07', 'aech')]
key
- это функция, которая будет вызываться для преобразования элементов коллекции для сравнения. Например, метод compareTo
в Java.
Параметр, передаваемый на ключ, должен быть чем-то вызываемым. Здесь использование lambda
создает анонимную функцию (которая является вызываемой).
Синтаксисом лямбда является слово lambda, за которым следует итерируемое имя, а затем один блок кода.
Ниже примера мы сортируем список кортежей, который содержит информацию об абсолютном времени определенного имени события и имени актера.
Мы сортируем этот список по времени возникновения события - который является 0-м элементом кортежа.
Примечание. s.sort([cmp[, key[, reverse]]])
сортирует элементы s на месте
itemgetter()
несколько быстрее, чем lambda tup: tup[1]
, но увеличение относительно скромное (около 10-25%).
(сеанс IPython)
>>> from operator import itemgetter
>>> from numpy.random import randint
>>> values = randint(0, 9, 30000).reshape((10000,3))
>>> tpls = [tuple(values[i,:]) for i in range(len(values))]
>>> tpls[:5] # display sample from list
[(1, 0, 0),
(8, 5, 5),
(5, 4, 0),
(5, 7, 7),
(4, 2, 1)]
>>> sorted(tpls[:5], key=itemgetter(1)) # example sort
[(1, 0, 0),
(4, 2, 1),
(5, 4, 0),
(8, 5, 5),
(5, 7, 7)]
>>> %timeit sorted(tpls, key=itemgetter(1))
100 loops, best of 3: 4.89 ms per loop
>>> %timeit sorted(tpls, key=lambda tup: tup[1])
100 loops, best of 3: 6.39 ms per loop
>>> %timeit sorted(tpls, key=(itemgetter(1,0)))
100 loops, best of 3: 16.1 ms per loop
>>> %timeit sorted(tpls, key=lambda tup: (tup[1], tup[0]))
100 loops, best of 3: 17.1 ms per loop
Сортировка кортежа довольно проста:
tuple(sorted(t))