Ответ 1
# To sort the list in place...
ut.sort(key=lambda x: x.count, reverse=True)
# To return a new list, use the sorted() built-in function...
newlist = sorted(ut, key=lambda x: x.count, reverse=True)
Подробнее о сортировке по ключам.
У меня есть список объектов Python, которые я хотел бы отсортировать по атрибуту самих объектов. Список выглядит следующим образом:
>>> ut
[<Tag: 128>, <Tag: 2008>, <Tag: <>, <Tag: actionscript>, <Tag: addresses>,
<Tag: aes>, <Tag: ajax> ...]
Каждый объект имеет счетчик:
>>> ut[1].count
1L
Мне нужно отсортировать список по количеству убывающих счетчиков.
Я видел несколько методов для этого, но я ищу лучшую практику в Python.
# To sort the list in place...
ut.sort(key=lambda x: x.count, reverse=True)
# To return a new list, use the sorted() built-in function...
newlist = sorted(ut, key=lambda x: x.count, reverse=True)
Подробнее о сортировке по ключам.
Самый быстрый способ, особенно если в вашем списке много записей, - использовать operator.attrgetter("count")
. Однако это может выполняться на предоператорной версии Python, поэтому было бы неплохо иметь запасной механизм. Тогда вы можете сделать следующее:
try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it faster than lambda
ut.sort(key=keyfun, reverse=True) # sort in-place
Читатели должны заметить, что ключ = метод:
ut.sort(key=lambda x: x.count, reverse=True)
во много раз быстрее, чем добавление к объектам ярких операторов сравнения. Я был удивлен, прочитав это (стр. 485 "Python в двух словах" ). Вы можете подтвердить это, выполнив тесты по этой маленькой программе:
#!/usr/bin/env python
import random
class C:
def __init__(self,count):
self.count = count
def __cmp__(self,other):
return cmp(self.count,other.count)
longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]
longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs
Мои, очень минимальные тесты показывают, что первый сорт более чем в 10 раз медленнее, но в книге говорится, что в целом он всего лишь в 5 раз медленнее. Причина, по которой они говорят, объясняется очень оптимизированным алгоритмом сортировки, используемым в python (timsort).
Тем не менее, очень странно, что .sort(lambda) быстрее, чем простой старый .sort(). Надеюсь, они это исправит.
from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)
Объектно-ориентированный подход
Хорошей практикой является сделать логику сортировки объектов, если это применимо, свойством класса, а не включенным в каждом случае, когда требуется упорядочение.
Это обеспечивает согласованность и устраняет необходимость использования стандартного кода.
Как минимум, вы должны указать __eq__
и __lt__
чтобы это работало. Тогда просто используйте sorted(list_of_objects)
.
class Card(object):
def __init__(self, rank, suit):
self.rank = rank
self.suit = suit
def __eq__(self, other):
return self.rank == other.rank and self.suit == other.suit
def __lt__(self, other):
return self.rank < other.rank
hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand] # [10, 2, 12, 13, 14]
hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted] # [2, 10, 12, 13, 14]
Он очень похож на список экземпляров модели Django ORM.
Почему бы не отсортировать их по запросу:
ut = Tag.objects.order_by('-count')
Добавьте богатых операторов сравнения в класс объектов, затем используйте метод sort() списка.
См. богатое сравнение в python.
Обновить. Хотя этот метод будет работать, я думаю, что решение от Triptych лучше подходит для вашего случая, потому что проще.
Если атрибут, по которому вы хотите отсортировать, является свойством, тогда вы можете избежать импорта operator.attrgetter
и использовать метод свойства fget
.
Например, для класса Circle
со свойством radius
мы могли бы отсортировать список circles
по радиусам следующим образом:
result = sorted(circles, key=Circle.radius.fget)
Это не самая известная функция, но она часто спасает меня от необходимости импорта.