Сортировка списка на основе значений из другого списка?
У меня есть список строк, как это:
X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0, 1, 1, 0, 1, 2, 2, 0, 1]
Какой самый короткий способ сортировки X, используя значения из Y, чтобы получить следующий вывод?
["a", "d", "h", "b", "c", "e", "i", "f", "g"]
Порядок элементов, имеющих одинаковый "ключ", не имеет значения. Я могу прибегнуть к использованию for
конструкций, но мне любопытно, если есть более короткий путь. Какие-либо предложения?
Ответы
Ответ 1
Самый короткий код
[x for _,x in sorted(zip(Y,X))]
Пример:
X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0, 1, 1, 0, 1, 2, 2, 0, 1]
Z = [x for _,x in sorted(zip(Y,X))]
print(Z) # ["a", "d", "h", "b", "c", "e", "i", "f", "g"]
Вообще говоря
[x for _, x in sorted(zip(Y,X), key=lambda pair: pair[0])]
Разъяснения:
-
zip
два list
s.
- создайте новый, отсортированный
list
на основе zip
, используя sorted()
.
- используя понимание списка, извлеките первые элементы каждой пары из отсортированного, zipped
list
.
Для получения дополнительной информации о том, как установить\использовать параметр key
, а также функцию sorted
в общем случае, посмотрите this.
Ответ 2
Соедините два списка вместе, сортируйте их, затем возьмите нужные части:
>>> yx = zip(Y, X)
>>> yx
[(0, 'a'), (1, 'b'), (1, 'c'), (0, 'd'), (1, 'e'), (2, 'f'), (2, 'g'), (0, 'h'), (1, 'i')]
>>> yx.sort()
>>> yx
[(0, 'a'), (0, 'd'), (0, 'h'), (1, 'b'), (1, 'c'), (1, 'e'), (1, 'i'), (2, 'f'), (2, 'g')]
>>> x_sorted = [x for y, x in yx]
>>> x_sorted
['a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g']
Объедините их вместе, чтобы получить:
[x for y, x in sorted(zip(Y, X))]
Ответ 3
Кроме того, если вы не против использования массивов numpy (или на самом деле уже имеете дело с массивами numpy...), вот еще одно приятное решение:
people = ['Jim', 'Pam', 'Micheal', 'Dwight']
ages = [27, 25, 4, 9]
import numpy
people = numpy.array(people)
ages = numpy.array(ages)
inds = ages.argsort()
sortedPeople = people[inds]
Я нашел его здесь:
http://scienceoss.com/sort-one-list-by-another-list/
Ответ 4
Наиболее очевидным решением для меня является использование ключевого слова key
.
>>> X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
>>> Y = [ 0, 1, 1, 0, 1, 2, 2, 0, 1]
>>> keydict = dict(zip(X, Y))
>>> X.sort(key=keydict.get)
>>> X
['a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g']
Обратите внимание, что вы можете сократить это до однострочного, если хотите:
>>> X.sort(key=dict(zip(X, Y)).get)
Ответ 5
Мне нравится иметь список отсортированных индексов. Таким образом, я могу отсортировать любой список в том же порядке, что и список источников. Если у вас есть список отсортированных индексов, простое понимание списка поможет вам:
X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0, 1, 1, 0, 1, 2, 2, 0, 1]
sorted_y_idx_list = sorted(range(len(Y)),key=lambda x:Y[x])
Xs = [X[i] for i in sorted_y_idx_list ]
print( "Xs:", Xs )
# prints: Xs: ["a", "d", "h", "b", "c", "e", "i", "f", "g"]
Обратите внимание, что отсортированный список индексов также можно получить с помощью numpy.argsort()
.
Ответ 6
Другая альтернатива, сочетающая несколько ответов.
zip(*sorted(zip(Y,X)))[1]
Чтобы работать на python3:
list(zip(*sorted(zip(B,A))))[1]
Ответ 7
Я действительно пришел сюда, чтобы отсортировать список по списку, в котором сопоставляются значения.
list_a = ['foo', 'bar', 'baz']
list_b = ['baz', 'bar', 'foo']
sorted(list_b, key=lambda x: list_a.index(x))
# ['foo', 'bar', 'baz']
Ответ 8
more_itertools
есть инструмент для параллельной сортировки итераций:
from more_itertools import sort_together
sort_together([Y, X])[1]
# ('a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g')
Ответ 9
zip, сортировка по второму столбцу, возврат первого столбца.
zip(*sorted(zip(X,Y), key=operator.itemgetter(1)))[0]
Ответ 10
Быстрый однострочный.
list_a = [5,4,3,2,1]
list_b = [1,1.5,1.75,2,3,3.5,3.75,4,5]
Предположим, вы хотите, чтобы список a соответствовал списку b.
orderedList = sorted(list_a, key=lambda x: list_b.index(x))
Это полезно, когда нужно заказывать меньший список значений в больших размерах. Предполагая, что более крупный список содержит все значения в меньшем списке, это можно сделать.
Ответ 11
Вы можете создать pandas Series
, используя основной список как data
, а другой список - как index
, а затем просто отсортировать по индексу:
import pandas as pd
pd.Series(data=X,index=Y).sort_index().tolist()
выход:
['a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g']
Ответ 12
Вот ответ Whatangs, если вы хотите получить оба отсортированных списка (python3).
X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0, 1, 1, 0, 1, 2, 2, 0, 1]
Zx, Zy = zip(*[(x, y) for x, y in sorted(zip(Y, X))])
print(list(Zx)) # [0, 0, 0, 1, 1, 1, 1, 2, 2]
print(list(Zy)) # ['a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g']
Просто помните, что Zx и Zy являются кортежами.
Я также блуждаю, если есть лучший способ сделать это.
Предупреждение: Если вы запустите его с пустыми списками, он сработает.
Ответ 13
Я создал более общую функцию, которая сортирует более двух списков на основе другой, вдохновленной ответом @Whatang.
def parallel_sort(*lists):
"""
Sorts the given lists, based on the first one.
:param lists: lists to be sorted
:return: a tuple containing the sorted lists
"""
# Create the initially empty lists to later store the sorted items
sorted_lists = tuple([] for _ in range(len(lists)))
# Unpack the lists, sort them, zip them and iterate over them
for t in sorted(zip(*lists)):
# list items are now sorted based on the first list
for i, item in enumerate(t): # for each item...
sorted_lists[i].append(item) # ...store it in the appropriate list
return sorted_lists
Ответ 14
list1 = ['a','b','c','d','e','f','g','h','i']
list2 = [0,1,1,0,1,2,2,0,1]
output=[]
cur_loclist = []
Чтобы получить уникальные значения в list2
list_set = set(list2)
Чтобы найти loc для индекса в list2
list_str = ''.join(str(s) for s in list2)
Расположение индекса в list2
отслеживается с помощью cur_loclist
[0, 3, 7, 1, 2, 4, 8, 5, 6]
for i in list_set:
cur_loc = list_str.find(str(i))
while cur_loc >= 0:
cur_loclist.append(cur_loc)
cur_loc = list_str.find(str(i),cur_loc+1)
print(cur_loclist)
for i in range(0,len(cur_loclist)):
output.append(list1[cur_loclist[i]])
print(output)