Список расщепления Python на основе недостающих чисел в последовательности
Я ищу самый pythonic способ разделения списка чисел на меньшие списки на основе числа, отсутствующего в последовательности. Например, если начальный список был:
seq1 = [1, 2, 3, 4, 6, 7, 8, 9, 10]
функция даст:
[[1, 2, 3, 4], [6, 7, 8, 9, 10]]
или
seq2 = [1, 2, 4, 5, 6, 8, 9, 10]
приведет к:
[[1, 2], [4, 5, 6], [8, 9, 10]]
Ответы
Ответ 1
Из документации python:
>>> # Find runs of consecutive numbers using groupby. The key to the solution
>>> # is differencing with a range so that consecutive numbers all appear in
>>> # same group.
>>> data = [ 1, 4,5,6, 10, 15,16,17,18, 22, 25,26,27,28]
>>> for k, g in groupby(enumerate(data), lambda (i,x):i-x):
... print map(itemgetter(1), g)
...
[1]
[4, 5, 6]
[10]
[15, 16, 17, 18]
[22]
[25, 26, 27, 28]
Функция groupby() из модуля itertools генерирует разрыв каждый раз, когда ключевая функция меняет свое возвращаемое значение. Фокус в том, что возвращаемое значение - это число в списке за вычетом позиции элемента в списке. Эта разница изменяется, когда в номерах есть пробел.
Функция itemgetter() из операторского модуля, вам придется импортировать это, а модуль itertools для этого примера работать.
Полный пример с вашими данными:
>>> from operator import itemgetter
>>> from itertools import *
>>> seq2 = [1, 2, 4, 5, 6, 8, 9, 10]
>>> list = []
>>> for k, g in groupby(enumerate(seq2), lambda (i,x):i-x):
... list.append(map(itemgetter(1), g))
...
>>> print list
[[1, 2], [4, 5, 6], [8, 9, 10]]
Или как понимание списка:
>>> [map(itemgetter(1), g) for k, g in groupby(enumerate(seq2), lambda (i,x):i-x)]
[[1, 2], [4, 5, 6], [8, 9, 10]]
Ответ 2
Другая опция, которая не нуждается в itertools и т.д.:
>>> data = [1, 4, 5, 6, 10, 15, 16, 17, 18, 22, 25, 26, 27, 28]
>>> spl = [0]+[i for i in range(1,len(data)) if data[i]-data[i-1]>1]+[None]
>>> [data[b:e] for (b, e) in [(spl[i-1],spl[i]) for i in range(1,len(spl))]]
... [[1], [4, 5, 6], [10], [15, 16, 17, 18], [22], [25, 26, 27, 28]]
Ответ 3
Это решение, которое работает в Python 3 (на основе предыдущих ответов, которые работают только на python 2).
>>> from operator import itemgetter
>>> from itertools import *
>>> groups = []
>>> for k, g in groupby(enumerate(seq2), lambda x: x[0]-x[1]):
>>> groups.append(list(map(itemgetter(1), g)))
...
>>> print(groups)
[[1, 2], [4, 5, 6], [8, 9, 10]]
или как понимание списка
>>> [list(map(itemgetter(1), g)) for k, g in groupby(enumerate(seq2), lambda x: x[0]-x[1])]
[[1, 2], [4, 5, 6], [8, 9, 10]]
Необходимы изменения, потому что
- Удаление параметра набора кортежей PEP 3113
- отображение возвращающего итератора вместо списка
Ответ 4
Мой метод
alist = [1, 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 15, 16, 17, 18, 20, 21, 22]
newlist = []
start = 0
end = 0
for index,value in enumerate(alist):
if index < len(alist)-1:
if alist[index+1]> value+1:
end = index +1
newlist.append(alist[start:end])
start = end
else:
newlist.append(alist[start: len(alist)])
print(newlist)
Результат
[[1, 2, 3, 4, 5, 6, 7, 8], [10, 11, 12], [15, 16, 17, 18], [20, 21, 22]]
Ответ 5
Мне больше нравится этот, потому что он не требует никаких дополнительных библиотек или специальной обработки для первого случая:
a = [1, 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 15, 16, 17, 18, 20, 21, 22]
b = []
subList = []
prev_n = -1
for n in a:
if prev_n+1 != n: # end of previous subList and beginning of next
if subList: # if subList already has elements
b.append(subList)
subList = []
subList.append(n)
prev_n = n
if subList:
b.append(subList)
print a
print b
Выход:
[1, 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 15, 16, 17, 18, 20, 21, 22]
[[1, 2, 3, 4, 5, 6, 7, 8], [10, 11, 12], [15, 16, 17, 18], [20, 21, 22]]