Отрицательное индексирование R в Python. Не принимайте кусочки

Головка программирования My R подключена для использования отрицательных индексов резки для исключения элементов.

В качестве примера:

my_list = [0,1,2,3,4,5,6,7,8,9]
my_neg_slice = [-2, -8, 0, -5]

Вернет

[1 3 4 6 7 9]

то есть. вернуть все индексы не в (0, 2, 5, 8).

Это больше вопрос, удовлетворяющий мое любопытство, поскольку отрицательное индексирование Pythonic для меня совершенно новое (это не критика реализации Python, поскольку мне это очень нравится). Кто-нибудь реализовал R_Style_Negative_Indexing в Python? Я очень новичок в Python, поэтому этот тип индексирования может уже существовать? Возможно, кто-то создал пользовательское расширение (извините, если это не правильная терминология), чтобы расширить соответствующую библиотеку?

Очевидно, это было бы очень сложно реализовать для строк, но я надеюсь, что люди смогут увидеть концепцию желания перерезать объект (List, Dict, DataFrame,...), исключив набор известных разреженных элементов

Мой неандертальский способ выполнить отрицательную индексацию в стиле R в Python:

import numpy as np

my_list = [0,1,2,3,4,5,6,7,8,9]
my_neg_slice = [-2, -8, 0, -5]

# Convert my_list to a numpy array as it much easier to work with
step0 = np.array(my_list)

# Same for the negative_slices
step1 = np.array(my_neg_slice)

# Identify the indexes that are negative (assume 0 implies exclude)
step2 = step1 <= 0

# For the negative indexes, flip the sign so they are positive
step3 = -step1[step2]

# Generate the complete index for my_list
step4 = np.arange(len(my_list))

# Identify the indices required by exlucing my_neg_slice indices
step5 = np.setdiff1d(step4, step3)

# Make a cup of tea! Maybe time to rewire the brain and think like a snake!
step6 = step0[step5]

print(step6)
[1 3 4 6 7 9]

У меня нет особой проблемы, которую я пытаюсь взломать, я просто ищу, чтобы понять свое понимание возможностей с индексацией? Спасибо заранее. Берти.

Ответы

Ответ 1

Поскольку вы отметили этот pandas, давайте сделаем my_list a Series:

In [11]: my_list = pd.Series(my_list)

и пусть фактически использовать (более питонический) "отрицательный индекс" для использования положительных значений, если мы не хотим этого делать, тогда используйте понимание списка для этой части с тем же эффектом (или если это было само множество или Series, просто возьмите -my_neg_slice):

In [12]: my_neg_slice = [2, 8, 0, 5]

Тогда, поскольку индекс my_list является просто перечислением (в этом случае), мы можем вычесть:

In [13]: my_list.index - my_neg_slice
Out[13]: Int64Index([1, 3, 4, 6, 7, 9], dtype=int64)

и посмотрите на эти элементы в остальных позициях:

In [14]: my_list.iloc[my_list.index - my_neg_slice]
Out[14]: 
1    1
3    3
4    4
6    6
7    7
9    9
dtype: int64

Ответ 2

Удивленный никто не упомянул метод drop в pandas:

In [8]: s
Out[8]: 
0    0
1    1
2    2
3    3
4    4
5    5
6    6
7    7
8    8
9    9
dtype: int64

In [9]: s.drop([2, 8, 0, 5])
Out[9]: 
1    1
3    3
4    4
6    6
7    7
9    9
dtype: int64

Ответ 3

Используйте наборы:

>>> set([0,1,2,3,4,5,6,7,8,9]) - set([0,2,5,8])
set([1, 3, 4, 6, 7, 9])

(используйте положительные значения вместо отрицательных).

Ответ 4

Это использует немного другой формат для my_neg_slice, но следующим является метод Pythonic для фильтрации итерации в том, как вы описываете:

>>> my_list = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> my_neg_slice = set([2, 8, 0, 5])
>>> [x for i, x in enumerate(my_list) if i not in my_neg_slice]
[1, 3, 4, 6, 7, 9]

Ответ 5

Это интересный вопрос! Я думал, что попытаюсь предоставить версию numpy. Насколько я знаю, он должен будет полагаться на процесс, подобный тому, который вы дали, когда вы создали список индексов в данных, а затем устранили те, которые вам не нужны.

mask = np.ones(len(my_list), dtype=bool)
for i in my_neg_slice:
    mask[i] = False
my_list[mask]

Немного расточительно, однако, в том смысле, что в вашем массиве масок должно быть столько элементов, сколько my_list. Ответ @F.J хорош, потому что он сохраняет разреженность "не в" фрагменте.

Update

Просто нашел сообщение для рассылки numpy, которое, похоже, подтверждает, что вам нужно будет сделать это, используя какую-то маскировку: http://mail.scipy.org/pipermail/numpy-discussion/2008-May/034021.html