Ответ 1
x[x > 0].stack().index.tolist()
Скажем, у меня есть Pandas DataFrame, и я хочу получить список кортежей формы [(index1, column1), (index2, column2)...], описывающих расположение всех элементов DataFrame, где некоторые условие истинно. Например:
x = pd.DataFrame(np.random.normal(0, 1, (4,4)), index=['a', 'b', 'c', 'd'],
columns=['e', 'f', 'g', 'h'])
x
e f g h
a -1.342571 -0.274879 -0.903354 -1.458702
b -1.521502 -1.135800 -1.147913 1.829485
c -1.199857 0.458135 -1.993701 -0.878301
d 0.485599 0.286608 -0.436289 -0.390755
y = x > 0
Есть ли способ получить:
x.loc[y]
Для возврата:
[(b, h), (c,f), (d, e), (d,f)]
Или какой-то эквивалент? Очевидно, я могу сделать:
postup = []
for i in x.index:
for j in x.columns:
if x.loc[i, j] > 0:
postup.append((i, j))
Но я предполагаю, что что-то лучшее может быть возможно/уже реализовано. В Matlab функция find в сочетании с sub2ind выполняет задание.
x[x > 0].stack().index.tolist()
В моем подходе используется MultiIndex
:
#make it a multi-indexed Series
stacked = y.stack()
#restrict to where it True
true_stacked = stacked[stacked]
#get index as a list of tuples
result = true_stacked.index.tolist()
Если для каждого индекса строки требуется один кортеж:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.normal(0, 1, (4,4)), index=['a', 'b', 'c', 'd'], columns=['e', 'f', 'g', 'h'])
# build column replacement
column_dict = {}
for col in [{col: {True: col}} for col in df.columns]:
column_dict.update(col)
# replace where > 0
df = (df>0).replace(to_replace=column_dict)
# convert to tuples and drop 'False' values
[tuple(y for y in x if y != False) for x in df.to_records()]