Выберите данные на определенном уровне из MultiIndex
У меня есть следующий Pandas Dataframe с MultiIndex (Z, A):
H1 H2
Z A
0 100 200 0.3112 -0.4197
1 100 201 0.2967 0.4893
2 100 202 0.3084 -0.4873
3 100 203 0.3069 NaN
4 101 203 -0.4956 NaN
Вопрос: Как выбрать все элементы с A = 203?
Я пробовал df[:,'A']
, но он не работает. Затем я нашел это в онлайн-документации, поэтому я попробовал:
df.xs(203,level='A')
но я получаю:
"TypeError: xs() got an unexpected keyword argument 'level'
"
Также я не вижу этот параметр в установленном документе (df.xs?
):
"Параметры ---------- key: object Некоторая метка, содержащаяся в индексе, или частично в оси MultiIndex: int, по умолчанию 0 Ось для получения поперечного сечения на копии: boolean, по умолчанию True Следует ли делать копия данных"
Примечание. У меня есть версия для разработки.
Изменить: я нашел этот поток. Они рекомендуют что-то вроде:
df.select(lambda x: x[1]==200, axis=0)
Мне все же хотелось бы узнать, что произошло с df.xs с параметром уровня или тем, что рекомендуется в текущей версии.
Ответы
Ответ 1
Проблема заключается в моем предположении (неправильном), что я был в dev-версии, в то время как в действительности у меня был 1.6.1, можно проверить текущую установленную версию с помощью
import pandas
print pandas.__version__
в текущей версии df.xs()
с параметром уровня работает нормально.
Ответ 2
Не прямой ответ на вопрос, но если вы хотите выбрать более одного значения, вы можете использовать обозначение "slice()":
import numpy
from pandas import MultiIndex, Series
arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'],
['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']]
tuples = list(zip(*arrays))
index = MultiIndex.from_tuples(tuples, names=['first', 'second'])
s = Series(numpy.random.randn(8), index=index)
In [10]: s
Out[10]:
first second
bar one 0.181621
two 1.016225
baz one 0.716589
two -0.353731
foo one -0.326301
two 1.009143
qux one 0.098225
two -1.087523
dtype: float64
In [11]: s.loc[slice(None)]
Out[11]:
first second
bar one 0.181621
two 1.016225
baz one 0.716589
two -0.353731
foo one -0.326301
two 1.009143
qux one 0.098225
two -1.087523
dtype: float64
In [12]: s.loc[slice(None), "one"]
Out[12]:
first
bar 0.181621
baz 0.716589
foo -0.326301
qux 0.098225
dtype: float64
In [13]: s.loc["bar", slice(None)]
Out[13]:
first second
bar one 0.181621
two 1.016225
dtype: float64