Ответ 1
Чтобы выбрать строку ith
, используйте iloc
:
In [31]: df_test.iloc[0]
Out[31]:
ATime 1.2
X 2.0
Y 15.0
Z 2.0
Btime 1.2
C 12.0
D 25.0
E 12.0
Name: 0, dtype: float64
Чтобы выбрать i-е значение в столбце Btime
, вы можете использовать:
In [30]: df_test['Btime'].iloc[0]
Out[30]: 1.2
Существует разница между df_test['Btime'].iloc[0]
(рекомендуется) и df_test.iloc[0]['Btime']
:
DataFrames хранят данные в столбцовых блоках (где каждый блок имеет один
DTYPE). Если сначала выбрать по столбцу, можно вернуть представление (которое
быстрее, чем возвращать копию), и исходный dtype сохраняется. Напротив,
если вы выбираете сначала по строке, и если DataFrame имеет столбцы разных
dtypes, затем Pandas копирует данные в новую серию объектов dtype. Так
Выбор столбцов немного быстрее, чем выбор строк. Таким образом, хотя
df_test.iloc[0]['Btime']
работает, df_test['Btime'].iloc[0]
немного
более эффективный.
Существует большая разница между ними, когда дело доходит до назначения.
df_test['Btime'].iloc[0] = x
влияет на df_test
, но df_test.iloc[0]['Btime']
может нет. Смотрите ниже для объяснения почему. Потому что тонкая разница в
порядок индексации имеет большое значение в поведении, лучше использовать одно назначение индексации:
df.iloc[0, df.columns.get_loc('Btime')] = x
df.iloc[0, df.columns.get_loc('Btime')] = x
(рекомендуется):
рекомендуемый способ назначать новые значения DataFrame должен избегать цепной индексации, а вместо этого использовать метод , показанный андрей,
df.loc[df.index[n], 'Btime'] = x
или
df.iloc[n, df.columns.get_loc('Btime')] = x
Последний метод немного быстрее, потому что df.loc
должен конвертировать метки строк и столбцов в
позиционные индексы, поэтому при использовании требуется немного меньше конверсии
df.iloc
вместо этого.
df['Btime'].iloc[0] = x
работает, но не рекомендуется:
Хотя это работает, оно использует то, как в настоящее время реализованы DataFrames. Нет никаких гарантий, что Pandas будет работать таким образом в будущем. В частности, он использует тот факт, что (в настоящее время) df['Btime']
всегда возвращает
просмотр (не копия), поэтому df['Btime'].iloc[n] = x
можно использовать для назначения нового значения
в n-м месте столбца Btime
в df
.
Поскольку Pandas не дает явных гарантий о том, когда индексаторы возвращают представление вместо копии, назначения, использующие цепную индексацию, обычно всегда вызывают SettingWithCopyWarning
, даже если в этом случае назначение успешно модифицирует df
:
In [22]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1])
In [24]: df['bar'] = 100
In [25]: df['bar'].iloc[0] = 99
/home/unutbu/data/binky/bin/ipython:1: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
self._setitem_with_indexer(indexer, value)
In [26]: df
Out[26]:
foo bar
0 A 99 <-- assignment succeeded
2 B 100
1 C 100
df.iloc[0]['Btime'] = x
не работает:
Напротив, назначение с df.iloc[0]['bar'] = 123
не работает, потому что df.iloc[0]
возвращает копию:
In [66]: df.iloc[0]['bar'] = 123
/home/unutbu/data/binky/bin/ipython:1: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
In [67]: df
Out[67]:
foo bar
0 A 99 <-- assignment failed
2 B 100
1 C 100
Предупреждение: я ранее предлагал df_test.ix[i, 'Btime']
. Но это не гарантирует, что вы получите значение ith
, поскольку ix
пытается индексировать по метке перед попыткой индексировать по позиции. Таким образом, если DataFrame имеет целочисленный индекс, который не в порядке сортировки, начиная с 0, то использование ix[i]
вернет строку, помеченную i
, а не строку ith
. Например,
In [1]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1])
In [2]: df
Out[2]:
foo
0 A
2 B
1 C
In [4]: df.ix[1, 'foo']
Out[4]: 'C'