Pandas: установить значения с помощью индексов (row, col)
pandas
предлагает возможность поиска по спискам индексов строк и столбцов,
In [49]: index = ['a', 'b', 'c', 'd']
In [50]: columns = ['one', 'two', 'three', 'four']
In [51]: M = pandas.DataFrame(np.random.randn(4,4), index=index, columns=columns)
In [52]: M
Out[52]:
one two three four
a -0.785841 -0.538572 0.376594 1.316647
b 0.530288 -0.975547 1.063946 -1.049940
c -0.794447 -0.886721 1.794326 -0.714834
d -0.158371 0.069357 -1.003039 -0.807431
In [53]: M.lookup(index, columns) # diagonal entries
Out[53]: array([-0.78584142, -0.97554698, 1.79432641, -0.8074308 ])
Я хотел бы использовать этот же метод индексирования для установки элементов M
. Как я могу это сделать?
Ответы
Ответ 1
Я не уверен, что следую за вами, но вы используете DataFrame.ix
для выбора/установки отдельных элементов:
In [79]: M
Out[79]:
one two three four
a -0.277981 1.500188 -0.876751 -0.389292
b -0.705835 0.108890 -1.502786 -0.302773
c 0.880042 -0.056620 -0.550164 -0.409458
d 0.704202 0.619031 0.274018 -1.755726
In [75]: M.ix[0]
Out[75]:
one -0.277981
two 1.500188
three -0.876751
four -0.389292
Name: a
In [78]: M.ix[0,0]
Out[78]: -0.27798082190723405
In [81]: M.ix[0,0] = 1.0
In [82]: M
Out[82]:
one two three four
a 1.000000 1.500188 -0.876751 -0.389292
b -0.705835 0.108890 -1.502786 -0.302773
c 0.880042 -0.056620 -0.550164 -0.409458
d 0.704202 0.619031 0.274018 -1.755726
In [84]: M.ix[(0,1),(0,1)] = 1
In [85]: M
Out[85]:
one two three four
a 1.000000 1.000000 -0.876751 -0.389292
b 1.000000 1.000000 -1.502786 -0.302773
c 0.880042 -0.056620 -0.550164 -0.409458
d 0.704202 0.619031 0.274018 -1.755726
Вы также можете обрезать индексы:
In [98]: M.ix["a":"c","one"] = 2.0
In [99]: M
Out[99]:
one two three four
a 2.000000 1.000000 -0.876751 -0.389292
b 2.000000 1.000000 -1.502786 -0.302773
c 2.000000 -0.056620 -0.550164 -0.409458
d 0.704202 0.619031 0.274018 -1.755726
Ответ 2
Прошло несколько лет с момента написания этого ответа, поэтому, хотя я мог бы внести небольшой вклад. При рефакторинге pandas, попытке установить значение в месте с
M.iloc[index][col]
Может дать вам предупреждение о попытке установить значение в срезе.
SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame
See the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
Я считаю, что более "питонический" способ сделать это в настоящее время - с помощью инструкции pandas.DataFrame.set_value. Обратите внимание, что эта инструкция возвращает полученный DataFrame.
M.set_value(index,column,new_value)
Я просто подумал, что я разместил это здесь, когда выясню источник предупреждений, которые могут быть сгенерированы подходами .iloc или .ix.
Метод set_value также работает для мультииндекса DataFrames, помещая несколько уровней индекса в виде кортежа (например, заменяя столбец (col, subcol))