Преобразование столбцов в строку в Pandas
У меня есть следующий DataFrame из SQL-запроса:
(Pdb) pp total_rows
ColumnID RespondentCount
0 -1 2
1 3030096843 1
2 3030096845 1
и я хочу сделать это так:
total_data = total_rows.pivot_table(cols=['ColumnID'])
(Pdb) pp total_data
ColumnID -1 3030096843 3030096845
RespondentCount 2 1 1
[1 rows x 3 columns]
total_rows.pivot_table(cols=['ColumnID']).to_dict('records')[0]
{3030096843: 1, 3030096845: 1, -1: 2}
но я хочу убедиться, что столбцы 303 выставляются как строки вместо целых чисел, поэтому я получаю следующее:
{'3030096843': 1, '3030096845': 1, -1: 2}
Ответы
Ответ 1
Одним из способов преобразования в строку является использование astype:
total_rows['ColumnID'] = total_rows['ColumnID'].astype(str)
Однако, возможно, вы ищете функцию to_json
, которая преобразует ключи в действительные json (и, следовательно, ваши ключи к строкам)
In [11]: df = pd.DataFrame([['A', 2], ['A', 4], ['B', 6]])
In [12]: df.to_json()
Out[12]: '{"0":{"0":"A","1":"A","2":"B"},"1":{"0":2,"1":4,"2":6}}'
In [13]: df[0].to_json()
Out[13]: '{"0":"A","1":"A","2":"B"}'
Примечание: вы можете передать буфер/файл, чтобы сохранить его, а также некоторые другие параметры...
Ответ 2
Здесь другая, , особенно полезная для , преобразует несколько столбцов в строку вместо одного столбца:
In [76]: import numpy as np
In [77]: import pandas as pd
In [78]: df = pd.DataFrame({
...: 'A': [20, 30.0, np.nan],
...: 'B': ["a45a", "a3", "b1"],
...: 'C': [10, 5, np.nan]})
...:
In [79]: df.dtypes ## Current datatype
Out[79]:
A float64
B object
C float64
dtype: object
## Multiple columns string conversion
In [80]: df[["A", "C"]] = df[["A", "C"]].astype(str)
In [81]: df.dtypes ## Updated datatype after string conversion
Out[81]:
A object
B object
C object
dtype: object