Можно ли читать категориальные столбцы с помощью pandas 'read_csv?
Я попытался передать параметр dtype
с read_csv
как dtype={n: pandas.Categorical}
, но это не работает должным образом (результатом является объект). Руководство неясно.
Ответы
Ответ 1
В версии 0.19.0
вы можете использовать параметр dtype='category'
в read_csv
:
data = 'col1,col2,col3\na,b,1\na,b,2\nc,d,3'
df = pd.read_csv(StringIO(data), dtype='category')
print (df)
col1 col2 col3
0 a b 1
1 a b 2
2 c d 3
print (df.dtypes)
col1 category
col2 category
col3 category
dtype: object
Ответ 2
Категорирование не является допустимым dtype.
Этот fooobar.com/info/239909/... содержит сведения о том, как хранить категориальные данные в текстовом файле.