pandas to_csv аргументы float_format и десятичные числа не работают для столбца индекса
Задний план
Я делаю некоторые симуляции соответственно. системный анализ путем изменения параметров (в данном случае только rpm
) и добавление каждой последней строки результатов results_df
к суммирующему файлу данных df
содержащему предоставление функции моей системы в зависимости от измененных rpm
.
Чтобы получить соответствующий индекс для построения графика и анализа данных, я преобразовал различные значения (здесь rpm
) из списка в серию pandas ser
и выполнил эту серию с суммирующим информационным фреймом df
содержащим интересующие меня результаты.
Поскольку результаты каждого вычисления меня интересуют, это только последняя строка каждого вычисления. Я извлекаю эти данные из результатов results_df
с помощью .tail(1)
.
То, что я сделал до сих пор, показано в следующем фрагменте:
rpm = [0.25, 0.3, 0.5, 0.75, 1.0, 1.5, 2.0]
ser = pd.Series(rpm, name='rpm')
df = pd.DataFrame()
df_list = list()
for i, val in enumerate(rpm):
results_df = get_some_data_from_somwhere()
df_list.append(results_df.tail(1))
df = df.append(df_list, ignore_index=True)
df = pd.concat([df, ser], axis=1)
df.set_index('rpm', inplace=True)
with open('foo.csv', 'w') as f:
data.to_csv(f, index=True, header=True, decimal=',', sep=' ', float_format='%.3f')
проблема
Этот CSV файл, который я получаю, имеет следующий формат:
rpm cooling_inner heating_inner cooling_outlet heating_outlet
0.25 303,317 323,372 302,384 324,332
Тем не менее, я ожидал наличия трех десятичных цифр и запятой в качестве десятичного знака в моем индексном столбце, как показано здесь:
rpm cooling_inner heating_inner cooling_outlet heating_outlet
0,250 303,317 323,372 302,384 324,332
Похоже, что параметры index
и decimal
знака не применяются к столбцу индекса при экспорте данных в csv файлы с помощью команды .to_csv
.
Как я мог добиться такого поведения, поскольку параметр index
установлен True
а все значения (с исключением столбца индекса) имеют правильный формат и десятичный знак?
Должен ли я обрабатывать индексный столбец как-то отдельно?
Ответы
Ответ 1
Я бы переписал ваши две нижние строки:
with open('foo.csv', 'w') as f:
data.to_csv(f, index=True, header=True, decimal=',', sep=' ', float_format='%.3f')
В
data.reset_index().to_csv('foo.csv', index=False, header=True, decimal=',', sep=' ', float_format='%.3f')
Это немного обходное решение, но, как вы заметили, аргументы ключевого слова decimal=
и float_format=
работают только с столбцами данных, а не по индексу.
Вместо этого я должен помещать индекс в reset_index
с помощью reset_index
а затем я to_csv(index=False
не сохранять индекс в файл (поскольку он теперь находится в данных).
Кроме того, открытие самого потока файлов (with open('foo.csv', 'w') as f:
лучше оставить pandas, что делает это само по себе, когда вы просто передаете ему строку 'foo.csv'
качестве первой аргумент.