Pandas - pandas.DataFrame.from_csv vs pandas.read_csv

Какая разница между:

pandas.DataFrame.from_csv, doc link: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.from_csv.html

и

pandas.read_csv, doc link: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.read_csv.html

Ответы

Ответ 1

Нет реальной разницы (оба основаны на одной и той же базовой функции), но, как отмечено в комментариях, у них есть несколько разных значений по умолчанию (index_col равно 0 или None, parse_dates равно True или False для read_csv и DataFrame.from_csv соответственно) и read_csv поддерживает больше аргументов (в from_csv они просто не пройдены).

Кроме того, рекомендуется использовать pd.read_csv.
DataFrame.from_csv существует только по историческим причинам и для поддержания обратной совместимости (планы должны обесценить его, см. здесь), но все новые функции добавляются только к read_csv ( как вы можете видеть в гораздо более длинном списке аргументов ключевого слова). Фактически, это должно быть сделано более ясным в документах.

Ответ 2

Другое отличие состоит в том, что pandas.read_csv от 46x до 490x с точностью до pandas.DataFrame.from_csv (в моем тестировании).

Я тестировал его на Python 3.4.4 и pandas 0.19.2 в Windows на моем собственном файле csv.