Пропустить строки во время импорта csv pandas
Я пытаюсь импортировать файл .csv, используя pandas.read_csv()
, однако я не хочу импортировать 2-ую строку файла данных (строка с index = 1 для 0-индексации).
Я не вижу, как не импортировать его, потому что аргументы, используемые с командой, кажутся неоднозначными:
С сайта панд:
skiprows
: список или целое число
Номера строк, которые нужно пропустить (0-индексированные) или количество строк, которые нужно пропустить (int) в начале файла. "
Если я skiprows=1
в аргументах, как он узнает, пропустить ли первую строку или пропустить строку с индексом 1?
Ответы
Ответ 1
Вы можете попробовать себя:
>>> import pandas as pd
>>> from StringIO import StringIO
>>> s = """1, 2
... 3, 4
... 5, 6"""
>>> pd.read_csv(StringIO(s), skiprows=[1], header=None)
0 1
0 1 2
1 5 6
>>> pd.read_csv(StringIO(s), skiprows=1, header=None)
0 1
0 3 4
1 5 6
Ответ 2
У меня еще нет репутации для комментариев, но я хочу добавить к alko ответ для дальнейшей справки.
Из docs:
skiprows: набор чисел для строк в файле для пропуска. Может также быть целым числом, чтобы пропустить первые n строк
Ответ 3
Я получил ту же проблему при запуске skiprows при чтении файла CSV. Я надевал skip_rows = 1 это не будет работать
Простой пример дает представление о том, как использовать skiprows при чтении CSV файла.
import pandas as pd
#skiprows=1 will skip first line and try to read from second line
df = pandas.read_csv('my_csv_file.csv', skiprows=1)
#print the data frame
df
Ответ 4
skip[1]
пропустит вторую строку, а не первую.
Ответ 5
Также убедитесь, что ваш файл на самом деле является файлом CSV. Например, если у вас был .xls файл и просто изменил расширение файла на .csv, файл не будет импортировать и даст ошибку выше. Чтобы проверить, не является ли это вашей проблемой, откройте файл в excel, и он, скорее всего, скажет:
"Формат файла и расширение" Filename.csv "не совпадают. Файл может быть поврежден или небезопасен. Если вы не доверяете его источнику, не открывайте его. Вы все равно хотите его открыть?"
Чтобы исправить файл: откройте файл в Excel, нажмите "Сохранить как", выберите формат файла для сохранения как (используйте .cvs), затем замените существующий файл.
Это была моя проблема и исправила ошибку для меня.