Строка csv Python для массива
Кто-нибудь знает простую библиотеку или функцию для синтаксического анализа кодированной строки csv и превращает ее в массив или словарь?
Я не думаю, что хочу встроенный модуль csv, потому что во всех примерах, которые я видел, которые принимают файловые пути, а не строки.
Ответы
Ответ 1
Вы можете преобразовать строку в объект файла, используя io.StringIO
, а затем передать ее в модуль csv
:
from io import StringIO
import csv
scsv = """text,with,Polish,non-Latin,letters
1,2,3,4,5,6
a,b,c,d,e,f
gęś,zółty,wąż,idzie,wąską,dróżką,
"""
f = StringIO(scsv)
reader = csv.reader(f, delimiter=',')
for row in reader:
print('\t'.join(row))
более простая версия с split()
в новых строках:
reader = csv.reader(scsv.split('\n'), delimiter=',')
for row in reader:
print('\t'.join(row))
Или вы можете просто split()
эту строку в строки, используя \n
в качестве разделителя, а затем split()
каждую строку в значения, но таким образом вы должны знать о кавычках, поэтому использование модуля csv
является предпочтительным.
На Python 2 вы должны импортировать StringIO
как
from StringIO import StringIO
вместо этого.
Ответ 2
Простой - модуль csv также работает со списками:
>>> a=["1,2,3","4,5,6"] # or a = "1,2,3\n4,5,6".split('\n')
>>> import csv
>>> x = csv.reader(a)
>>> list(x)
[['1', '2', '3'], ['4', '5', '6']]
Ответ 3
>>> a = "1,2"
>>> a
'1,2'
>>> b = a.split(",")
>>> b
['1', '2']
Разбор CSV файла:
f = open(file.csv, "r")
lines = f.read().split("\n") # "\r\n" if needed
for line in lines:
if line != "": # add other needed checks to skip titles
cols = line.split(",")
print cols
Ответ 4
Официальный документ для csv.reader()
https://docs.python.org/2/library/csv.html очень полезен:
объекты файла и объекты списка подходят
import csv
text = """1,2,3
a,b,c
d,e,f"""
lines = text.splitlines()
reader = csv.reader(lines, delimiter=',')
for row in reader:
print('\t'.join(row))
Ответ 5
Как уже указывали другие, Python включает в себя модуль для чтения и записи CSV файлов. Он работает очень хорошо, пока символы ввода остаются в пределах ASCII. Если вы хотите обработать другие кодировки, вам потребуется больше работы.
Документация Python для модуля csv реализует расширение csv.reader, которое использует тот же но может обрабатывать другие кодировки и возвращает строки Unicode. Просто скопируйте и вставьте код из документации. После этого вы можете обработать файл CSV следующим образом:
with open("some.csv", "rb") as csvFile:
for row in UnicodeReader(csvFile, encoding="iso-8859-15"):
print row
Ответ 6
Согласно документации:
И хотя модуль напрямую не поддерживает синтаксический анализ строк, это легко сделать:
import csv
for row in csv.reader(['one,two,three']):
print row
Просто включите вашу строку в один список элементов.
Импорт StringIO кажется мне немного излишним, когда этот пример явно указан в документации.
Ответ 7
https://docs.python.org/2/library/csv.html?highlight=csv#csv.reader
csvfile может быть любым объектом, который поддерживает протокол итератора и возвращает строку каждый раз, когда ее метод next() вызывается
Таким образом, a StringIO.StringIO()
, str.splitlines()
или даже генератор хороши.
Ответ 8
Здесь альтернативное решение:
>>> import pyexcel as pe
>>> text="""1,2,3
... a,b,c
... d,e,f"""
>>> s = pe.load_from_memory('csv', text)
>>> s
Sheet Name: csv
+---+---+---+
| 1 | 2 | 3 |
+---+---+---+
| a | b | c |
+---+---+---+
| d | e | f |
+---+---+---+
>>> s.to_array()
[[u'1', u'2', u'3'], [u'a', u'b', u'c'], [u'd', u'e', u'f']]
Здесь документация
Ответ 9
Используйте это, чтобы загрузить csv в список
import csv
csvfile = open(myfile, 'r')
reader = csv.reader(csvfile, delimiter='\t')
my_list = list(reader)
print my_list
>>>[['1st_line', '0'],
['2nd_line', '0']]
Ответ 10
Panda - довольно мощная и умная библиотека для чтения CSV на Python
Простой пример, у меня есть файл example.zip с четырьмя файлами.
EXAMPLE.zip
-- example1.csv
-- example1.txt
-- example2.csv
-- example2.txt
from zipfile import ZipFile
import pandas as pd
filepath = 'EXAMPLE.zip'
file_prefix = filepath[:-4].lower()
zipfile = ZipFile(filepath)
target_file = ''.join([file_prefix, '/', file_prefix, 1 , '.csv'])
df = pd.read_csv(zipfile.open(target_file))
print(df.head()) # print first five row of csv
print(df[COL_NAME]) # fetch the col_name data
Как только у вас есть данные, вы можете манипулировать ими со списком или другими форматами.