TypeError: кодирование или ошибки без строкового аргумента

Я пытаюсь записать список байтов данных в файл CSV. Поскольку это список байтовых строк, я использовал следующий код:

Я хочу, чтобы приведенный выше список был напечатан в виде первой строки в файле CSV с декодированием символов Unicode. То есть в \xc3\x97 должен быть преобразован соответствующий ему символ.

Ответы

Ответ 1

Кажется, что ваш datas уже в байтах, поэтому, чтобы превратить его в строки UTF-8, вы должны использовать str, а не bytes! Кроме того, вам нужно преобразовать каждый элемент из datas отдельно, а не весь список одновременно. Наконец, если вы хотите добавить datas как одну строку в out.csv, вы должны использовать writerow, тогда как writerows будет записывать все строки одновременно, и, соответственно, будет ожидать список списков.

В зависимости от вашей ОС вы также можете указать encoding при открытии файла. В противном случае он будет использовать кодировку по умолчанию ОС, которая может быть чем-то совсем другим.

Это похоже на то, что вы хотите. Результатом является CSV файл с одной строкой ¹ данных в формате UTF-8, а \xc3\x97 декодируется до ×.

import csv
with open(r"out.csv", "w", encoding='UTF-8') as w:
    writer = csv.writer(w)
    writer.writerow([str(d, 'UTF-8') for d in datas])

¹⁾ Обратите внимание, что последний элемент в datas содержит некоторые разрывы строк и, следовательно, будет разбит на несколько строк. Это, вероятно, не то, что вы хотите. Или это сбой в вашем списке datas?

Ответ 2

Эта ошибка означает, что то, что вы передаете в bytes (строка, которую вы хотите преобразовать в последовательность байтов), на самом деле не является строкой. Это не означает, что аргумент уже имеет тип bytes, просто это не строка.

>>> bytes(b"", encoding="utf-8")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: encoding without a string argument
>>> bytes(None, encoding="utf-8")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: encoding without a string argument
>>> bytes(12, encoding="utf-8")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: encoding without a string argument