Python 3 UnicodeDecodeError: кодек 'charmap' не может декодировать байт 0x9d

Я хочу создать поисковую систему, и я следую учебному курсу в какой-то сети. Я хочу проверить parse html

Я видел некоторые решения в Интернете с помощью encode(). Но я не знаю, как вставить функцию encode() в код. Кто-нибудь может мне помочь?

Ответы

Ответ 1

В Python 3 файлы открываются для вас (декодируется в Unicode); вам не нужно сообщать BeautifulSoup, какой кодек декодировать.

Если декодирование данных выходит из строя, это означает, что вы не сказали open() вызвать какой кодек использовать при чтении файла; добавьте правильный кодек с аргументом encoding:

with open(filename, encoding='utf8') as infile:
    html = BeautifulSoup(infile, "html.parser")

в противном случае файл будет открыт с вашим системным кодеком по умолчанию, который зависит от ОС.