Ошибка Python3: TypeError: Невозможно преобразовать объект 'bytes' в str неявно

Я работаю над упражнением 41 в обучении и продолжаю получать ошибку:

Я использую python3, в то время как книги используют python2, поэтому я внес некоторые изменения. Вот script:

Что именно я делаю неправильно здесь? Спасибо!

Ответы

Ответ 1

urlopen() возвращает объект bytes, для выполнения строковых операций над ним вы должны сначала преобразовать его в str.

for word in urlopen(WORD_URL).readlines():
    WORDS.append(word.strip().decode('utf-8')) # utf-8 works in your case

Чтобы получить правильную кодировку: Как загрузить любую (!) веб-страницу с правильной кодировкой в python?

Ответ 2

В Python 3 функция urlopen возвращает объект HTTPResponse, который действует как двоичный файл. Итак, когда вы это сделаете:

for word in urlopen(WORD_URL).readlines():
    WORDS.append(word.strip())

... вы получите кучу объектов bytes вместо объектов str. Поэтому, когда вы это сделаете:

result = result.replace("###", word, 1)

... вы пытаетесь заменить строку "###" в строке result объектом bytes вместо str. Следовательно, ошибка:

TypeError: Can't convert 'bytes' object to str implicitly

Ответ заключается в том, чтобы явно декодировать слова, как только вы их получите. Для этого вам нужно выяснить правильную кодировку из заголовков HTTP. Как вы это делаете?

В этом случае я читаю заголовки, я могу сказать, что это ASCII, и это, очевидно, статическая страница, поэтому:

for word in urlopen(WORD_URL).readlines():
    WORDS.append(word.strip().decode('ascii'))

Но в реальной жизни вам обычно нужно писать код, который читает заголовки и динамически определяет его. Или, лучше, установите библиотеку более высокого уровня, например requests, которая делает это автоматически.

Ответ 3

Явное преобразование байтового типа 'word' в строку

result = result.replace("###", sre(word), 1)

он должен работать