Ошибка Python3: TypeError: Невозможно преобразовать объект 'bytes' в str неявно
Я работаю над упражнением 41 в обучении и продолжаю получать ошибку:
Traceback (most recent call last):
File ".\url.py", line 72, in <module>
question, answer = convert(snippet, phrase)
File ".\url.py", line 50, in convert
result = result.replace("###", word, 1)
TypeError: Can't convert 'bytes' object to str implicitly
Я использую python3, в то время как книги используют python2, поэтому я внес некоторые изменения. Вот script:
#!/usr/bin/python
# Filename: urllib.py
import random
from random import shuffle
from urllib.request import urlopen
import sys
WORD_URL = "http://learncodethehardway.org/words.txt"
WORDS = []
PHRASES = {
"class ###(###):":
"Make a class named ### that is-a ###.",
"class ###(object):\n\tdef __init__(self, ***)" :
"class ### has-a __init__ that takes self and *** parameters.",
"class ###(object):\n\tdef ***(self, @@@)":
"class ### has-a funciton named *** that takes self and @@@ parameters.",
"*** = ###()":
"Set *** to an instance of class ###.",
"***.*** = '***'":
"From *** get the *** attribute and set it to '***'."
}
# do they want to drill phrases first
PHRASE_FIRST = False
if len(sys.argv) == 2 and sys.argv[1] == "english":
PHRASE_FIRST = True
# load up the words from the website
for word in urlopen(WORD_URL).readlines():
WORDS.append(word.strip())
def convert(snippet, phrase):
class_names = [w.capitalize() for w in
random.sample(WORDS, snippet.count("###"))]
other_names = random.sample(WORDS, snippet.count("***"))
results = []
param_names = []
for i in range(0, snippet.count("@@@")):
param_count = random.randint(1,3)
param_names.append(', '.join(random.sample(WORDS, param_count)))
for sentence in snippet, phrase:
result = sentence[:]
# fake class names
for word in class_names:
result = result.replace("###", word, 1)
# fake other names
for word in other_names:
result = result.replace("***", word, 1)
# fake parameter lists
for word in param_names:
result = result.replace("@@@", word, 1)
results.append(result)
return results
# keep going until they hit CTRL-D
try:
while True:
snippets = list(PHRASES.keys())
random.shuffle(snippets)
for snippet in snippets:
phrase = PHRASES[snippet]
question, answer = convert(snippet, phrase)
if PHRASE_FIRST:
question, answer = answer, question
print(question)
input("> ")
print("ANSWER: {}\n\n".format(answer))
except EOFError:
print("\nBye")
Что именно я делаю неправильно здесь? Спасибо!
Ответы
Ответ 1
urlopen()
возвращает объект bytes, для выполнения строковых операций над ним вы должны сначала преобразовать его в str
.
for word in urlopen(WORD_URL).readlines():
WORDS.append(word.strip().decode('utf-8')) # utf-8 works in your case
Чтобы получить правильную кодировку: Как загрузить любую (!) веб-страницу с правильной кодировкой в python?
Ответ 2
В Python 3 функция urlopen
возвращает объект HTTPResponse
, который действует как двоичный файл. Итак, когда вы это сделаете:
for word in urlopen(WORD_URL).readlines():
WORDS.append(word.strip())
... вы получите кучу объектов bytes
вместо объектов str
. Поэтому, когда вы это сделаете:
result = result.replace("###", word, 1)
... вы пытаетесь заменить строку "###"
в строке result
объектом bytes
вместо str
. Следовательно, ошибка:
TypeError: Can't convert 'bytes' object to str implicitly
Ответ заключается в том, чтобы явно декодировать слова, как только вы их получите. Для этого вам нужно выяснить правильную кодировку из заголовков HTTP. Как вы это делаете?
В этом случае я читаю заголовки, я могу сказать, что это ASCII, и это, очевидно, статическая страница, поэтому:
for word in urlopen(WORD_URL).readlines():
WORDS.append(word.strip().decode('ascii'))
Но в реальной жизни вам обычно нужно писать код, который читает заголовки и динамически определяет его. Или, лучше, установите библиотеку более высокого уровня, например requests
, которая делает это автоматически.
Ответ 3
Явное преобразование байтового типа 'word' в строку
result = result.replace("###", sre(word), 1)
он должен работать