Ответ 1
http://docs.python.org/library/htmlparser.html
>>> import HTMLParser
>>> pars = HTMLParser.HTMLParser()
>>> pars.unescape('© €')
u'\xa9 \u20ac'
>>> print _
© €
У меня есть html-текст:
<xml ... >
и я хочу преобразовать его в нечто читаемое:
<xml ...>
Любой простой (и быстрый) способ сделать это в Python?
http://docs.python.org/library/htmlparser.html
>>> import HTMLParser
>>> pars = HTMLParser.HTMLParser()
>>> pars.unescape('© €')
u'\xa9 \u20ac'
>>> print _
© €
Существует функция здесь, которая делает это, как указано в сообщении Фреда. Скопировано здесь, чтобы облегчить ситуацию.
Кредит Фреду Ларсону за ссылку на другой вопрос о SO. Поблагодарите dF за размещение ссылки.