UnicodeDecodeError: кодек ascii не может декодировать байт 0xe0 в позиции 0: порядковый номер не в диапазоне (128)
На одной из моих машин у меня есть ошибка, когда я работаю с движком google apps или django.
Например:
-
app.yaml
application: demas1252c
version: 1
runtime: python
api_version: 1
handlers:
- url: /images
static_dir: images
- url: /css
static_dir: css
- url: /js
static_dir: js
- url: /.*
script: demas1252c.py
-
demas1252c.py
import cgi
import wsgiref.handlers
from google.appengine.ext.webapp import template
from google.appengine.ext import webapp
class MainPage(webapp.RequestHandler):
def get(self):
values = {'id' : 10}
self.response.out.write(template.render('foto.html', values))
application = webapp.WSGIApplication([('/', MainPage)], debug = True)
wsgiref.handlers.CGIHandler().run(application)
-
foto.html
<!DOCTYPE html>
<html lang="en">
<head></head>
<body>some</body>
</html>
сообщение об ошибке:
C:\artefacts\dev\project>"c:\Program Files\Google\google_appengine\dev_appserver.py" foto-hosting
Traceback (most recent call last):
File "c:\Program Files\Google\google_appengine\dev_appserver.py", line 69, in <module>
run_file(__file__, globals())
File "c:\Program Files\Google\google_appengine\dev_appserver.py", line 65, in run_file
execfile(script_path, globals_)
File "c:\Program Files\Google\google_appengine\google\appengine\tools\dev_appserver_main.py", line 92, in <module>
from google.appengine.tools import dev_appserver
File "c:\Program Files\Google\google_appengine\google\appengine\tools\dev_appserver.py", line 140, in <module>
mimetypes.add_type(mime_type, '.' + ext)
File "C:\Python27\lib\mimetypes.py", line 344, in add_type
init()
File "C:\Python27\lib\mimetypes.py", line 355, in init
db.read_windows_registry()
File "C:\Python27\lib\mimetypes.py", line 260, in read_windows_registry
for ctype in enum_types(mimedb):
File "C:\Python27\lib\mimetypes.py", line 250, in enum_types
ctype = ctype.encode(default_encoding) # omit in 3.x!
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe0 in position 0: ordinal not in range(128)
Когда я работаю со статическими файлами в django (без gae), у меня очень похожая ошибка (с другим стеком).
Я попытался найти причину ошибки и добавил код в файл mimetypes.py:
print '====='
print ctype
ctype = ctype.encode(default_encoding) # omit in 3.x!
Затем я получаю следующие сообщения в консоли:
=====
video/x-ms-wvx
=====
video/x-msvideo
=====
рєфшю/AMR
Traceback (most recent call last):
В реестре HKCR/Mime/Database/ContentType/У меня есть пять ключей с русскими (кириллическими) буквами. Но как я могу исправить эту ошибку?
Ответы
Ответ 1
Это ошибка в mimetypes
, вызванная плохими данными в реестре. (рєфшю/AMR
вовсе не является допустимым типом MIME-носителя.)
ctype
- это имя ключа реестра, возвращаемое _winreg.EnumKey
, которое mimetypes
ожидает быть строкой Unicode, но это не так. В отличие от _winreg.QueryValueEx
, EnumKey
возвращает строку байтов (прямо из ANSI-версии Windows API; _winreg
в Python 2 не использует интерфейсы Unicode, даже если возвращает строки Unicode, поэтому никогда не будет читать -ANSI символов).
Таким образом, попытка .encode
выполнить сбой в Unicode Decode Ошибка при попытке получить строку Unicode перед ее кодировкой обратно в ASCII!
try:
ctype = ctype.encode(default_encoding) # omit in 3.x!
except UnicodeEncodeError:
pass
Эти строки в mimetypes
должны быть просто удалены.
ETA: добавлен в трекер ошибок.
Ответ 2
Кстати, основной проблемой этой проблемы является QuickTime, которая добавляет типы не-ascii mime в реестр Windows. Самый простой способ исправить это - вручную найти и удалить из реестра подразделы HKCR/Mime/Database/ContentType/
, начиная с аудио/
и видео/
.
Ответ 3
Есть патч:
http://bugs.python.org/file18143/9291.patch
Отлично работает для меня.
Просто замените UnicodeEncodeError на UnicodeError
Ответ 4
Альтернативное решение от python issue9291 от Александра Зарубкина (me21):
добавить файл с именем sitecustomize.py в папку Lib\site-packages.
import sys
sys.setdefaultencoding("cp1251")
Ответ 5
его ошибка python с латинскими подсказками MIME в реестре
запустите regedit и проверьте "HKEY_CLASSES_ROOT\MIME\Database\Content Type" для нелатинских имен.