Кодировать MIMEText в качестве цитируемых печатных материалов
Python поддерживает довольно функциональную MIME-библиотеку под названием email.mime
.
Я хочу добиться того, чтобы часть MIME содержала простой текст UTF-8, который должен быть закодирован как цитируемый, а не как base64. Хотя вся функциональность доступна в библиотеке, я не смог ее использовать:
Пример:
import email.mime.text, email.encoders
m=email.mime.text.MIMEText(u'This is the text containing ünicöde', _charset='utf-8')
m.as_string()
# => Leads to a base64-encoded message, as base64 is the default.
email.encoders.encode_quopri(m)
m.as_string()
# => Leads to a strange message
Последняя команда приводит к странному сообщению:
Content-Type: text/plain; charset="utf-8"
MIME-Version: 1.0
Content-Transfer-Encoding: base64
Content-Transfer-Encoding: quoted-printable
GhpcyBpcyB0aGUgdGV4dCBjb250YWluaW5nIMO8bmljw7ZkZQ=3D=3D
Это, очевидно, не закодировано как цитируемые печатные материалы, двойной заголовок transfer-encoding
кажется странным (если не незаконным).
Как я могу получить текст, закодированный в качестве цитируемых печатных материалов в сообщении mime?
Ответы
Ответ 1
Хорошо, у меня есть одно решение, которое очень хаки, но, по крайней мере, оно ведет в некотором направлении: MIMEText
предполагает base64, и я не знаю, как это изменить. По этой причине я использую MIMENonMultipart
:
import email.mime, email.mime.nonmultipart, email.charset
m=email.mime.nonmultipart.MIMENonMultipart('text', 'plain', charset='utf-8')
#Construct a new charset which uses Quoted Printables (base64 is default)
cs=email.charset.Charset('utf-8')
cs.body_encoding = email.charset.QP
#Now set the content using the new charset
m.set_payload(u'This is the text containing ünicöde', charset=cs)
Теперь сообщение кажется правильно закодированным:
Content-Type: text/plain; charset="utf-8"
MIME-Version: 1.0
Content-Transfer-Encoding: quoted-printable
This is the text containing =C3=BCnic=C3=B6de
Можно даже построить новый класс, который скрывает сложность:
class MIMEUTF8QPText(email.mime.nonmultipart.MIMENonMultipart):
def __init__(self, payload):
email.mime.nonmultipart.MIMENonMultipart.__init__(self, 'text', 'plain',
charset='utf-8')
utf8qp=email.charset.Charset('utf-8')
utf8qp.body_encoding=email.charset.QP
self.set_payload(payload, charset=utf8qp)
И используйте его следующим образом:
m = MIMEUTF8QPText(u'This is the text containing ünicöde')
m.as_string()
Ответ 2
Адаптировано из issue 1525919 и протестировано на python 2.7:
from email.Message import Message
from email.Charset import Charset, QP
text = "\xc3\xa1 = \xc3\xa9"
msg = Message()
charset = Charset('utf-8')
charset.header_encoding = QP
charset.body_encoding = QP
msg.set_charset(charset)
msg.set_payload(msg._charset.body_encode(text))
print msg.as_string()
предоставит вам:
MIME-Version: 1.0
Content-Type: text/plain; charset="utf-8"
Content-Transfer-Encoding: quoted-printable
=C3=A1 =3D =C3=A9
Также см. этот ответ от коммиттера Python.