Как получить тело электронной почты с помощью imaplib в python?

Я хочу получить все сообщение с сервера IMAP4. В документах python, если найден этот бит кода, который работает:

>>> t, data = M.fetch('1', '(RFC822)')
>>> body = data[0][1]

Мне интересно, могу ли я всегда доверять тому, что данные [0] [1] возвращают тело сообщения. Когда я запускаю "RFC822.SIZE", у меня есть только строка вместо кортежа.

Я просмотрел rfc1730, но не смог найти правильную структуру ответа для RFC822. Также сложно определить структуру результатов выборки из документации imaplib.

Вот что я получаю при извлечении RFC822:

('OK', [('1 (RFC822 {858569}', 'body of the message', ')')])

Но когда я получаю RFC822.SIZE, я получаю:

('OK', ['1 (RFC822.SIZE 847403)'])

Как правильно обрабатывать список данных [0]? Могу ли я доверять тому, что, когда это список кортежей, кортежи имеют ровно 3 части, а вторая часть - полезная нагрузка?

Может быть, вы знаете лучшую библиотеку для imap4?

Ответы

Ответ 1

Нет... imaplib - довольно хорошая библиотека, это imap, что так непонятно.

Возможно, вы захотите проверить, что t == 'OK', но data[0][1] работает так, как ожидалось, насколько я его использовал.

Вот быстрый пример, который я использую для извлечения подписанных сертификатов, которые я получил по электронной почте, а не для защиты от бомб, но подходит для моих целей:

import getpass, os, imaplib, email
from OpenSSL.crypto import load_certificate, FILETYPE_PEM

def getMsgs(servername="myimapserverfqdn"):
  usernm = getpass.getuser()
  passwd = getpass.getpass()
  subject = 'Your SSL Certificate'
  conn = imaplib.IMAP4_SSL(servername)
  conn.login(usernm,passwd)
  conn.select('Inbox')
  typ, data = conn.search(None,'(UNSEEN SUBJECT "%s")' % subject)
  for num in data[0].split():
    typ, data = conn.fetch(num,'(RFC822)')
    msg = email.message_from_string(data[0][1])
    typ, data = conn.store(num,'-FLAGS','\\Seen')
    yield msg

def getAttachment(msg,check):
  for part in msg.walk():
    if part.get_content_type() == 'application/octet-stream':
      if check(part.get_filename()):
        return part.get_payload(decode=1)

if __name__ == '__main__':
  for msg in getMsgs():
    payload = getAttachment(msg,lambda x: x.endswith('.pem'))
    if not payload:
      continue
    try:
      cert = load_certificate(FILETYPE_PEM,payload)
    except:
      cert = None
    if cert:
      cn = cert.get_subject().commonName
      filename = "%s.pem" % cn
      if not os.path.exists(filename):
        open(filename,'w').write(payload)
        print "Writing to %s" % filename
      else:
        print "%s already exists" % filename

Ответ 2

Пакет IMAPClient - это славный бит, с которым легче работать. Из описания:

Простая в использовании, Pythonic и полная IMAP-клиентская библиотека.

Ответ 3

Это было мое решение для извлечения полезных бит информации. До сих пор он был надежным:

import datetime
import email
import imaplib
import mailbox


EMAIL_ACCOUNT = "[email protected]"
PASSWORD = "your password"

mail = imaplib.IMAP4_SSL('imap.gmail.com')
mail.login(EMAIL_ACCOUNT, PASSWORD)
mail.list()
mail.select('inbox')
result, data = mail.uid('search', None, "UNSEEN") # (ALL/UNSEEN)
i = len(data[0].split())

for x in range(i):
    latest_email_uid = data[0].split()[x]
    result, email_data = mail.uid('fetch', latest_email_uid, '(RFC822)')
    # result, email_data = conn.store(num,'-FLAGS','\\Seen') 
    # this might work to set flag to seen, if it doesn't already
    raw_email = email_data[0][1]
    raw_email_string = raw_email.decode('utf-8')
    email_message = email.message_from_string(raw_email_string)

    # Header Details
    date_tuple = email.utils.parsedate_tz(email_message['Date'])
    if date_tuple:
        local_date = datetime.datetime.fromtimestamp(email.utils.mktime_tz(date_tuple))
        local_message_date = "%s" %(str(local_date.strftime("%a, %d %b %Y %H:%M:%S")))
    email_from = str(email.header.make_header(email.header.decode_header(email_message['From'])))
    email_to = str(email.header.make_header(email.header.decode_header(email_message['To'])))
    subject = str(email.header.make_header(email.header.decode_header(email_message['Subject'])))

    # Body details
    for part in email_message.walk():
        if part.get_content_type() == "text/plain":
            body = part.get_payload(decode=True)
            file_name = "email_" + str(x) + ".txt"
            output_file = open(file_name, 'w')
            output_file.write("From: %s\nTo: %s\nDate: %s\nSubject: %s\n\nBody: \n\n%s" %(email_from, email_to,local_message_date, subject, body.decode('utf-8')))
            output_file.close()
        else:
            continue

Ответ 4

Вы можете использовать пакет imap_tools: https://pypi.org/project/imap-tools/

Особенности:

  • Проанализированные атрибуты сообщения электронной почты
  • Конструктор запросов для поиска электронных писем
  • Работа с электронными письмами в папках (копирование, удаление, пометка, перемещение, просмотр)
  • Работа с папками почтовых ящиков (список, установка, получение, создание, существование, переименование, удаление, статус)
  • Нет зависимостей

Пример:

from imap_tools import MailBox, Q

# get list of email bodies from INBOX folder
with MailBox('imap.mail.com').login('[email protected]', 'password') as mailbox:
    bodies = [msg.body for msg in mailbox.fetch()]