Как прочитать заголовок Content Type и преобразовать его в utf-8, в то время как Gmail IMAP имеет utf8, а Outlook имеет ISO-8859-7?
Итак, я получаю письма с помощью imap из gmail и Outlook.
Gmail кодирует как =?UTF-8?B?UmU6IM69zq3OvyDOtc68zrHOuc67IG5ldyBlbWFpbA==?=
и внешний вид кодируется следующим образом: =?iso-8859-7?B?UmU6IOXr6+ft6er8IHN1YmplY3Q=?=
К сожалению, я еще не нашел решения, которые помогут мне сделать это в читаемом тексте. Вместо этого я возился с:
mb_convert_encoding($body, "UTF-8", "UTF-8");
и
mb_convert_encoding($body, "UTF-8", "iso-8859-7");
но я изо всех сил пытаюсь найти решение для решения этого вопроса.
Вот как я открываю IMAP моей учетной записи (в которой много сообщений gmail и Outlook)
$hostname = '{imappro.zoho.com:993/imap/ssl}INBOX';
$username = '[email protected]';
$password = 'password';
/* try to connect */
$inbox = imap_open($hostname,$username ,$password) or die('Cannot connect to Zoho: ' . imap_last_error());
/* grab emails */
$emails = imap_search($inbox,'UNSEEN');
Любая помощь?
Ответы
Ответ 1
К сожалению, я еще не нашел решения, которые помогут мне сделать это в читаемый текст.
Решение
Ваши строки закодированы в base64.
=?UTF-8?B?UmU6IM69zq3OvyDOtc68zrHOuc67IG5ldyBlbWFpbA==?=
echo base64_decode('UmU6IM69zq3OvyDOtc68zrHOuc67IG5ldyBlbWFpbA==');
prints "Re: νέο εμαιλ new email"
=?iso-8859-7?B?UmU6IOXr6+ft6er8IHN1YmplY3Q=?=
echo base64_decode('UmU6IOXr6+ft6er8IHN1YmplY3Q=');
распечатывает "Re: subject"
Ответ заключается в использовании base64_decode в сочетании с вашими текущими решениями.
Способ идентификации кодированного текста base64 состоит в том, что он изображен как буквы a-z, A-Z, цифры 0-9 вместе с двумя другими символами (обычно + и /), и обычно он имеет право с помощью =.
EDIT:
Извините, я уже забыл, что вопрос состоял в том, чтобы конвертировать из iso-8859-7 в UTF-8 и видеть его.
<?php
$str = base64_decode('UmU6IPP03evt+SDs3u317OE=');
$str = mb_convert_encoding($str,'UTF-8','iso-8859-7');
echo $str;
?>
В результате получается "Re: στέλνω μήνυμα"
Ответ 2
посмотрите здесь
/* connect to gmail */
$hostname = '{imap.gmail.com:993/imap/ssl}INBOX';
$username = '[email protected]';
$password = 'davidwalsh';
/* try to connect */
$inbox = imap_open($hostname,$username,$password) or die('Cannot connect to Gmail: ' . imap_last_error());
/* grab emails */
$emails = imap_search($inbox,'ALL');
/* if emails are returned, cycle through each... */
if($emails) {
/* begin output var */
$output = '';
/* put the newest emails on top */
rsort($emails);
/* for every email... */
foreach($emails as $email_number) {
/* get information specific to this email */
$overview = imap_fetch_overview($inbox,$email_number,0);
$message = imap_fetchbody($inbox,$email_number,2);
/* output the email header information */
$output.= '<div class="toggler '.($overview[0]->seen ? 'read' : 'unread').'">';
$output.= '<span class="subject">'.$overview[0]->subject.'</span> ';
$output.= '<span class="from">'.$overview[0]->from.'</span>';
$output.= '<span class="date">on '.$overview[0]->date.'</span>';
$output.= '</div>';
/* output the email body */
$output.= '<div class="body">'.$message.'</div>';
}
echo $output;
}
/* close the connection */
imap_close($inbox);
для чтения и декодирования смотрите здесь
<?php
$hostname = '{********:993/imap/ssl}INBOX';
$username = '*********';
$password = '******';
$inbox = imap_open($hostname,$username,$password) or die('Cannot connect to server: ' . imap_last_error());
$emails = imap_search($inbox,'ALL');
if($emails) {
$output = '';
rsort($emails);
foreach($emails as $email_number) {
$overview = imap_fetch_overview($inbox,$email_number,0);
$structure = imap_fetchstructure($inbox, $email_number);
if(isset($structure->parts) && is_array($structure->parts) && isset($structure->parts[1])) {
$part = $structure->parts[1];
$message = imap_fetchbody($inbox,$email_number,2);
if($part->encoding == 3) {
$message = imap_base64($message);
} else if($part->encoding == 1) {
$message = imap_8bit($message);
} else {
$message = imap_qprint($message);
}
}
$output.= '<div class="toggle'.($overview[0]->seen ? 'read' : 'unread').'">';
$output.= '<span class="from">From: '.utf8_decode(imap_utf8($overview[0]->from)).'</span>';
$output.= '<span class="date">on '.utf8_decode(imap_utf8($overview[0]->date)).'</span>';
$output.= '<br /><span class="subject">Subject('.$part->encoding.'): '.utf8_decode(imap_utf8($overview[0]->subject)).'</span> ';
$output.= '</div>';
$output.= '<div class="body">'.$message.'</div><hr />';
}
echo $output;
}
imap_close($inbox);
?>
Посмотрите здесь для большого учебника по структуре электронной почты и функции для его извлечения.
Ответ 3
Если вы хотите декодировать элементы заголовка, для него есть функция PHP: imap_mime_header_decode().
Кроме того, для декодирования многочастных сообщений вам понадобится некоторый класс парсеров MIME.
Ответ 4
Чтобы получить заголовки, вы передадите свой поток ($inbox
) на imap_headers()
. В ответе есть множество значений, полный список: imap_headerinfo
Для реальных сообщений обычный текст можно прочитать с помощью imap_body()
, передав поток и номер требуемого сообщения (в $emails
после вашего поиска). Получение html/multipart электронной почты немного сложнее. Сначала вам понадобится imap_fetchstructure()
, который идентифицирует части сообщения, затем imap_fetchbody()
, чтобы получить интересующую вас деталь.
Как только у вас есть результат от imap_fetchbody()
, если вам все еще нужно настроить кодировку, это может быть сделано в этот момент.
Ответ 5
У меня была задача получать письма из определенного почтового ящика, анализировать их и индексировать определенный контент.
Я хотел иметь некоторый микросервис, который предоставил бы мне данные.
- Загрузка необходимого содержимого
- Преобразование полученных данных в читаемый формат
- обрабатывать содержимое
Итак, я решил использовать готовые инструменты.
- script для получения электронной почты - imap2maildir
- Клиент Unix для обработки сообщений mu
- dos2unix.
Затем я написал небольшой bash script, который я разместил в cron
#!/bin/bash
python /var/mail_dump/imap2maildir/imap2maildir -c /var/mail_dump/imap2maildir/deploy.conf
mu index --maildir=/var/mail_dump/dumps/new
#clean old data
rm -rf /var/mail_dump/extract/*
#search match messages
mu find jivo --fields="l" --nocolor | xargs $1 cp -t /var/mail_dump/extract
#converting
dos2unix -f /var/mail_dump/extract/*
#reassembly of messages in html
cd /var/mail_dump/extract/
for i in /var/mail_dump/extract/*
do
mu extract --parts=0 --overwrite "$i"
rm "$i"
done
Завершить!
У меня есть служба, которая постоянно получает электронные письма и готовит их для обработки.
php работает с подготовленными данными, не задумываясь о реализации низкоуровневой логики.