Кодирование почтового субъекта (SMTP) в Python с символами, отличными от ASCII
Я использую модуль Python MimeWriter
чтобы построить сообщение и smtplib для отправки почты построенное сообщение:
file msg.txt:
-----------------------
Content-Type: multipart/mixed;
from: me<me@abc.com>
to: me@abc.com
subject: 主題
Content-Type: text/plain;charset=utf-8
主題
Я использую код ниже, чтобы отправить письмо:
import smtplib
s=smtplib.SMTP('smtp.abc.com')
toList = ['me@abc.com']
f=open('msg.txt') #above msg in msg.txt file
msg=f.read()
f.close()
s.sendmail('me@abc.com',toList,msg)
Я получаю тело почты правильно, но тема не является правильной,
subject: some junk characters
主題 <- body is correct.
пожалуйста, предложите? Есть ли способ указать декодирование, которое будет использоваться для субъекта также, как уточняется для тела. Как правильно расшифровать объект?
2 ответов
от http://docs.python.org/library/email.header.html
from email.message import Message
from email.header import Header
msg = Message()
msg['Subject'] = Header('主題', 'utf-8')
print msg.as_string()
тема: =?utf-8?б?5Li76aGM?=
более простой:
from email.header import Header
print Header('主題', 'utf-8').encode()
=?utf-8?б?5Li76aGM?=
тема передается как заголовок SMTP, и они должны быть ASCII-только. Для поддержки кодировок в теме Вам нужно префикс темы с любой кодировкой, которую вы хотите использовать. В вашем случае, я бы предложил приставить тему ?UTF-8?Б? что означает UTF-8, в base64 закодирован.
другими словами, Я считаю, что ваш заголовок темы должен более или менее выглядеть так:
Subject: =?UTF-8?B?JiMyMDAyNzsmIzM4OTg4Ow=?=
в PHP вы можете пойти об этом так:
// Convert subject to base64
$subject_base64 = base64_encode($subject);
fwrite($smtp, "Subject: =?UTF-8?B?{$subject_base64}?=\r\n");
В Python:
import base64
subject_base64 = base64.encodestring(subject).strip()
subject_line = "Subject: =?UTF-8?B?%s?=" % subject_base64