python读取邮件时,首先需要邮箱开启IMAP服务或POP服务,通常在邮箱的设置界面可以开启,不过默认似乎是不开启的。
IMAP是什么?IMAP和POP有什么区别?:https://open.work.weixin.qq.com/help2/pc/19887?person_id=1
以腾讯邮箱为例,在开启imap服务同一个界面下,会看到相关配置:
接收服务器:
imap.exmail.qq.com(使用SSL,端口号993)
发送服务器:
smtp.exmail.qq.com(使用SSL,端口号465)
这里我们只读取,因此对应的配置是:
import imaplib
email_value_config = {
'imap_server': 'imap.exmail.qq.com',
'username': '[email protected]',
'password': 'xxxxx',
}
email_server = imaplib.IMAP4_SSL(email_value_config['imap_server']) # 这样就已经链接到目标邮箱了
email_server.login(email_value_config["username"], email_value_config['password']) # 这里登录
后续的操作是:
选择想要操作的内容,比如【收件箱】,【回收站】等,使用程序:
email_server.select('INBOX') # 选择【收件箱】
常用的可以参考:
INBOX 收件箱
Sent Messages 已发送
Drafts 草稿箱
Deleted Messages 已删除
Junk 垃圾箱
根据筛选条件选择想要提取的邮件,全部提取可以使用ALL
,然后返回满足条件的邮件id,根据邮件id就可以锁定唯一的邮件了
import imaplib
import email
from email.utils import parsedate_to_datetime
from email.header import make_header, decode_header
email_value_config = {
'imap_server': 'imap.exmail.qq.com',
'username': '[email protected]',
'password': 'xxxxx',
}
def extract_email():
email_server = imaplib.IMAP4_SSL(email_value_config['imap_server'])
email_server.login(email_value_config["username"], email_value_config['password'])
email_server.select('INBOX') # 选择【收件箱】
# 选择收件箱
_typ, _search_data = email_server.search(None, 'ALL')
# 开始解析
mailidlist = _search_data[0].split() # 转成标准列表,获得所有邮件的ID
print(f'一共解析邮件数量:{len(mailidlist)}')
# 解析内容:
for mail_id in mailidlist:
result, data = email_server.fetch(mail_id, '(RFC822)') # 通过邮件id获取邮件
email_message = email.message_from_bytes(data[0][1]) # 邮件内容(未解析)
subject = make_header(decode_header(email_message['SUBJECT'])) # 主题
mail_from = make_header(decode_header(email_message['From'])) # 发件人
mail_dt = parsedate_to_datetime(email_message['Date']).strftime("%Y-%m-%d %H:%M:%S") # 收件时间
email_info = {
"主题": str(subject),
"发件人": str(mail_from),
"收件时间": mail_dt,
}
print(email_info)
if __name__ == '__main__':
extract_email()
ps:查看全部可选择的邮箱可以使用如下程序:
# 查看全部可选择的邮箱:
for i in email_server.list()[1]:
l = i.decode().split(' "/" ')
print(l[0] + " = " + l[1])