我试图使用python脚本解析电子邮件的日期时间。
在我打开邮件时,邮件日期值如下所示...
1
2
3
4from: [email protected]
date: Tue, Aug 28, 2012 at 1:19 PM
subject: Subject of that mail
我正在使用代码
1
2
3
4
5
6
7mail = email.message_from_string(str1)
#to = re.sub('','',mail["To"])
to = parseaddr(mail.get('To'))[1]
sender = parseaddr(mail.get('From'))[1]
cc_is = parseaddr(mail.get('Cc'))[1]
date = mail["Date"]
print date
使用python解析的相同邮件日期时间的输出如下所示,具有时间偏移。
1Tue, 28 Aug 2012 02:49:13 -0500
我在哪里实际上是希望的
1Tue, Aug 28, 2012 at 1:19 PM
我对这两个价值观的关系感到很困惑。
任何人都可以帮我弄明白我需要同时进入邮件详细信息。
时区!乐趣。:-)
stackoverflow.com/questions/1790795/…
查看GMail中的电子邮件时,会在显示发送电子邮件的日期和时间时使用您的本地时区。解析"Tue,2012年8月28日02:49:13 -0500",然后更新到您当地的时区,并以GMail特定的方式格式化。
解析和格式化stdlib方式
email.utils模块包含一个parsedate_tz()功能,专门处理带有时区偏移的电子邮件标头。
它返回与time.struct_time兼容的元组,但添加了时区偏移量。附加的mktime_tz()函数将该元组转换为偏移值(自UNIX纪元以来的秒数)。然后可以轻松地将该值转换为datetime.datetime()类型对象。
同一模块还具有formatdate()功能,可将UNIX纪元时间戳转换为与电子邮件兼容的日期字符串:
1
2
3
4
5
6
7>>> from email.utils import parsedate_tz, mktime_tz, formatdate
>>> import time
>>> date = 'Tue, 28 Aug 2012 02:49:13 -0500'
>>> tt = parsedate_tz(date)
>>> timestamp = mktime_tz(tt)
>>> print formatdate(timestamp)
Tue, 28 Aug 2012 07:49:13 -0000
现在我们有一个适合外发电子邮件的格式化日期。要将其打印为我的本地时区(由我的计算机确定),您需要将localtime标志设置为True:
1
2>>> print formatdate(timestamp, True)
Tue, 28 Aug 2012 08:49:13 +0100
使用更好的工具进行解析和格式化
请注意,当我们尝试处理时区时,事情变得毛茸茸,并且formatdate()函数没有给你任何选项来格式化一些不同的东西(比如GMail),也不会让你选择不同的时区来工作用。
输入外部python-dateutil模块;它有一个解析函数,可以处理任何事情,并正确支持时区
1
2
3
4>>> import dateutil.parser
>>> dt = dateutil.parser.parse(date)
>>> dt
datetime.datetime(2012, 8, 28, 2, 49, 13, tzinfo=tzoffset(None, -18000))
parse()函数返回一个datetime.datetime()实例,这使得格式化更容易。现在我们可以使用.strftime()函数将其输出为您的电子邮件客户端:
1
2>>> print dt.strftime('%a, %b %d, %Y at %I:%M %p')
Tue, Aug 28, 2012 at 02:49 AM
当然,那仍然在当地时区;将其转换为您的时区,使用.astimezone()方法,使用新的tzone对象。 python-dateutil包对我们来说有些方便。
以下是如何在本地时区(到您的机器)打印它:
1
2
3>>> import dateutil.tz
>>> print dt.astimezone(dateutil.tz.tzlocal()).strftime('%a, %b %d, %Y at %I:%M %p')
Tue, Aug 28, 2012 at 09:49 AM
或者使用特定的时区代替:
1
2>>> print dt.astimezone(dateutil.tz.tzstr('Asia/Kolkata')).strftime('%a, %b %d, %Y at %I:%M %p')
Tue, Aug 28, 2012 at 07:49 AM
实际上我要求输出我可以捕获的解析邮件...比如CC,TO或SENDER .....你引导我格式化那个日期时间字符串......我很舒服。
我刚刚再次更新了我的问题。
对,你对我认为的时区感到困惑;电子邮件日期被解析为一个时区,显示在另一个时区。这通常不是问题。
请注意,您的问题远非明确;目前尚不清楚您在哪里看到价值观和预期。
@Martijin:现在好吗?实际上我无法得到字符串"Tue,2012年8月28日下午1:19"..当我在浏览器中使用我的gmail acc打开它时,我可以在邮件中看到。
2012年8月28日星期二13:19:21在亚洲/加尔各答转换到2012年8月28日星期二02:49:21 GMT-5 ...所以这是我的最终答案..谢谢@Martijin的帮助。
给出了很长的更新
有parsedate_tz和mktime_tz,即你不需要手工解析UTC偏移量
@ J.F.Sebastian:谢谢;不知道我当时错过了那些。在我发布这个函数之后,这些函数并没有被添加..: - /
你只能使用stdlib来做到这一点:
1
2
3
4>>> from email.utils import parsedate_tz, mktime_tz, formatdate
>>> ts = mktime_tz(parsedate_tz('Tue, 28 Aug 2012 02:49:13 -0500'))
>>> formatdate(ts, localtime=True) # assuming Asia/Kolkata is the local timezone
'Tue, 28 Aug 2012 13:19:13 +0530'
如果您想使用PM格式数小时:
1
2
3>>> from datetime import datetime
>>> datetime.fromtimestamp(ts).strftime('%a, %b %d, %Y at %I:%M %p')
'Tue, Aug 28, 2012 at 01:19 PM'
JF Sebastian只是一个错字而不是日期时间他需要datetime.datetime示例应该是datetime.datetime.fromtimestamp(ts).strftime('%a,%b%d,%Y at%I:%M%p' )
@Dung:代码按原样运行。看看进口线。
此外,如果您希望日期格式与mysql日期时间格式匹配,则为:>>> datetime.fromtimestamp(ts).strftime('%y-%m-%d%H:%M:%S')
@Dung:再次,代码按原样运行。它产生OP明确要求的时间格式。看看这个问题。
可以选择以下代码
1
2
3
4start = f.find('date:') + 5 # +5 is to exclude 'date'+':' i.e.(4+1=5)
end = f.find('subject:', start) # parse from date to subject
date_time = f[start:end]
print date_time #it will print"Tue, Aug 28, 2012 at 1:19 PM"