我有一个日期时间字符串,我不知道如何在Python中解析它。
字符串是这样的:
Tue May 08 15:14:45 +0800 2012
我试过了
datetime.strptime("Tue May 08 15:14:45 +0800 2012","%a %b %d %H:%M:%S %z %Y")
但是Python提升了
'z' is a bad directive in format '%a %b %d %H:%M:%S %z %Y'
根据Python doc:
%z UTC offset in the form +HHMM or -HHMM (empty string if the the object is naive).
解析此时间字符串的正确格式是什么?
相关:Python:使用电子邮件中的时区解析日期
datetime.datetime.strptime在时区解析方面存在问题。看看dateutil包:
>>> from dateutil import parser
>>> parser.parse("Tue May 08 15:14:45 +0800 2012")
datetime.datetime(2012, 5, 8, 15, 14, 45, tzinfo=tzoffset(None, 28800))
关于如何解析02/Nov/2012:06:37:42 +0000的任何想法?这是nginx在日志文件中使用的格式,parser.parse返回ValueError: unknown string format。
@ zidarsk8:首先需要在日期后删除冒号:parser.parse("06/Apr/2014:13:23:04".replace(":","", 1))
@ zidarsk8试试这个:parser.parse("02/Nov/2012:06:37:42 +0000",fuzzy=True) - 指定模糊,解析器忽略它不理解的字符。
这实际上错误地解析了日期。 Fri Nov 9 09:04:02 2012 -0500忽略-0500并使用当前时区。
命令是"pip install python-dateutil",使用pip btw安装它。
小心 - 使用这个库我也得到了错误的结果,月份和日期翻转! 19.01.2017 => 1月,2010年1月12日=> 12月
根据您要解析的内容,请记住使用dayfirst=True,否则可能会返回不正确的结果。 (另见这个答案)
如果您在导入parser时遇到问题,请执行:from dateutil.parser import parse。
在Python 3.7中,最终可以以+HH:MM格式解析时区
你最好的选择是看看strptime()
有点像
>>> from datetime import datetime
>>> date_str = 'Tue May 08 15:14:45 +0800 2012'
>>> date = datetime.strptime(date_str, '%a %B %d %H:%M:%S +0800 %Y')
>>> date
datetime.datetime(2012, 5, 8, 15, 14, 45)
不幸的是,我不确定如何做+0800时区,也许别人可以帮忙解决这个问题。
格式化字符串可以在http://docs.python.org/library/time.html#time.strftime找到,并且格式化打印字符串是相同的。
希望有所帮助
标记
PS,你最好的选择是从pypi安装pytz时区。 (http://pytz.sourceforge.net/)
事实上,如果我没记错的话,我认为pytz有一个很棒的日期时间解析方法。标准的lib在地面上有点薄,带有时区功能。
eumiro提及datetime.datetime.strptime有时区解析的问题。我认为这是真的
这是一个stdlib解决方案,它支持输入时间字符串中的变量utc offset:
>>> from email.utils import parsedate_tz, mktime_tz
>>> from datetime import datetime, timedelta
>>> timestamp = mktime_tz(parsedate_tz('Tue May 08 15:14:45 +0800 2012'))
>>> utc_time = datetime(1970, 1, 1) + timedelta(seconds=timestamp)
>>> utc_time
datetime.datetime(2012, 5, 8, 7, 14, 45)
它在SO中多次讨论过。简而言之,不支持"%z",因为平台不支持它。
我的解决方案是新的,只是跳过时区:
datetime.datetime.strptime(re.sub(r"[+-]([0-9])+","","Tue May 08 15:14:45 +0800 2012"),"%a %b %d %H:%M:%S %Y")
您的解决方案仍然中断,它不会引发错误。
In [117]: datetime.datetime.strptime?
Type: builtin_function_or_method
Base Class:
String Form:
Namespace: Interactive
Docstring:
string, format -> new datetime parsed from a string (like time.strptime()).
我尝试了datetime.strptime("Tue May 08 15:14:45 +0800 2012","%a %b %d %H:%M:%S %z %Y"),但Python引发了'z' is a bad directive in format '%a %b %d %H:%M:%S %z %Y'