python 用datetime和pytz来转换时区

原文:http://www.keakon.net/2010/12/14/%E7%94%A8datetime%E5%92%8Cpytz%E6%9D%A5%E8%BD%AC%E6%8D%A2%E6%97%B6%E5%8C%BA


Python标准库里提供了time、datetime和calendar这3个模块来进行时间和日期的处理,其中应用最广的是datetime,而转换时区也是靠它来做的。


时区这个玩意非常抽象,处理它时经常弄得我头晕,只好记录下来,免得以后再犯晕。


首先要知道时区之间的转换关系,其实这很简单:把当地时间减去当地时区,剩下的就是格林威治时间了。
例如北京时间的18:00就是18:00+08:00,相减以后就是10:00+00:00,因此就是格林威治时间的10:00。

而把格林威治时间加上当地时区,就能得到当地时间了。
例如格林威治时间的10:00是10:00+00:00,转换成太平洋标准时间就是加上-8小时,因此是02:00-08:00。

而太平洋标准时间转换成北京时间转换也一样,时区相减即可。
例如太平洋标准时间的02:00-08:00,与北京时间相差-16小时,因此结果是18:00+08:00。


而Python的datetime可以处理2种类型的时间,分别为offset-naive和offset-aware。前者是指没有包含时区信息的时间,后者是指包含时区信息的时间,只有同类型的时间才能进行减法运算和比较。

不幸的是datetime模块的函数在默认情况下都只生成offset-naive类型的datetime对象,例如now()、utcnow()、fromtimestamp()、utcfromtimestamp()和strftime()。
其中now()和fromtimestamp()可以接受一个tzinfo对象来生成offset-aware类型的datetime对象,但是标准库并不提供任何已实现的tzinfo类,只能自己动手丰衣足食了…

下面就是实现格林威治时间和北京时间的tzinfo类的例子:

[python]  view plain copy
  1. ZERO_TIME_DELTA = timedelta(0)  
  2. LOCAL_TIME_DELTA = timedelta(hours=8# 本地时区偏差  
  3.   
  4. class UTC(tzinfo):  
  5.     def utcoffset(self, dt):  
  6.         return ZERO_TIME_DELTA  
  7.   
  8.     def dst(self, dt):  
  9.         return ZERO_TIME_DELTA  
  10.   
  11. class LocalTimezone(tzinfo):  
  12.     def utcoffset(self, dt):  
  13.         return LOCAL_TIME_DELTA  
  14.   
  15.     def dst(self, dt):  
  16.         return ZERO_TIME_DELTA  
  17.   
  18.     def tzname(self, dt):  
  19.         return '+08:00'  

一个tzinfo类需要实现utcoffset、dst和tzname这3个方法。其中utcoffset需要返回夏时令的时差调整;tzname需要返回时区名,如果你不需要用到的话,也可以不实现。

一旦生成了一个offset-aware类型的datetime对象,我们就能调用它的astimezone()方法,生成其他时区的时间(会根据时差来计算)。
而如果拿到的是offset-naive类型的datetime对象,也是可以调用它的replace()方法来替换tzinfo的,只不过这种替换不会根据时差来调整其他时间属性。
因此,如果拿到一个格林威治时间的offset-naive类型的datetime对象,直接调用replace(tzinfo=UTC())即可转换成offset-aware类型,然后再调用astimezone()生成其他时区的datetime对象。
而如果是+6:00时区的offset-naive类型的datetime对象,则可以创建一个+6:00时区的tzinfo类,然后用上述方式转换。
而反过来要将offset-aware类型转换成offset-naive类型时,为了不至于弄混,建议先用astimezone(UTC())生成格林威治时间,然后再replace(tzinfo=None)。


看上去一切都很简单,但不知道你还是否记得上文所述的夏时令。
提起夏时令这个玩意,真是让我头疼,因为它没有规则可循:有的国家实行夏时令,有的国家不实行,有的国家只在部分地区实行夏时令,有的地区只在某些年实行夏时令,每个地区实行夏时令的起止时间都不一定相同,而且有的地方TMD还不是用几月几日来指定夏时令的起止时间的,而是用某月的第几个星期几这种形式,。
所以说要写这样一个通用的dst方法估计能把人气死,于是我只好找来了pytz这个第三方库。(注意不要去sourceforge下载,那个版本4年没更新了,有严重bug。)

这个pytz的文档初看起来很简单,用pytz.country_timezones('国家代码')可以拿到这个国家的时区名列表,而用pytz.timezone('时区名')就能获取一个tzinfo对象。
例如取中国的第一个时区来生成datetime对象:

[python]  view plain copy
  1. >>> from datetime import datetime  
  2. >>> import pytz  
  3. >>> tz = pytz.timezone(pytz.country_timezones('cn')[0])  
  4. >>> tz  
  5. 'Asia/Shanghai' LMT+8:06:00 STD>  
  6. >>> datetime.now(tz)  
  7. datetime.datetime(20101214192612656000, tzinfo=
  8. ghai' CST+8:00:00 STD>)  

可是它有个很奇怪的陷阱,注意看那个tz,它实际上是+8:06:00,比北京时间快了6分钟。更扯淡的是,中国的时区里找不到北京时间,只能拿上海时间来凑数…
平时使用时可能没什么问题,但是构造datetime对象,或调用replace方法时就会莫名其妙地差6分钟了:

[python]  view plain copy
  1. >>> dt = datetime.now(tz)  
  2. >>> dt  
  3. datetime.datetime(20101214193223281000, tzinfo=
  4. ghai' CST+8:00:00 STD>)  
  5. >>> dt2 = datetime(20101214193223281000, tzinfo=tz)  
  6. >>> dt2  
  7. datetime.datetime(20101214193223281000, tzinfo=
  8. ghai' LMT+8:06:00 STD>)  
  9. >>> dt == dt2  
  10. False  
  11. >>> dt - dt2  
  12. datetime.timedelta(0360)  
  13. >>> dt.tzinfo  
  14. 'Asia/Shanghai' CST+8:00:00 STD>  
  15. >>> dt2.tzinfo  
  16. 'Asia/Shanghai' LMT+8:06:00 STD>  

用同一个tz生成的datetime对象,居然会出现不相等的结果,而且连它们的tzinfo都不一样…

要解决这个问题,最简单的方法就是使用台北(Asia/Taipei)时间,它正好是+08:00。不过这样治标不治本,毕竟还有那么多不是整点的时区,不可能一一去找替代时区。
实际上limodou在《关于pytz的一些记录(续)》这篇文章中也提到了这个问题,他指出只要构造时生成offset-naive类型的datetime对象,再用tz.localize(dt)就能生成正确的时间了:

[python]  view plain copy
  1. >>> dt3 = datetime(20101214193223281000)  
  2. >>> dt3 = tz.localize(dt3)  
  3. >>> dt3  
  4. datetime.datetime(20101214193223281000, tzinfo=
  5. ghai' CST+8:00:00 STD>)  
  6. >>> dt == dt3  
  7. True  

最后就是关键的处理夏时令的代码,需要用到normalize方法:

[python]  view plain copy
  1. >>> eastern = pytz.timezone('US/Eastern')  
  2. >>> dt4 = datetime(2002102710)  
  3. >>> dt4 = eastern.localize(dt4)  
  4. >>> print dt4  
  5. 2002-10-27 01:00:00-05:00  
  6. >>> dt5 = dt4 - timedelta(minutes=10)  
  7. >>> print dt5  
  8. 2002-10-27 00:50:00-05:00  
  9. >>> dt6 = eastern.normalize(dt5)  
  10. >>> print dt6  
  11. 2002-10-27 01:50:00-04:00  
  12. >>> dt5.tzinfo  
  13. 'US/Eastern' EST-1 day, 19:00:00 STD>  
  14. >>> dt6.tzinfo  
  15. 'US/Eastern' EDT-1 day, 20:00:00 DST>  

可以看到,normalize以后,就能正确处理夏时令的变更了。


你可能感兴趣的:(Python)