根据limodou的《使用xlrd模块时对Excel的日期处理》可以处理年月日, 但时分秒没法处理。下面是他的原文:
=======================================================
最近在我正在开发的一个数据维护工具中我经常使用 xlrd 来读取Excel文件,在转换 过 程中一直也没有遇到什么问题,只不过需要注意,它返回的字符串都是 Unicode 编码。不过今天在使用时发现对于日期类型,在Excel文件中看到的可能是 "2005-7-8" 这样格式,但直接使用 xlrd 来读的话却会变成 38541。很奇怪。仔细查看 Excel 后再经过试验,我明白了 Excel 保存日期其实是使用一个长整数,只不过显示时可以为标准的日期格式。本来我想将日期在 Excel 中直接转为日期格式的字符串,但没整出来,而且我更希望有一种方法可以正确地进行转换 。于是我想 xlrd 有没有这样的处理呢?使用 NewEdit 的 代码提示功能,查了查 xlrd 模块的属**,没找到。不过看到它有cell_type(i, j)的方法可以返回一个单元格的数据格式。于是我使用这个方法打出日期所在的单元格的格式为:3。然后又比较了 xlrd 中定义的一些常量,最后锁定在了 XL_CELL_DATE上,它的值就是 3。这样到目前为止我已经知道了如何判断一个单元格是否是日期类型,下面就是如何转换 了。
我查阅了datetime 模式,在它的date 类中查到一个函数叫:
fromordinal(oridnal)
它的作用是将从公元1年1月1日开始的天数转换 为 年月日的形式。于是我试了一下:
>>> import datetime
>>> datetime.date .fromordinal(38541)
datetime.date (106, 7, 10)
好象不对呀。于是我反向转转试试:
>>> datetime.date .toordinal(datetime.date (2005, 7, 8))
732135
怎么这么大的数。后来我想到可能fromordinal与Excel使用的起始日期可 能是不同的。做个减法看一看是哪天。
>>> datetime.date .fromordinal(732135 - 38541 + 1)
datetime.date (1899, 12, 31)
原来如此,是 1899/12/31 日,这回我明白了。其实象用过的 Informix 中的日期与 Excel 的方法是一样的,都是从 1899/12/31 开始计算的。那么做个转换 函 数吧:
__s_date = datetime.date (1899, 12, 31).toordinal() - 1
def getdate(date ):
if isinstance(date , float ):
date = int(date )
d = datetime.date .fromordinal(__s_date + date )
return d.strftime("%Y-%m-%d")
上述函数就是用来将一个从 1899/12/31 开始计算的天数转成年月日的格式,并且是字符串的形式。其中如果传入的是一个浮点数,先取整再进行转换 。
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=459100
=======================================================