爬虫(五十四)通用标准库 time(四十五)

几乎所有的正式代码中,我们都需要与时间打交道。在Python中,与时间处理有关的模块包括timedatetime以及calendar,本节主要讲解time模块。

在Python中,用三种方式来表示时间,分别是时间戳、格式化时间字符串和结构化时间

  1. 时间戳(timestamp):也就是1970年1月1日之后的秒,例如1506388236.216345,可以通过time.time()获得。时间戳是一个浮点数,可以进行加减运算,但请注意不要让结果超出取值范围。

  2. 格式化的时间字符串(string_time):也就是年月日时分秒这样的我们常见的时间字符串,例如2017-09-26 09:12:48,可以通过time.localtime()获得;

  3. 结构化时间(struct_time):一个包含了年月日时分秒的多元元组,例如time.struct_time(tm_year=2017, tm_mon=9, tm_mday=26, tm_hour=9, tm_min=14, tm_sec=50, tm_wday=1, tm_yday=269, tm_isdst=0),可以通过time.strftime('%Y-%m-%d')获得。

由于Python的time模块实现主要调用C库,所以各个平台可能有所不同。time模块目前只支持到2038年前。如果需要处理范围之外的日期,请使用datetime模块。

UTC(Coordinated Universal Time,世界协调时),亦即格林威治天文时间,世界标准时间。我们中国为东八区,比UTC早8个小时,也就是UTC+8。关于UTC的缩写,有个故事,你可能已经注意到了,按英文的缩写,应该是CUT,而不是UTC。但是世界协调时在法文中的缩写是TUC,两国互相不让,作为妥协,最后干脆简称UTC。

DST(Daylight Saving Time)即夏令时。

一、结构化时间(struct_time

使用time.localtime()等方法可以获得一个结构化时间元组。

>>> time.localtime()
time.struct_time(tm_year=2017, tm_mon=9, tm_mday=26, tm_hour=10, tm_min=6, tm_sec=49, tm_wday=1, tm_yday=269, tm_isdst=0)

结构化时间元组共有9个元素,按顺序排列如下表:

爬虫(五十四)通用标准库 time(四十五)_第1张图片

既然结构化时间是一个元组,那么就可以通过索引进行取值,也可以进行分片,或者通过属性名获取对应的值。

>>>import time
>>> lt = time.localtime()
>>> lt
time.struct_time(tm_year=2017, tm_mon=9, tm_mday=26, tm_hour=9, tm_min=27, tm_sec=29, tm_wday=1, tm_yday=269, tm_isdst=0)
>>> lt[3]
9
>>> lt[2:5]
(26, 9, 27)
>>> lt.tm_wday
1

但是要记住,Python的time类型是不可变类型,所有的时间值都只读,不能改!!

>>> lt.tm_wday = 2
Traceback (most recent call last):
  File "", line 1, in 
    lt.tm_wday = 2
AttributeError: readonly attribute

二、 格式化时间字符串

利用time.strftime('%Y-%m-%d %H:%M:%S')等方法可以获得一个格式化时间字符串。

>>> time.strftime('%Y-%m-%d %H:%M:%S')
'2017-09-26 10:04:28'

注意其中的空格、短横线和冒号都是美观修饰符号,真正起控制作用的是百分符。对于格式化控制字符串"%Y-%m-%d %H:%M:%S,其中每一个字母所代表的意思如下表所示,注意大小写的区别:

爬虫(五十四)通用标准库 time(四十五)_第2张图片

爬虫(五十四)通用标准库 time(四十五)_第3张图片

三、 time模块主要方法

1. time.sleep(t)

time模块最常用的方法之一,用来睡眠或者暂停程序t秒,t可以是浮点数或整数。

2. time.time()

返回当前系统时间戳。时间戳可以做算术运算。

>>> time.time()
1506391907.020303

该方法经常用于计算程序运行时间:

import time

def func():
    time.sleep(1.14)
    pass

t1 = time.time()
func()
t2 = time.time()
print(t2 - t1)

#print(t2 + 100)
#print(t1 - 10)
#print(t1*2)

3. time.gmtime([secs])

将一个时间戳转换为UTC时区的结构化时间。可选参数secs的默认值为time.time()

>>> time.gmtime()
time.struct_time(tm_year=2017, tm_mon=9, tm_mday=26, tm_hour=2, tm_min=14, tm_sec=17, tm_wday=1, tm_yday=269, tm_isdst=0)
>>> t = time.time() - 10000
>>> time.gmtime(t)
time.struct_time(tm_year=2017, tm_mon=9, tm_mday=25, tm_hour=23, tm_min=31, tm_sec=3, tm_wday=0, tm_yday=268, tm_isdst=0)

4. time.localtime([secs])

将一个时间戳转换为当前时区的结构化时间。如果secs参数未提供,则以当前时间为准,即time.time()

>>> time.localtime()
time.struct_time(tm_year=2017, tm_mon=9, tm_mday=26, tm_hour=10, tm_min=20, tm_sec=42, tm_wday=1, tm_yday=269, tm_isdst=0)
>>> time.localtime(1406391907)
time.struct_time(tm_year=2014, tm_mon=7, tm_mday=27, tm_hour=0, tm_min=25, tm_sec=7, tm_wday=6, tm_yday=208, tm_isdst=0)
>>> time.localtime(time.time() + 10000)
time.struct_time(tm_year=2017, tm_mon=9, tm_mday=26, tm_hour=13, tm_min=7, tm_sec=54, tm_wday=1, tm_yday=269, tm_isdst=0)

5. time.ctime([secs])

把一个时间戳转化为本地时间的格式化字符串。默认使用time.time()作为参数。

>>> time.ctime()
'Tue Sep 26 10:22:31 2017'
>>> time.ctime(time.time())
'Tue Sep 26 10:23:51 2017'
>>> time.ctime(1406391907)
'Sun Jul 27 00:25:07 2014'
>>> time.ctime(time.time() + 10000)
'Tue Sep 26 13:11:55 2017'

6. time.asctime([t])

把一个结构化时间转换为Sun Aug 23 14:31:59 2017这种形式的格式化时间字符串。默认将time.localtime()作为参数。

>>> time.asctime()
'Tue Sep 26 10:27:23 2017'
>>> time.asctime(time.time())
Traceback (most recent call last):
  File "", line 1, in 
    time.asctime(time.time())
TypeError: Tuple or struct_time argument required
>>> time.asctime(time.localtime())
'Tue Sep 26 10:27:45 2017'
>>> time.asctime(time.gmtime())
'Tue Sep 26 02:27:57 2017'

7. time.mktime(t)

将一个结构化时间转化为时间戳。time.mktime()执行与gmtime(),localtime()相反的操作,它接收struct_time对象作为参数,返回用秒数表示时间的浮点数。如果输入的值不是一个合法的时间,将触发OverflowErrorValueError

>>> time.mktime(1406391907)
Traceback (most recent call last):
  File "", line 1, in 
    time.mktime(1406391907)
TypeError: Tuple or struct_time argument required
>>> time.mktime(time.localtime())
1506393039.0

8. time.strftime(format [, t])

返回格式化字符串表示的当地时间。把一个struct_time(如time.localtime()time.gmtime()的返回值)转化为格式化的时间字符串,显示的格式由参数format决定。如果未指定t,默认传入time.localtime()。如果元组中任何一个元素越界,就会抛出ValueError的异常。

>>> time.strftime("%Y-%m-%d %H:%M:%S")
'2017-09-26 10:34:50'
>>> time.strftime("%Y-%m-%d %H:%M:%S",time.gmtime())
'2017-09-26 02:34:53'

9. time.strptime(string[,format])

将格式化时间字符串转化成结构化时间。该方法是time.strftime()方法的逆操作。time.strptime()方法根据指定的格式把一个时间字符串解析为时间元组。要注意的是,你提供的字符串要和format参数的格式一一对应,如果string中日期间使用“-”分隔,format中也必须使用“-”分隔,时间中使用冒号“:”分隔,后面也必须使用冒号分隔,否则会报格式不匹配的错误。并且值也要在合法的区间范围内,千万不要整出14个月来。

>>> import time
>>> stime = "2017-09-26 12:11:30"
>>> st  = time.strptime(stime,"%Y-%m-%d %H:%M:%S")
>>> st
time.struct_time(tm_year=2017, tm_mon=9, tm_mday=26, tm_hour=12, tm_min=11, tm_sec=30, tm_wday=1, tm_yday=269, tm_isdst=-1)
>>> for item in st:
    print(item)


2017
9
26
12
11
30
1
269
-1
>>> wrong_time = "2017-14-26 12:11:30"
>>> st  = time.strptime(wrong_time,"%Y-%m-%d %H:%M:%S")
Traceback (most recent call last):
  File "", line 1, in 
    st  = time.strptime(wrong_time,"%Y-%m-%d %H:%M:%S")
  File "C:\Python36\lib\_strptime.py", line 559, in _strptime_time
    tt = _strptime(data_string, format)[0]
  File "C:\Python36\lib\_strptime.py", line 362, in _strptime
    (data_string, format))
ValueError: time data '2017-14-26 12:11:30' does not match format '%Y-%m-%d %H:%M:%S'

10. time.clock()

返回执行当前程序的CPU时间。用来衡量不同程序的耗时。该方法在不同的系统上含义不同。在Unix系统上,它返回的是“进程时间”,用秒表示的浮点数(时间戳)。在Windows中,第一次调用,返回的是进程运行的实际时间,而第二次之后的调用是自第一次调用以后到现在的运行时间。

import time

def procedure() :
  time.sleep(3)

time1 = time.clock()
procedure()
print(time.clock() - time1, "seconds process time!")

执行结果:

2.999257758349577 seconds process time!

四、 时间格式之间的转换

Python的三种类型时间格式,可以互相进行转换,如下图和下表所示:

爬虫(五十四)通用标准库 time(四十五)_第4张图片

爬虫(五十四)通用标准库 time(四十五)_第5张图片

>>> t = time.time()         # t是一个时间戳
>>> time.gmtime(t - 10000)      # t减去1万秒,然后转换成UTC结构化时间
time.struct_time(tm_year=2017, tm_mon=9, tm_mday=25, tm_hour=22, tm_min=50, tm_sec=36, tm_wday=0, tm_yday=268, tm_isdst=0)
>>> lt = time.localtime(t - 10000)  # t减去1万秒,然后转换成中国本地结构化时间
time.struct_time(tm_year=2017, tm_mon=9, tm_mday=26, tm_hour=6, tm_min=50, tm_sec=36, tm_wday=1, tm_yday=269, tm_isdst=0)
>>> time.mktime(lt)     # 从本地结构化时间转换为时间戳
1506379836.0
>>> st = time.strftime("%Y-%m-%d %H:%M:%S",lt)  # 从本地结构化时间转换为时间字符串
>>> st
'2017-09-26 06:50:36'
>>> lt2 = time.strptime(st, "%Y-%m-%d %H:%M:%S") # 从时间字符串转换为结构化时间
>>> lt2
time.struct_time(tm_year=2017, tm_mon=9, tm_mday=26, tm_hour=6, tm_min=50, tm_sec=36, tm_wday=1, tm_yday=269, tm_isdst=-1)

请继续关注我

记得点赞加关注哦,记得加鸡腿啊

你可能感兴趣的:(爬虫(五十四)通用标准库 time(四十五))