首先导入pandas库
import pandas as pd;
Timedelta在pandas中是一个表示两个datetime值之间的差(如日,秒和微妙)的类型,2个Datetime数据运算相减得出的结果就是一个Timedelta数据类型
Datetime只支持+操作,其余运算符操作不会报错
pd.to_datetime('2019-9-4') - pd.to_datetime('2018-1-1')
代码结果:
Timedelta('611 days 00:00:00')
可以看到,结果是一个Timedelta类型,并且算出了2019年9月4日到2018年1月日共有多少天
如果只写年默认1月1日
pd.to_datetime('2019-9-4') - pd.to_datetime('2018')
代码结果:
Timedelta('611 days 00:00:00')
只写年月默认1日
pd.to_datetime('2019-9-4') - pd.to_datetime('2018-1')
代码结果:
Timedelta('611 days 00:00:00')
可以看到结果是一样的
pd.Timedelta('3 days 3 hours 3 minutes 30 seconds')
代码结果:
Timedelta('3 days 03:03:30')
pd.Timedelta(5,unit='d')
代码结果:
Timedelta('5 days 00:00:00')
pd.Timedelta(days=2)
代码结果:
Timedelta('2 days 00:00:00')
以上方法可根据喜好使用
age = (pd.to_datetime('2019-9-4') - pd.to_datetime('1993-5-27')) / pd.Timedelta(days=365)
print(age)
代码结果:
26.29041095890411
计算生日为1993年5月27日的人今年的年龄
当然也可以用pd.datetime.now()获取当前时间
age = (pd.datetime.now() - pd.to_datetime('1993-5-27')) / pd.Timedelta(days=365)
print(age)
代码结果:
26.29180006733137
可以看到结果有所不同,那是因为datetime默认从毫秒开始,所以时间一直在变化
我们可以简单优化处理一下
age = (pd.datetime.now() - pd.to_datetime('1993-5-27')) / pd.Timedelta(days=365)
age = int(age)
print('实岁是{}岁'.format(age))
代码结果:
实岁是26岁
age = (pd.datetime.now() - pd.to_datetime('1993-5-27')) / pd.Timedelta(days=365)
age = int(age) + 1
print('虚岁是{}岁'.format(age))
在实际工作中
我们经常会碰到对于时间的筛选
比如到货日期、注册日期等
pandas里可以利用Timedelta对日期进行一些筛选处理
实际中大多时间数据都以字符串类型存储
这样的表格我们日常经常看到
现在我们先看一下发货日期列是什么类型
可以看到目前发货日期列是object
所以我们首先要用pd.to_datetime将这列转为时间类型
df['发货日期'] = pd.to_datetime(df['发货日期'])
我们再来看看
可以看发货日期列已经修改为datetime类型
pandas的to_datetime功能还是比较强大,能够自动识别出日期格式,无论你是YYYY-MM-DD还是YYYY/MM/DD,可以转换很多不同的日期格式
格式修改完毕后我们就可以对它进行操作了
我想要筛选出发货日期距今天30天之内的所有数据(当前日期为2020年3月24日)
df[(pd.datetime.now()- df['发货日期']) > pd.Timedelta(days=30)]
最新的pandas将会要取消内置的datetime,需要外部导入datetime模块,本质上是一样操作的
结果:
感谢你的观看
欢迎讨论和指正!