因为时间处理问题,导致数据与业务方一直不吻合,找了很久的原因,才发现原来是时间处理上出了问题,因此总结下经验,希望更加细致。
(1) to_date()
转化为日期格式
(2) add_months(date,n)
在日期上加几个月
(3) last_day()
求日期所对应的月份的最后一天
(4) SUBSTR(string, start, length)
用于提取一定长度的字符串
(1) 按字符串拆分
在处理过程中一定要注意到底是拆分出多少字符
,拆分完成之后一定要注意检查
,比如可能拆分出来是2023-、2023-0等不正确的形式
# create_date:2023-01-01 03:04:44
data['apply_date']=[str(x)[:10] for x in data['create_date']]
(2) 两个日期求间隔天数
pd.to_datetime()
转化日期函数x.days
转化成相差的天数data['cha']=pd.to_datetime(data['day1'])-pd.to_datetime([str(x)[:10] for x in data['create_date']])
data['cha']=[abs(x.days) for x in data['cha']]
(3) 查看当前时间
# 用于查看进行某项操作所需要的时间
starttime=datetime.datetime.now()
print('取数开始时间为:',starttime)
...
endtime=datetime.datetime.now()
print('取数结束时间为:',endtime)