python:时间戳处理
数据来自科大讯飞算法营销大赛,处理时间数据的目的是为了探索时间与广告点击率的关系。
(文章内出现的df_info与df_new_new视为等同)
1.将脱敏后的时间恢复为正常时间格式
2.在这里我们选择小时的单位来进行分析探索,提取hour
3.将hour的ge是转化为整数型后,简单探索下hour
4.我们将时间分桶,按时间段来探索数据
5.探索不同时间段内广告点击率的情况,可视化信息
6.来看下曝光量和点击量的情况,这里我们在python中得出数据,在其他软件中制作图表。
7.总结(一):
1.除深夜凌晨时段外,其他时间段广告点击率表现良好均超0.2。
2.晚间6点至9点的曝光率最高,白天的点击量均等。
这里,维度二的处理将用另外一种数据清洗方法。
1.确保要提取数据的一列格式为datetime
2.提取weekday信息
3.处理weekday数据,新建一列判断是否周末
4.顺便提及int32与int64的转化,用np.int64
5.得出一系列数据,利用其它软件进行数据可视化
6.总结(二):
1.工作日与周末的平均点击率几乎均等,工作日略高。
2.工作日与周末的平均每日曝光量与每日点击量均等。
3.工作日与周末的差别对广告点击率的影响几乎没有。