【Python时间序列】01-将数据按照日期分组统计,导出csv文件

Python时间序列01

需求:将数据按照日期分组统计,导出csv文件

import pandas as pd
#导入库
data = pd.read_excel("TimeSeriesCourseworkData20_21 (2).xlsx")
#加载数据
data.plot()
#大致看一下

【Python时间序列】01-将数据按照日期分组统计,导出csv文件_第1张图片

data.head()
#大致看一下前五行
Call City Municipality
0 2018-12-31 22:31:28 JAKARTA TIMUR
1 2018-12-31 23:46:09 JAKARTA TIMUR
2 2019-01-01 00:12:30 JAKARTA TIMUR
3 2019-01-01 01:16:56 JAKARTA TIMUR
4 2019-01-01 01:21:18 JAKARTA BARAT
data.shape
#看看多少行多少列
(22540, 2)
data.dtypes
#查看数据类型
Call                 datetime64[ns]
City Municipality            object
dtype: object
  1. Pandas.Series.dt.hour #取小时
  2. Pandas.Series.dt.minute #取分钟
  3. Pandas.Series.dt.second #取秒
  4. Pandas.Series.dt.year #取年
  5. Pandas.Series.dt.month #取月
  6. Pandas.Series.dt.day #取天
  7. Pandas.Series.dt.date #取日期
  8. Pandas.Series.dt.time #取时间
  9. Pandas.Series.dt.strftime(’%y-%m-%d %h:%m:%s’) #此处可灵活变动,根据需求来变动。
data['just_date']=data['Call'].dt.date
#加一列just_date
data.head()
#看一下前五行
Call City Municipality just_date
0 2018-12-31 22:31:28 JAKARTA TIMUR 2018-12-31
1 2018-12-31 23:46:09 JAKARTA TIMUR 2018-12-31
2 2019-01-01 00:12:30 JAKARTA TIMUR 2019-01-01
3 2019-01-01 01:16:56 JAKARTA TIMUR 2019-01-01
4 2019-01-01 01:21:18 JAKARTA BARAT 2019-01-01
dd=data.groupby("just_date")["just_date"].count().reset_index(name="count")
#分组统计
type(dd)
#查看数据类型
pandas.core.frame.DataFrame
outputpath = 'result_test.csv'
# outputpath是保存文件路径,同一文件夹下
 
dd.to_csv(outputpath,sep=',',index=False,header=True) 
# df1是你想要输出的的DataFrame
# index是否要索引,header是否要列名,True就是需要

你可能感兴趣的:(时间序列,python)