pandas 按日期对数据进行分组归类及其问题

在处理分析数据时经常会进行分组分类,如样本有很多条,每一条样本都是具体到每一天多少时分,但我们可能只想获得每个月的情况,这就需要进行一个归类与分组。

演示数据:

pandas 按日期对数据进行分组归类及其问题_第1张图片

代码段:

import pandas as pd
data = pd.read_excel('data.xlsx')#读取数据
data['time']=data['时间'].dt.strftime('%y%m')#将数据中的时间列按照“年-月”的格式输出

但这样会报错,报错提示为:

AttributeError: Can only use .dt accessor with datetimelike values

报错原因:

python认为“时间”列为字符串类型,无法进行识别

解决方法:

先将“时间”列转化为date格式,再进行处理:

import pandas as pd
data = pd.read_excel('data.xlsx')
data['month']=pd.to_datetime(data['时间'], errors='coerce')
data['time']=data['month'].dt.strftime('%y%m')

此外,关于pandas的日期转化,参考了一篇博客,总结如下:

Pandas.Series.dt.hour #取小时
Pandas.Series.dt.minute #取分钟
Pandas.Series.dt.second #取秒
Pandas.Series.dt.year #取年
Pandas.Series.dt.month #取月
Pandas.Series.dt.day #取天
Pandas.Series.dt.date #取日期
Pandas.Series.dt.time #取时间
Pandas.Series.dt.strftime(’%y-%m-%d %h:%m:%s’) #此处可灵活变动,根据需求来变动

https://blog.csdn.net/weixin_47717959/article/details/116439356

你可能感兴趣的:(python文本处理,python)