在处理分析数据时经常会进行分组分类,如样本有很多条,每一条样本都是具体到每一天多少时分,但我们可能只想获得每个月的情况,这就需要进行一个归类与分组。
演示数据:
代码段:
import pandas as pd
data = pd.read_excel('data.xlsx')#读取数据
data['time']=data['时间'].dt.strftime('%y%m')#将数据中的时间列按照“年-月”的格式输出
但这样会报错,报错提示为:
AttributeError: Can only use .dt accessor with datetimelike values
报错原因:
python认为“时间”列为字符串类型,无法进行识别
解决方法:
先将“时间”列转化为date格式,再进行处理:
import pandas as pd
data = pd.read_excel('data.xlsx')
data['month']=pd.to_datetime(data['时间'], errors='coerce')
data['time']=data['month'].dt.strftime('%y%m')
此外,关于pandas的日期转化,参考了一篇博客,总结如下:
Pandas.Series.dt.hour #取小时 Pandas.Series.dt.minute #取分钟 Pandas.Series.dt.second #取秒 Pandas.Series.dt.year #取年 Pandas.Series.dt.month #取月 Pandas.Series.dt.day #取天 Pandas.Series.dt.date #取日期 Pandas.Series.dt.time #取时间 Pandas.Series.dt.strftime(’%y-%m-%d %h:%m:%s’) #此处可灵活变动,根据需求来变动
https://blog.csdn.net/weixin_47717959/article/details/116439356