将2018-01-01、1/1/2018等多种日期格式映射成统一的格式对象,在该对象上提供强大的功能支持
几个概念
1、pd.to_datetime:pandas的一个函数,能将字符串、列表、series变成日期形式
2、Timestamp:pandas表示日期的对象形式
3、DatetimeIndex:pandas表示日期的对象列表形式
其中
DatetimeIndex是Timestamp的列表形式
pd.to_datetime对单个日期字符串处理会得到Timestamp
pd.to_datetime对日期字符串列表处理会得到DatetimeIndex
import pandas as pd
fpath = "./datas/beijing_tianqi_2018.csv"
df = pd.read_csv(fpath)
# 替换掉温度的后缀℃
df.loc[:, "bWendu"] = df["bWendu"].str.replace("℃", "").astype('int32')
df.loc[:, "yWendu"] = df["yWendu"].str.replace("℃", "").astype('int32')
df.head()
pd.to_datetime(df['ymd'], format="%Y-%m-%d")
df['ymd2'] = pd.to_datetime(df['ymd'])
df.set_index(pd.to_datetime(df["ymd"]), inplace=True)
df.head()
df.index
# DatetimeIndex是Timestamp的列表形式
df.index[0]
Timestamp('2018-01-01 00:00:00')
df.index.strftime('%y/%m/%d')
# 筛选固定的某一天
df.loc['2018-01-05']
# 日期区间
df.loc['2018-01-05':'2018-01-10']
# 按月份前缀筛选
df['2018-03'].head()
# 按月份前缀筛选
df.loc["2018-07":"2018-09"].index
# 按年份前缀筛选
df.loc["2018"].head()
#过滤掉之前的
df.truncate(before='2018-2-25').head()
#过滤掉之后的
df.truncate(after=‘2018-2-25’).tail()
pandas.date_range(start=None, end=None, periods=None, freq='D', tz=None, normalize=False, name=None, closed=None, **kwargs)
该函数主要用于生成一个固定频率的时间索引,在调用构造方法时,必须指定start、end、periods中的两个参数值,否则报错.
start: 起始时间
end: 末尾时间
periods: 要生成的时段数
freq: 日期偏移量,取值为string或DateOffset,默认为'D'
pd.date_range(start='20180101',end='20180110')
pd.date_range(start='20180101',end='20180110' , periods=3)
pd.date_range(start='201801010000',end='201801010100',freq = '300s')
# 周数字列表
df.index.week
df.ymd2.dt.week
# 月数字列表
df.index.month
# 季度数字列表
df.index.quarter
%y 两位数的年份表示(00-99)
%Y 四位数的年份表示(000-9999)
%m 月份(01-12)
%d 月内中的一天(0-31)
%H 24小时制小时数(0-23)
%I 12小时制小时数(01-12)
%M 分钟数(00=59)
%S 秒(00-59)
%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天(001-366)
%p 本地A.M.或P.M.的等价符
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身