Pandas处理日期数据

一、pandaas日期处理的作用:

将2018-01-01、1/1/2018等多种日期格式映射成统一的格式对象,在该对象上提供强大的功能支持

几个概念

1、pd.to_datetime:pandas的一个函数,能将字符串、列表、series变成日期形式
2、Timestamp:pandas表示日期的对象形式
3、DatetimeIndex:pandas表示日期的对象列表形式
其中
DatetimeIndex是Timestamp的列表形式
pd.to_datetime对单个日期字符串处理会得到Timestamp
pd.to_datetime对日期字符串列表处理会得到DatetimeIndex

二、统计每周、每月、每季度的最高温度

1、读取天气数据到dataframe
import pandas as pd
fpath = "./datas/beijing_tianqi_2018.csv"
df = pd.read_csv(fpath)
# 替换掉温度的后缀℃
df.loc[:, "bWendu"] = df["bWendu"].str.replace("℃", "").astype('int32')
df.loc[:, "yWendu"] = df["yWendu"].str.replace("℃", "").astype('int32')
df.head()

Pandas处理日期数据_第1张图片

2、将日期列转换成pandas的日期
pd.to_datetime(df['ymd'], format="%Y-%m-%d")

Pandas处理日期数据_第2张图片

df['ymd2'] = pd.to_datetime(df['ymd'])
df.set_index(pd.to_datetime(df["ymd"]), inplace=True)
df.head()

Pandas处理日期数据_第3张图片

df.index

Pandas处理日期数据_第4张图片

# DatetimeIndex是Timestamp的列表形式
df.index[0]
	Timestamp('2018-01-01 00:00:00')
df.index.strftime('%y/%m/%d')

Pandas处理日期数据_第5张图片

3、 方便的对DatetimeIndex进行查询
# 筛选固定的某一天
df.loc['2018-01-05']

Pandas处理日期数据_第6张图片

# 日期区间
df.loc['2018-01-05':'2018-01-10']

Pandas处理日期数据_第7张图片

# 按月份前缀筛选
df['2018-03'].head()

Pandas处理日期数据_第8张图片

# 按月份前缀筛选
df.loc["2018-07":"2018-09"].index

Pandas处理日期数据_第9张图片

# 按年份前缀筛选
df.loc["2018"].head()

Pandas处理日期数据_第10张图片

#过滤掉之前的
df.truncate(before='2018-2-25').head()

Pandas处理日期数据_第11张图片
#过滤掉之后的
df.truncate(after=‘2018-2-25’).tail()
Pandas处理日期数据_第12张图片

4、 生成日期范围
pandas.date_range(start=None, end=None, periods=None, freq='D', tz=None, normalize=False, name=None, closed=None, **kwargs)
该函数主要用于生成一个固定频率的时间索引,在调用构造方法时,必须指定start、end、periods中的两个参数值,否则报错.
start: 起始时间
end: 末尾时间
periods: 要生成的时段数
freq: 日期偏移量,取值为string或DateOffset,默认为'D'
pd.date_range(start='20180101',end='20180110')

在这里插入图片描述

pd.date_range(start='20180101',end='20180110' , periods=3)

在这里插入图片描述

pd.date_range(start='201801010000',end='201801010100',freq = '300s')

Pandas处理日期数据_第13张图片

5、方便的获取周、月、季度
# 周数字列表
df.index.week

在这里插入图片描述

df.ymd2.dt.week

Pandas处理日期数据_第14张图片

# 月数字列表
df.index.month

在这里插入图片描述

# 季度数字列表
df.index.quarter

在这里插入图片描述

三、python中时间日期格式化符号:

%y 两位数的年份表示(00-99)
%Y 四位数的年份表示(000-9999)
%m 月份(01-12)
%d 月内中的一天(0-31)
%H 24小时制小时数(0-23)
%I 12小时制小时数(01-12)
%M 分钟数(00=59)
%S 秒(00-59)
%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天(001-366)
%p 本地A.M.或P.M.的等价符
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身

你可能感兴趣的:(pandas学习,数据挖掘,python,数据分析)