Pandas日期数据处理函数 to_datetime()

**

to_datetime函数可以用来批量处理日期数据转换,可以将日期数据转换成你需要的各种格式。

**

如: 13-oct-18 , 10/13/18 , 2018.10.13 , 2018/10/13, 20181013 , 转换成 2018-10-13

to_datetime(arg,errors=“ignore”,dayfirst=False,yearfirst=False,utc=None,box=True,format=None,exact=True,unit=None,inter_datetime=False,origin=“unix”,cache=False)

#参数
#arg 字符串,日期时间,字符串数组
#errors 值为ignore,raise,coerce 默认值为ignore,即忽略错误
ignore 无效的解析将返回原值
raise 无效的解析将引发异常
coerce 无效的解析将被设置为NaT 既无法转换为日期的数据将被转换为NaT
注释:解析----应该是对字段中的每一个元素进行操作
#dayfirst 第一个值设置为天,布尔型,默认为False 如 02-08-2012 解析日期与原日期一致
2012-02-08 如果为True 则为2012-08-02
#yearfirst 第一个值设置为年,布尔型,默认为False 如 02-03-20 解析日期与原日期一致 2020-03-02
如果为True 则为2002-02-20
#utc 默认值为none 返回utc即协调世界时间
#box 布尔值 默认值为True 如果为True,返回DatetimeIndex,如果为False,则返回ndarray
#format 格式化显示时间的格式。字符串,默认值为None
#exact 布尔值 默认值为True 如果为True,则要求格式完全匹配 如果为False
则要求格式与目标字符串中的任何位置匹配
#unit 默认值为None 参数的单位(D,s,ms,μs,ns)表示时间的单位
#infer_date_format 默认值为False 如果没有格式 则尝试
根据第一个日期时间字符串推断格式
#origin 默认值为unix 定义参考日期 数值将被解析为单位数
#cache 默认值为False 如果值为True,则使用唯一,转换日期的缓存应用日期时间转换。
在解析重复日期字符串,特别是带有时区偏移的字符串时,可能会产生明显的加速。只有在至少50个值时才使用缓存。
越界值的存在将使缓存不可用,并可能减慢解析速度
#返回值 日期时间

data_time = {"原日期":["02-08-18","02-Feb-18","02/08/18","020818","02-08/18"]}       #创建时间列   不同格式及类型的时间数据
data_table = pd.DataFrame(data_time)    #创建一个包含时间列的二维表格
data_table 
输出如下:
				原日期
			0	02-08-18
			1	02-Feb-18
			2	02/08/18
			3	020818
			4	02-08/18
data_table["原日期"]     #取出原日期这一列并观察它的数据类型
			0     02-08-18
			1    02-Feb-18
			2     02/08/18
			3       020818
			4     02-08/18
			Name: 原日期, **dtype: object**      这里日期为字符串类型

pd.to_datetime(data_table["原日期"])       #将原日期转换为时间格式并统一
			0   2018-02-08
			1   2018-02-02
			2   2018-02-08
			3   2018-02-08
			4   2018-02-08
			Name: 原日期, **dtype: datetime64[ns]**    这里日期转化为日期类型
data_table["原日期"] = pd.to_datetime(data_table["原日期"])     #将转换后的日期与原来的日期替换  改变原有字段列的内容
data_table
				原日期
			0	2018-02-08
			1	2018-02-02
			2	2018-02-08
			3	2018-02-08
			4	2018-02-08
			```

你可能感兴趣的:(pandas)