pd_to_datetime将时间戳转换日期格式,日期不正确

一、问题描述

笔者需要将时间戳数据转换成日期格式,使用的是pd_to_datetime进行转换,得到了如下图结果

data["date_"] = pd.to_datetime(data["timestamp"],unit = "ms")

pd_to_datetime将时间戳转换日期格式,日期不正确_第1张图片

一眼看上去是转换正确了,但使用线上的工具进行验证时 出现了不一致性pd_to_datetime将时间戳转换日期格式,日期不正确_第2张图片

二、原因分析 

线上的工具和使用pd_to_datetime转换得到的时间刚好相差8个小时,初步感觉是时区出现了问题,希望通过阅读文档找到如何去修改时区的属性

 但经过查看pd_to_datetime文档,发现有一个utc的字段,来控制时区,也改变不了

pd_to_datetime将时间戳转换日期格式,日期不正确_第3张图片

在网上查阅其他资料后,发现有一个老哥在也遇到过这个问题:链接 ,感觉遇到了救星,但一翻尝试后,发现,这个方法挺复杂的,不如我写个函数直接搞定

pd_to_datetime将时间戳转换日期格式,日期不正确_第4张图片

 三、解决办法

方法一

继续使用pd.to_datetime,使用orgin字段控制一下起始时间,暂没有找到优雅的直接控制时区的办法


data["date_orgin"] = pd.to_datetime(data["timestamp"],unit = "ms",origin = "1970-01-01 08:00:00")

方法二

使用apply方法加自己自定义一个函数

def stamp2time(timeStamp): #时间戳转日期函数
    """
    功能:将时间戳转换成日期函数 例如:1606708276268 ==》2020-11-30 11:51:16
    参数:timeStamp 时间戳,类型 double 例如:1606708276268
    返回值:日期, 类型:字符串 2020-11-30 11:51:16
    """
    time_local = time.localtime(timeStamp/1000)
    dt = time.strftime("%Y-%m-%d %H:%M:%S", time_local)
    
    return dt


data['date_func'] = data["timestamp"].apply(stamp2time)

你可能感兴趣的:(python,python,pandas,datetime)