【python】时间序列缺失值填充

问题

最近在做时间序列预测,采集到的数据,时间上存在部分数值数据缺失,如下图

【python】时间序列缺失值填充_第1张图片

解决办法

经过查找,可以通过pandas库中resample方法解决

代码

import pandas as pd

# 导入库
df = pd.read_csv('average_data.csv')
df = df.drop_duplicates(['time'])  # 为防止有重复索引序列,将其删除
df = pd.DataFrame(df).set_index('time')  # 将时间列变为索引

df.index = pd.to_datetime(df.index, format='%Y-%m-%d %H:%M:%S')
df1 = df.resample('T').bfill()  # 这里用重采样,变为每分钟采样,并向后一直填充上一个值

df1.to_csv("data.csv")

效果

【python】时间序列缺失值填充_第2张图片

你可能感兴趣的:(数据处理,python,pandas,数据分析)