pandas中的时序数据分组运算及非常全面的常规数据处理代码

这篇为纯记录(留下痕迹,日后好相见)
实战:

def fic_DST(data): #删除数据重复值、无数据地方进行填充
    
    #duplicated函数用于标记Series中的值、DataFrame中的记录行是否是重复,重复为True,不重复为False
    #keep=‘frist’:除了第一次出现外,其余相同的被标记为重复
    # resample()进行重采样。
    # 重采样(Resampling)指的是把时间序列的频度变为另一个频度的过程。
    # 把高频度的数据变为低频度叫做降采样(downsampling),把低频度变为高频度叫做增采样(upsampling)。
    data = data[~data.index.duplicated(keep ='first')] 
    data = data.resample("H").ffill()  #使用ffill()进行填充  H:小时T
    return data

pandas中的时序数据分组运算-详解
非常全面的常规数据处理代码

你可能感兴趣的:(笔记,pandas)