【pandas】[2] 移动窗口rolling的理解

概念:

​​为了提升数据的准确性,将某个点的取值扩大到包含这个点的一段区间,用区间来进行判断,这个区间就是窗口。移动窗口就是窗口向一端滑行,默认是从右往左,每次滑行并不是区间整块的滑行,而是一个单位一个单位的滑行。给个例子好理解一点:

import pandas as pd
s = [1,2,3,5,6,10,12,14,12,30]
pd.Series(s).rolling(window=3).mean()

首先为了好理解,先放上放上pd.Series(s)的样子给大家看看 
这里写图片描述

现在pd.Series(s).rolling(window=3).mean()处理后 
这里写图片描述

不知道大家看出了其中规律没有 
首先我们设置的窗口window=3,也就是3个数取一个均值。index 0,1 为NaN,是因为它们前面都不够3个数,等到index2 的时候,它的值是怎么算的呢,就是(index0+index1+index2 )/3 
index3 的值就是( index1+index2+index3)/ 3

参数详解

DataFrame.rolling(window, min_periods=None, center=False, win_type=None, on=None, axis=0, closed=None)
  •  

window: 也可以省略不写。表示时间窗的大小,注意有两种形式(int or offset)。如果使用int,则数值表示计算统计量的观测值的数量即向前几个数据。如果是offset类型,表示时间窗的大小。offset详解 
min_periods:每个窗口最少包含的观测值数量,小于这个值的窗口结果为NA。值可以是int,默认None。offset情况下,默认为1。 
center: 把窗口的标签设置为居中。布尔型,默认False,居右 
win_type: 窗口的类型。截取窗的各种函数。字符串类型,默认为None。各种类型 
on: 可选参数。对于dataframe而言,指定要计算滚动窗口的列。值为列名。 
axis: int、字符串,默认为0,即对列进行计算 
closed:定义区间的开闭,支持int类型的window。对于offset类型默认是左开右闭的即默认为right。可以根据情况指定为left both等。

import pandas as pd
s = [1,2,3,5,None,10,12,14,12,30]
pd.Series(s).rolling(3,min_periods=2).mean()

【pandas】[2] 移动窗口rolling的理解_第1张图片

 

转载自:https://blog.csdn.net/maymay_/article/details/80241627

你可能感兴趣的:(python数据分析)