lowess和loess方法

点击打开链接

二维变量之间的关系研究是很多统计方法的基础,例如回归分析通常会从一元回归讲起,然后再扩展到多元情况。局部加权回归散点平滑法(locally weighted scatterplot smoothing,LOWESS或LOESS)是查看二维变量之间关系的一种有力工具。

LOWESS主要思想是取一定比例的局部数据,在这部分子集中拟合多项式回归曲线,这样我们便可以观察到数据在局部展现出来的规律和趋势;而通常的回归分析往往是根据全体数据建模,这样可以描述整体趋势,但现实生活中规律不总是(或者很少是)教科书上告诉我们的一条直线。我们将局部范围从左往右依次推进,最终一条连续的曲线就被计算出来了。显然,曲线的光滑程度与我们选取数据比例有关:比例越少,拟合越不光滑(因为过于看重局部性质),反之越光滑。

Lowess和Loess都是非参数回归方法,Loess相比Lowess更加灵活和有用。Lowess通过窗口来考虑周边数据的影响,其预测值由窗口中的数据决定,窗口外的数据其贡献为0。但这种方法对野值非常敏感,Loess方法相比Lowess是一种更加robust的方法,其不仅仅考虑的局部的权重,还提出了robust权重,此权重主要是对野值进行加权,当某数据点被判断是野值后,其robust权重被设置为0,无贡献。

LOWESS本质上就是(加权)局部回归,所以理论上只要回归能做,LOWESS就能做,但我没见过你说的这种情况。LOWESS的初衷是为了检查散点图中的趋势(它具有较好的耐抗性,离群点的影响不大),而散点图通常是连续变量对连续变量的图。若因变量是离散变量,那么散点图本身的意义就不大了,仅仅在一些非常特殊的情况下可能有用,例如因变量为二分类。

你可能感兴趣的:(算法)