[回归分析][9]--加权最小二乘法
这一节会讲一下关于加权最小二乘法,这种方法是用来处理 ”异方差“ 的。如下图
关于处理的方法:
例子:我们来看一个直观的例子
1.构造一组数据
x = Table[i, {i, 1, 1000}];
y = Table[2*i + RandomInteger[PoissonDistribution[Ceiling[i/100.0]]], {i, 1,1000}];
2.对数据拟合
data = Transpose[{x, y}];
Clear[x];
lm = LinearModelFit[data, x, x]
3.画出残差
cancha = lm["FitResiduals"];
p1 = ListPlot[cancha]
4.按类别,看一下彩色的图
temp = {};
For[i = 1, i <= 10, i++,
temp = AppendTo[temp, cancha[[100*i - 99 ;; 100*i]]]
];
dataList =
Transpose[{Range @@ #[[1]], #[[2]]}] & /@
Transpose@{# + {1, 0} & /@
Partition[Accumulate[Length /@ Prepend[temp, {}]], 2, 1], temp};
p4 = ListPlot[dataList]
可以看到残差随着x的增大而增大。
5.求出加权的系数
计算总的残差
canchaTotal = Total[Abs[cancha]]/Length[cancha]
计算每一组的残差
canchazu = Table[0, {i, 1, 10}];
For[i = 1, i <= 10, i++,
canchazu[[i]] = Total[Abs[cancha[[100*i - 99 ;; 100*i]]]]/99
]
计算系数
xishu = canchazu/canchaTotal
计算权重
weight = Table[xishu, {i, 1, 100}];
weight = Flatten@Transpose[weight];
6.对加权后的重新拟合
lmn = LinearModelFit[data/weight, x, x]
查看其残差
temp = {};
For[i = 1, i <= 10, i++,
temp = AppendTo[temp, canchan[[100*i - 99 ;; 100*i]]]
]
dataList =
Transpose[{Range @@ #[[1]], #[[2]]}] & /@
Transpose@{# + {1, 0} & /@
Partition[Accumulate[Length /@ Prepend[temp, {}]], 2, 1], temp};
p3 = ListPlot[dataList, ImageSize -> Medium]
可以放在一起比较一下
Row[{p4, p3}]
以上,所有
2016/11/20