box-cox变换

    Box-Cox变换是统计建模中常用的一种数据变换,用于连续的响应变量不满足正态分布的情况。比如在使用线性回归的时候,由于残差epsilon不符合正态分布而不满足建模的条件,这时候要对响应变量Y进行变换,把数据变成正态的。Box-Cox变换,变换之后,可以一定程度上减小残差和预测变量的相关性。【Box-Cox变换即将数据转换为满足正态分布的数据
Box-Cox 变换的数学形式如下:
box-cox变换_第1张图片
这里出现的 λ,是一个有待确定的常数。
当 λ 分别取下列数值时,我们会得到一系列耳熟能详的函数:
box-cox变换_第2张图片
你看,我们之前说过的常用的变换函数几乎都出现了!写到这里其实并没有什么神奇的,无非只是利用λ 把这些不同的函数写出一个统一的表达式而已。最关键的问题在于怎样选定一个最优的λ,使得变换后的样本(及总体)正态性最好。

:关于P值:
    假设检验中常见到P值( P-Value,Probability,Pr),P值是进行检验决策的另一个依据。
    P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P < 0.05 为有统计学差异, P<0.01 为有显著统计学差异,P<0.001为有极其显著的统计学差异。其含义是样本间的差异由抽样误差所致的概率小于0.05 、0.01、0.001。实际上,P值不能赋予数据任何重要性,只能说明某事件发生的几率。统计结果中显示Pr > F,也可写成Pr( >F),P = P{ F0.05 > F}或P = P{ F0.01 > F}。统计学上一般P值大于0.05我们可认为该组数据是符合正态分布

参考链接I
参考链接II
参考链接III

你可能感兴趣的:(个人学习)