拟合优度:Pearson 卡方检验

 

假设检验问题就是通过从有关总体中抽取一定容量的样本,利用样本去检验总体分布是否具有某种特性。假设检验问题大致分为两大类:

  • 参数型假设检验: 即总体的分布形式已知(如正态、指数、二项分布等),总体分布依赖于未知参数(或参数向量), 要检验的是有关未知参数的假设。

  • 非参数型假设检验: 如果总体分布形式未知,此时就需要有一种与总体分布族的具体数学形式无关的统计方法,称为非参数方法。例如,检验一批数据是否来自某个已知的总体,就属于这类问题。 常用的非参数假设检验方法有:符号检验、符号秩和检验、秩和检验及Fisher 置换检验和拟合优度检验


目录

拟合优度(Goodness of Fit)

Pearson 卡方检验



拟合优度(Goodness of Fit

指回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数(亦称确定系数)R^2。R^2的取值范围是[0,1]。R^2的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R^2的值越接近0,说明回归直线对观测值的拟合程度越差。拟合优度检验问题的提法如下:设有一个一维或多维随机变量X,令X0,…, Xn为总体X中抽取的简单样本,F是一已知的分布函数。

要利用样本X0,…, Xn检验假设:

H0:随机变量X的分布为F

导出这种假设检验的想法大致如下:

设法提出一个反映实际数据X0,…,Xn与理论分布F偏差的量D = D(X0,…,Xn; F)

如果D较大,如D>=C,则认为理论分布F与数据X0,…,Xn不符,因而否定H0

一般来说,理论和实际没有截然的符合或不符合。更恰当的提法是实际数据与理论分布符合的程度如何?因此通常对H0 的检验不是以“是”或“否”来回答,而是提供一个介于0和1之间的数字作为回答,即用此数作为符合程度的度量刻画,就具体样本算出D之值,记为d0。d0越接近1,表示样本与理论分布拟合的越好,因而原假设越可信。反之,它越接近0,则原假设H0越不可信。如果它低到指定的水平α之下,则就要否定H0了。讨论最多的拟合优度方法之一:Pearson 卡方检验。

Pearson 卡方检验

拟合优度:Pearson 卡方检验_第1张图片      

  拟合优度:Pearson 卡方检验_第2张图片


拟合优度:Pearson 卡方检验_第3张图片       

  拟合优度:Pearson 卡方检验_第4张图片


你可能感兴趣的:(概率论与数理统计)