重要抽样分布:卡方分布(χ2分布)、t分布和F分布

冒泡~:最近在回顾一些以前学过的概率论和数理统计的知识 发现这三个抽样分布经常出现,在参数估计和假设检验也会运用到,所以做一下整理。

【首先,这三个抽样分布都是来自正态总体的常用的分布 可以根据情况应用于显著性检测】


1.χ2分布

定义:

设 X1,X2,......Xn相互独立, 都服从标准正态分布N(0,1), 则称随机变量χ2=X1²+X2²+......+Xn²所服从的分布为自由度为 n 的χ2分布.

自由度:所包含的独立变量的个数 (eg:χ2=X1²+X2²  自由度为2)

图和式子如下:

重要抽样分布:卡方分布(χ2分布)、t分布和F分布_第1张图片

关于图像:

从分布图可以看出:图像分布在第一象限内,卡方值都是正值,呈右偏态,随着参数 n 的增大,分布趋近于正态分布;随着自由度n的增大,向正无穷方向延伸(这是因为均值n越来越大),分布曲线也越来越低(因为方差2n越来越大)。

更细致观察:

当n=1或者2时:卡方分布先高后低的平滑曲线,检验统计量等于较小值的概率远远大于较大值的概率,即观察频数有可能接近期望频数。

当n大于2时:卡方分布先低后高再低,其外形沿着正向扭曲

一些结论:

1.χ2分布具有可加性:若χ12~χ2(n),χ22~χ2(m),且二者相互独立,则χ12+χ22~χ2(n+m)

2.卡方分布的 期望E(χ2)=n,方差D(χ2)=2n。

应用:(补充ing)

卡方分布指出观察频数与期望频数之间差异显著性,和其他假设一样,这取决于显著性水平。

 1、显性水平α进行检验(常用的显著性水平0.05)

 2、检测标准:卡方分布检验是单尾检验且是右尾,右尾被作为拒绝域。于是通过查看检验统计量是否位于右尾的拒绝域以内,来判定期望分布得出结果的可能性。

 3、卡方概率表的使用:

卡方分布假设检验步骤: 总是使用右尾

  1、确定要进行检验的假设(H0)及其备择假设H1.

  2、求出期望E和自由度n.

  3、确定用于做决策的拒绝域(右尾).

  4、计算检验统计量.

  5、查看检验统计量是否在拒绝域内.

  6、做出决策.

ps:卡方分布检验其实就是假设检验的特殊形式。



2.t分布

定义:

t分布又叫student-t分布,常常用于根据小样本来估计呈正态分布且方差值为知的样本的均值。

(一个前提是:t分布的样本的总体必须符合正态分布。t分布一般用于小样本(样本量比较小)的情形。)

假设X服从标准正态分布即X~N(0,1),Y服从自由度n的卡方分布即Y~χ2(n),且X与Y是相互独立的,那么Z=X/sqrt(Y/n)的分布成为自由的为n的t分布,记为Z~t(n).

期望 E(T)=0,方差 D(T)=n/(n-2),n>2

图和式子如下:


重要抽样分布:卡方分布(χ2分布)、t分布和F分布_第2张图片

图像的特点:

1.图像整体以0为中心,左右对称的单峰分布;

2.t分布是一簇曲线,可发现其形态变化与n(即其自由度)大小有关。

自由度n越小,t分布曲线越低平;自由度n越大,t分布曲线越接近标准正态分布曲线,当自由度无限大时,t分布就成了正态分布

应用:

t检验

1.建立假设、确定检验水准α

H0:μ = μ0 (零假设null hypothesis)

H1:μ ≠ μ0(备择假设alternative hypothesis)

双侧检验,检验水准:α=0.05

2.计算检验统计量

3.查相应界值表,确定P值,下结论。

(ps:t检验适用于两个变量均数间的差异检验)


3.F分布


重要抽样分布:卡方分布(χ2分布)、t分布和F分布_第3张图片

期望E(F)=n/(n-2),方差D(F)=2n^2(m+n-2)/m(n-2)^2(n-4)

图像:


重要抽样分布:卡方分布(χ2分布)、t分布和F分布_第4张图片

F分布为非对称分布  有两个分位点

应用:方差的同质性检验

此检验参考资料:数据统计基础之F分布及其应用 - 振裕 - CSDN博客

方差分析(ANOVA也称为变异数分析和F检验)

详细可参考:https://wenku.baidu.com/view/bcca13af7c1cfad6195fa779.html



finally~

今天也要假装元气满满的鸭!

你可能感兴趣的:(重要抽样分布:卡方分布(χ2分布)、t分布和F分布)