Khan公开课 - 统计学学习笔记:(十一)平方之和、F统计

平方之和与自由度之和

这部分实际也是通过χ2为基础进行推导的,但是具体的数学证明不讲,可通过直观案例说明。有一个3(m)×3(n)的列阵。

Khan公开课 - 统计学学习笔记:(十一)平方之和、F统计_第1张图片

共9个样本,样本均值为4,也是各组均值的均值,即mean of means。对于sum of square有:总体sum of square = 组内 sum of square + 组间 square,或者说总体波动=组内波动+组件波动。我们进行直观验证

SST =(3-4)2+(2-4)2+(1-4)2+(5-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2= 30,9个数,知道均值,从其中8个可以推出另外一个,故自由度为mn-1=3*3-1=8。

SSW= (3-2)2+(2-2)2+(1-2)2+(5-4)2+(3-4)2+(4-4)2+(5-6)2+(6-6)2+(7-6)2= 6,在每组中:知道组的mean,每组自由度为n-1,总共m(n-1),本例3(3-1)=6

SSB= (2-4)2+(2-4)2+(2-4)2+(4-4)2+(4-4)2+(4-4)2+(6-4)2+(6-4)2+(6-4)2= 24,知道总的mean,最有一组的mean可以推到处理,故自由度为m-1=3-1=2

有SST=SSW+SSB,以及总自由度=组内自由度+组间自由度

例子:F统计

有3组食用不同的食物,分别有3个测量采样,问不同食物是否存在影响?还是采样值属于正常波动。

Khan公开课 - 统计学学习笔记:(十一)平方之和、F统计_第2张图片

H0:Food does not make a difference, →μ123;

H1: It does

Assume H0 is true,将使用到F统计,F statistics,服从F distribution,F表示Fisher,生物学家兼统计学家,F statistics实际上是两个χ2分布的比较

如果数值越高,表示组间的波动大于组内的波动,各组之间就很可能存在差异。

在本例中F-statistics=(24/2)/(6/6)=12

对于α=10%,可以http://www.socr.ucla.edu/applets.dir/f_table.html查,(【注】要查不同α的F distribution table,不要去百度,查不出来,查Google就可以了)查F Table for α = 0.10,查df1=2,df2=6,查得critical F value=3.46,Fc=3.46,而本例的F值远大与此,所有出现这样的采样的概率远远低于10%,可以拒绝H0

相关链接:我的四方书库

你可能感兴趣的:(Khan公开课 - 统计学学习笔记:(十一)平方之和、F统计)