为什么叫Student t检验?

微信公众号:折耳根说

人民卫生出版社《卫生统计学》第6版第六章第二节 t分布中写道:

英国统计学家W. S. Gosset于1908年以笔名“Student”发表论文,证明t分布服从自由度v=n-1t分布,即

为什么叫Student t检验?_第1张图片

t分布,又称Student t分布(Student‘s t distribution),记作t ~ t(v)。t分布十分有用,它是总体均数的区间估计和假设检验的理论基础。

为什么t检验称为Student~t检验,t分布称为Student~t分布?而不像其它的统计方法以科学家名字命名,如Fisher精确检验、Pearson相关等?

William Sealy Gosset(1876.6.13-1937.10.16)

后被称为英国统计学家

为什么叫Student t检验?_第2张图片

1912年的Karl Pearson

Gosset先在牛津大学学习化学和数学

1899年毕业后

在爱尔兰都柏林Arthur Guinness 啤酒厂

任酿酒化学技师

从事试验和数据分析工作

在已知总体均值和标准差时

样本均值的分布将随着样本容量n增大

越来越接近正态分布

但是

Gosset试验中的样本量都不大

一般只有5个

Gosset对每个样本分别计算X,S,t,即

获得大量t观察值

发现

t在(-1,1),(-2,2),(-3,3)内的频率

0.626,0.884,0.960

与N(0,1)在相应区间上的概率

0.683,0.995,0.997

相差较大

于是

他怀疑

是否还存在一个不属于正态分布族的其它分布呢?

为了研究这个问题

Gosset在1906-1907年去伦敦大学学习统计

与著名统计学家Karl Pearson(1857-1936,老Pearson)

为什么叫Student t检验?_第3张图片

1912年的Karl Pearson

1912年的Karl Pearson

和他的儿子Egon Sharpe Pearson(1895-1980,小Pearson)

共同讨论

Egon Sharpe Pearson

终于得到新的密度函数曲线

Gosset于1908年(32岁)以“Student”笔名发表此研究结果

在当时正态分布作为“万能分布”的时代里

代表统计学最高的水平的K. Pearson

只研究大样本问题

他认为

小样本是与统计精神相违背的

是危险倾向

在这种情况下

t分布并没有被外界理解和接收

只在Gosset工作的酿酒公司使用

直到1923年

Gosset以笔名“Student”发表t分布15年后

另一位著名统计学家Fisher(1890-1962)

为什么叫Student t检验?_第4张图片

Ronald Aylmer Fisher

在农业实验中

也遇到小样本问题

发现t分布的实用价值

并给出严格但简单的推导

1925年

Fisher又编制了t分布表

为什么叫Student t检验?_第5张图片

现在广泛应用的t分布表

至此

Gosset的小样本方法才被学术界承认

并迅速传播、发展和应用

Gosset~t分布打开了人们新思路

开创了小样本研究方法

在历史上具有划时代意义

但由于Gosset当时以Student发表

所以人们习惯称为Student~t分布

而非Gosset~t分布

1935年

Gosset59岁

离开了都柏林

到伦敦皇家公园旁的一家Guinness啤酒厂

担任总监

负责啤酒产量的科学研究

然而仅仅两年后

年仅61岁的Gosset

因心脏病英年早逝

为什么叫Student t检验?_第6张图片

Guinness公司为Gosset制作的纪念章

由于当时理论不被接受及公司的各种限制,Gosset只能以笔名“Student”(学生)发表这一历史性的成就。直至15年后,Fisher的验证,t分布才被学术界承认并广泛应用。后来的配对t检验、两两比较t检验等都是在Gosset~t检验的基础上发展而来。然而Gosset并没有因此成为同时代著名的统计学家,教科书也是一笔带过。直至今天,大家熟知的仍是Student~t检验,奠定t分布基础的Gosset知名度远不如Pearson、Fisher。在历史长河中,Gosset仍闪闪发光。谨以此文

拨开历史的尘埃,

纪念做出巨大贡献的Goseet!

参考资料

1.方积乾,孙振球. 卫生统计学(第6版). 人民卫生出版社,89.

2.https://www.nature.com/articles/140838a0

3.https://en.wikipedia.org/wiki/William_Sealy_Gosset

4.茆诗松,王静龙 ,濮晓龙.高等数理统计(第二版).高等教育出版社.

5.陈希孺.概率论与数理统计.中国科学技术大学出版社.

你可能感兴趣的:(为什么叫Student t检验?)