Biostatistics(12)常见分布:t分布、卡方分布、F分布

t分布

t分布又可以被称为学生t分布。其由Wiliam Sealy Gosset在1908时发现,t分布与样本大小n相关,确切地是与自由度df=n-1相关。

Biostatistics(12)常见分布:t分布、卡方分布、F分布_第1张图片
t分布

t分布与正态分布相似,是对称的,但是其比正态分布宽,当样本数量增加,t分布会接近正态分布。
我们可以利用R更加直观地了解t分布:

>qt(0.025,df=29)
[1] -2.04523
> qt(0.975, df=29)
[1] 2.04523
> qt(0.05, df=29)
[1] -1.699127
> qt(0.95, df=29) 
[1] 1.699127
Biostatistics(12)常见分布:t分布、卡方分布、F分布_第2张图片
Using R to obtain statistics about t-distribution

置信区间的估计

Biostatistics(12)常见分布:t分布、卡方分布、F分布_第3张图片
置信区间

例:Gene expression example
t29,0.025 = 2.045230, s = 1.893954, n = 30, X ̄ = 6.495324,求其95%置信区间

根据公式可计算得置信区间为:[5.78811, 7.202538]

例: sample 25 plants and measure their heights, if the sample mean is 15cm, with a variance of 16cm2. What is the 95% confidence interval of the population mean?

Biostatistics(12)常见分布:t分布、卡方分布、F分布_第4张图片

Chi-square卡方分布

若n个相互独立的随机变量ξ₁,ξ₂,...,ξn ,均服从[标准正态分布](也称独立同分布于标准[正态分布]),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。(来源:百度百科)

Biostatistics(12)常见分布:t分布、卡方分布、F分布_第5张图片
卡方分布

卡方分布不是对称的,其与自由度df有关

对于任意的正态分布,我们都能够用Z变化将其变成标准正态分布:



如果我们使用样本平均数取代总体平均数,我们将会失去一个自由度:


Biostatistics(12)常见分布:t分布、卡方分布、F分布_第6张图片

置信区间

置信区间

例:Recall we randomly chose 30 genes, and compute the sample
variance s^2 = 3.587062, df =29

Biostatistics(12)常见分布:t分布、卡方分布、F分布_第7张图片

F分布

有两个独立的正态分布N(μ1,σ12)和 N(μ2,σ22).如果我们对这两个总体进行抽样,获得的样本方差为s12和s22,那么它们遵循F分布:

Biostatistics(12)常见分布:t分布、卡方分布、F分布_第8张图片

Biostatistics(12)常见分布:t分布、卡方分布、F分布_第9张图片
F分布

你可能感兴趣的:(Biostatistics(12)常见分布:t分布、卡方分布、F分布)