『STATISTICS』傻瓜弄懂t检验

现在前面

因为我时常忘记 t分布,假设检验,t检验,t value,p value 的意思,所以各方整理出一套笔记,忘记时方便复习。因为统计之都的blog对于假设检验讲的很好了,下面就补充一下t-distribution的部分。


正态分布(Normal Distribution/Gaussian Distribution )

X{x...}μσ2XN(μ,σ2)

其概率密度函数为

f(x)=1σ2πexp((xμ)22σ2)σ2=(Xμ)2n


标准正态分布(Standard Normal Distribution)

X可以从一个服从正态分布的变量转变成服从标准正态分布的变量

XN(μ,σ2)>Z=Xμσ>ZN(0,1)

N(0,1) -标准正态分布。


t 分布

What for:在概率论和统计学中,学生t-分布t-distribution),可简称为t分布,用于根据小样本来估计呈正态分布且方差未知总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。

Xμσ2{Xn}X¯nS2n.S2n=(XnX¯n)2n1,tμ

至于为什么这里是n-1呢,理解一下的话,当我们知道样本的个数n以及样本均值后,样本的自由度其实是-1了,即是n-1。数学上的推导见知乎答案_有偏估计。

nsizeXX¯n=1/nXiX¯nμ,σ2/nX¯N(μ,σ2/n)

需要一些简单的方差计算

D(X¯n)D(1/nXi=1n2D(Xi)=1nD(Xi)

所以我们现在可以得到两个分布。当我们不知道总体方差时,what we care is t-分布,with 自由度n-1 。

Z=X¯μσ/n,ZN(0,1)t=X¯μSn/n,tt(n1)

现在我们弄清楚了什么是t-分布,它其实是告诉你你的样本均值和总体均值的关系。

其他太stats的先不说,看看t分布与标准正态分布的关系:

『STATISTICS』傻瓜弄懂t检验_第1张图片

蓝色:N(0,1);红色是不同自由度下的t分布,when df自由度 is larger, t-distribution is closer to standard normal distribution.


t值 (t value)

t值是根据你的样本计算出来的,

t=X¯μSn/nμ

???假定来的???这时候就需要假设检验的思想了。

Now,check this 统计之都_假设检验初步,好好看,人家讲那么好,我就不赘述了。拜~


说在最后

欢迎各位来看看我的blog,THX.

因为CSDN是程序员的天地了,我最多在这边会上传一些统计和机器学习的学习内容,我的blog里还会有一些有关投资的学习内容。
Anyway,我在每个领域都是小白,希望共同学习。

你可能感兴趣的:(统计,t分布,统计)