http://blog.csdn.net/pipisorry/article/details/51184556
T检验,亦称student t检验(Student's t test),学生t检验(英语:Student's t-test)是指虚无假设成立时的任一检定统计有学生t-分布的统计假说检定,属于母数统计。学生t检验常作为检验一群来自常态分配母体的独立样本之期望值的是否为某一实数,或是二群来自常态分配母体的独立样本之期望值的差是否为某一实数。
主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。常被应用于小样本判断的置信度。分为单总体检验和双总体检验。
t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与z检验、卡方检验并列。
t检验是戈斯特为了观测酿酒质量而发明的。
大多数的t检定之统计量具有t = Z/k的形式,其中Z与k是已知资料的函数。Z通常被设计成对于对立假说有关的形式,而k是一个尺度参数使t服从于t分布。以单样本t检验为例,,其中为样本平均数,为样本数,为总体标准差。至于k在单样本t检验中为,其中为样本的标准偏差。在符合零假说的条件下,t检定有以下前题:
检验零假说为一群来自常态分配独立样本xi之母体期望值μ为μ0可利用以下统计量
其中,为样本平均数,为样本标准偏差,n为样本数。该统计量t在零假说:μ = μ0为真的条件下服从自由度为n − 1的t分布。
配对样本t检验可视为单样本t检验的扩展,不过检验的对象由一群来自常态分配独立样本更改为二群配对样本之观测值之差。
若二群配对样本x1i与x2i之差为di = x1i − x2i独立且来自常态分配,则di之母体期望值μ是否为μ0可利用以下统计量
其中,为配对样本差值之平均数,为配对样本差值之标准偏差,n为配对样本数。该统计量t在零假说:μ = μ0为真的条件下服从自由度为n − 1的t分布。
若二群独立样本x1i与x2i具有相同之样本数n,并且彼此独立及来自二个变异数相等的常态分配,则二群母体之期望值差μ1 - μ2是否为μ0可利用以下统计量
其中,及为二群样本各自的平均数,为样本之共同变异数。该统计量t在零假说:μ1 - μ2 = μ0为真的条件下服从自由度为2n − 2的t分布。
若二群独立样本x1i与x2j具有不相同之样本数n1与n2,并且彼此独立及来自二个变异数相等的常态分配,则二群母体之期望值之差μ1 - μ2是否为μ0可利用以下统计量
其中,其中,及为二群样本各自的平均数,为二群样本共同之变异数。该统计量t在零假说:μ1 - μ2 = μ0为真的条件下服从自由度为n1 + n2 − 2的t分布。
若二群独立样本x1i与x2j具有相等或不相同之样本数n1与n2,并且彼此独立及来自二个变异数不相等的常态分配,则二群母体之期望值之差μ1 - μ2是否为μ0可利用以下统计量
其中,其中,及为二群样本各自的平均数,及分别为二群样本之变异数。该统计量t在零假说:μ1 - μ2 = μ0为真的条件下服从自由度为
之t分布。这种方法又常称为Welch检验。
在简单线性回归的模型
其中xi,i = 1, ..., n为已知,α与β为未知系数,εi为残差独立且服从期望值0且变异数σ2未知的正态分布,yi,i = 1, ..., n为观测值。我们可以检验回归系数(在此例即为回归式之斜率)β是否相等于特定的β0(通常使β0 = 0以检验xi对yi是否有关联)。
令与为最小平方法之估计值,与为最小平方法估计值之标准误差,则
在零假设为β = β0的情况下服从自由度为n − 2之t分布,其中
由于 为残差(即估计误差),而 为残差之离均平方和,我们可改写t为
用于测试平稳性
Dickey-Fuller Test: This is one of the statistical tests for checking stationarity. Here the null hypothesis is that the TS is non-stationary. The test results comprise of a Test Statistic and some Critical Valuesfor difference confidence levels. If the ‘Test Statistic’ is less than the ‘Critical Value’, we can reject the null hypothesis and say that the series is stationary. Refer this article for details.
Note: 可以看出这里的拒绝域是{u<u0},这样代表平稳,是拒绝域.
用于测试单根
The Augmented Dickey-Fuller test can be used to test for a unit root in a univariate process in the presence of serial correlation.
The null hypothesis of the Augmented Dickey-Fuller is that there is a unit root, with the alternative that there is no unit root. If the pvalue is above a critical size, then we cannot reject that there is a unit root.
[wikipedia: Augmented Dickey–Fuller test]
[python包:statsmodels.tsa.stattools.adfuller]
可以看到,这里最小拒绝H0的alpha值p-value太大,没法拒绝H0,所以This is not a stationary series(H0).
当然同样可以通过the test statistic is way more than the critical values来判断不能拒绝H0。Note that the signed values should be compared and not the absolute values.
from: http://blog.csdn.net/pipisorry/article/details/51184556
ref: