【定量分析、量化金融与统计学】各种检验的H0假设与p-value究竟是什么含义

目录

一、各种检验的分类

二、事前检验

1.正态性检验

2.方差齐次性检验

3.共线性检验

4.协方差齐次性检验

三、事后检验

1.Turkey检验

2.tamhaneT2 检验

3.交叉图检验

4.拟合优度检验

5.显著性检验

F检验:ANOVA

T检验:小样本的显著性检验

6.区间估计


可能刚接触量化分析的人都会对各种检验感觉到懵,这个检验究竟检验什么?p值小于0.05,究竟拒绝了什么假设?是什么意思?

我刚学的时候也有这样的疑问,今天就盘一盘各种假设究竟在说什么!

一、各种检验的分类

我们常见的检验会有事前假设检验与事后检验:

事前检验:一般会有这几种:

  1. 正态性检验
  2. 方差齐次性检验
  3. 共线性检验
  4. 协方差齐次性检验

事后检验一般会有:

  1. Turkey检验
  2. tamhaneT2Test
  3. 交叉图检验
  4. 拟合优度检验
  5. 显著性检验
  6. 区间估计

当然这种分类不是很科学,而且稍有混乱,但是没关系,我们今天这个文章的目的是让你知道,这些检验都干了啥,如果他们是假设检验,那么他们的H0是什么,p值的含义是什么。

二、事前检验

1.正态性检验

定义:利用观测数据判断总体是否服从正态分布的检验称为正态性检验

常见方法:正态概率纸法、夏皮罗维尔克检验法(Shapiro-Wilktest),科尔莫戈罗夫检验法,偏度-峰度检验法

我们最常用的就是SW方法和KS方法,SW方法适用于小集合,KS用于大集合(N>2000)。

类别:假设检验

假设:

H0:总体服从正态检验

H1:总体不服从正态检验

P值含义:当P>0.05,接受H0,换句话说,p越不显著(越大),样本越正态,p越显著(越小),样本越不正态大了好

2.方差齐次性检验

常见方法:Levene检验

类别:假设检验

假设:

H0:总体方差相等

H1:方差不全相等

p值含义:P越小,越拒绝H0,越小,方差越不相等,越大,方差越相等。大了好

3.共线性检验

常见方法:画散点图能够直接观测共线性,或者皮尔逊相关系数等

类别:数值检验

直接观察或通过协方差数值来查看。

4.协方差齐次性检验

定义:观察数据是否满足做多元(多因变量)的方差分析  一般只有MANOVA用

方法:Box's M test

类别:假设检验

假设:

H0:各因变量协方差矩阵齐性

H1:各因变量协方差矩阵不齐性

p值含义:p越小,越拒绝H0,方差越不相等。大了好

三、事后检验

1.Turkey检验

用处:用于在方差分析基础上进行,具体比较两两组别之间的差异(研究组间差异)

原理:进行所有组间均值的配对比较,用所有配对比较误差率作为实验误差率。

前提:

  1. 正在测试的观察结果在组内和组间都是独立的。
  2. 与测试中每个平均值相关的组是正态分布的。
  3. 与测试中的每个平均值相关的组内方差相等(方差齐性)。

不满足任何一条不可使用!

类别:假设检验-----显著性检验

假设:

H0:比较组之间的均值相等

H1:比较组之间的均值不等

p值含义:如果你需要得到显著性差异的话,p越小越好,越小越拒绝H0,差异性越明显

2.tamhaneT2 检验

用处:对方差不等的正态分布数据进行Tamhane的T2全对比较检验。和turkey一个作用,唯一不同就是前提。

前提:

  1. 满足正态性
  2. 不需要满足方差齐次性

类别:假设检验-------显著性检验

假设:

H0:比较组之间的没有明显差异

H1:比较组之间的差异明显

p值含义:如果你需要得到显著性差异的话,p越小越好,越小越拒绝H0,差异性越明显

3.交叉图检验

含义:交互图在X轴上显示一个变量的水平,并为另一个变量的每个水平的平均值有一条单独的线。

作用:当一个变量的效果取决于另一个变量的值时,就会产生交互效应。交互效应在回归分析、方差分析和设计实验中很常见。

【定量分析、量化金融与统计学】各种检验的H0假设与p-value究竟是什么含义_第1张图片

【定量分析、量化金融与统计学】各种检验的H0假设与p-value究竟是什么含义_第2张图片

【定量分析、量化金融与统计学】各种检验的H0假设与p-value究竟是什么含义_第3张图片

【定量分析、量化金融与统计学】各种检验的H0假设与p-value究竟是什么含义_第4张图片

注意,图中可能包含误差,所以如果想做交互分析,还需要用数据来支撑

类别:图形检验-------直觉检验

4.拟合优度检验

介绍:拟合优度检验是用卡方检验进行统计显著性检验的重要内容之一。它是依据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望频数与观察频数是否有显著差异,从而达到从分类变量进行分析的目的。

用法:

拟合优度是指回归直线对观测值的拟合程度。可决系数(亦称确定系数)R²。R²最大值为1。R²的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R²的值越小,说明回归直线对观测值的拟合程度越差。

类型:显著性检验--------回归评价标准之一

R2越大越好。

5.显著性检验

这个范围很大,我们就简单说F检验与T检验

F检验:ANOVA

一般的假设:

H0:  各个元素对因变量影响都无影响

H1:各个元素对因变量不全无影响

p值显示显著性,我们希望p越小越好,这样我们研究的要素就对因变量有显著的影响,这有利于我们进一步开展工作。

T检验:小样本的显著性检验

H0:u = u0

H1:   u !=u0

单侧双侧?什么水准?

p越小,越拒绝0假设,越显著。

6.区间估计

基本和T检验是一个事情,区间理论的假设检验就是T检验。

当然区间估计还可以使用置信度。

这里先不细说了,以后有机会再说。

你可能感兴趣的:(定量分析,数据分析,量化分析,数据分析,r语言)