假设检验和方差分析

假设检验:
作用:统计学中的等于符号
在有随机性参与的数学计算中,理论值和实验取样后算出来的计算值有一定差距,假设检验的用处是告诉你是对的。判断样本与样本,总体与样本的差异是由抽样误差引起的还是本质差别造成的统计推理。原理是先对总体特征做出假设,通过抽样研究的统计推理,对此假设应该被接收还是拒绝做出推断

显著性检验
定义:统计假设检验的一种,检测科学实验中实验组与对照组之间是否有差异及差异是否显著的办法
两类错误:
第一类错误alpha:原假设为真,检验结论为放弃假设
第二类错误beta:原假设不真,检验结论为不放弃
统计假设检验:事先对总体的参数和总体分布形式作出假设,然后利用样本信息来判断这个假设是否合理。把只限定第一类错误的统计假设检验叫做显著性检验
样本与对总体所做假设之间的差异是机会变异,还是有我们所做假设和总体真实情况不一致所引起的。

显著性检验分为参数检验和非参数检验,参数检验要求样本来源于正态总体,总体有相同方差,在这种情况下检验均值是否相等
当数据不满足正态性和方差齐次性的假定时,参数检验可能错误,应采用基于秩的非参数检验

抽样分布的中心极限定理
从总体中抽样1000次,每次抽50个,计算每抽一次的均值,这1000个均值为正态分布

统计量:样本的函数,不依赖未知参数,借助样本推断总体的性质,常用统计量有样本均值、样本方差、变异系数、各阶距和各阶中心距等

常用抽样分布:
卡方分布

常见假设检验种类
U检验、t检验、卡方检验、f检验
t检验
样本含量较小,总体标准差未知的正态分布资料
比较样本均值,

均值的检验有t检验和方差检验
t检验:
单样本:一组数据与单个数据
独立样本:2个独立组
配对样本,两个样本有关联

方差分析,独立单因素,适用于多个独立组(3个及以上)。理论上要求正态分布、方差齐性,但是实际中,是否为正态分布对检验结果影响不大,方差要求最大方差不大于3倍最小方差,如果远大于3倍,取对数,或者是采用非参数检验方法。

你可能感兴趣的:(机器学习)