假设检验(超详细)

假设检验

什么是假设检验

假设检验( hypothesis testing)是指从对总体参数所做的一个假设开始,然后搜集样本数据,计算出样本统计量,进而运用这些数据测定假设的总体参数在多大程度上是可靠的,并做出承认还是拒绝该假设的判断。

为什么要用假设检验

我们在生活中经常会遇到对一个总体数据进行评估的问题,但我们又不能直接统计全部数据,这时就需要从总体中抽出一部分样本,用样本来估计总体情况。这时候就可以用到假设检验,它可以有助于评估出现正确结果的可能性。

假设检验的定义和原理

定义:假设检验是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。
原理:小概率原理即小概率事件在一次抽样中不发生。
由定义可知,我们需要对结果进行假设,然后拿样本数据去验证这个假设。
所以做假设检验时会设置两个假设:
一种叫原假设,也叫零假设,用H0表示。【希望原假设被接受】
另外一种叫备择假设,用H1表示。【与原假设对立】
接受H0与拒绝H0的方法:看小概率事件是否发生。

假设检验步骤

1先假设H0是真的,然后判别小概率事件是否发生,如果发生,就拒绝H0,接受H1,如果没有发生,就接受H0。解释:整体的思想为小概率事件在一次抽样中不发生,小概率事件不发生是极大概率事件,所以上面的假设就是合理的。
2深入思考,如果小概率事件发生了,此时却拒绝了H0,就是拒绝了真实的情况,那么就犯了第一类错误,即拒真;拒真的概率就是我们所定的α,即显著性水平,一般为0.05。
请添加图片描述
第一类错误:P(拒绝H0|H0真)=α
第二类错误:P(接受HO|H0假)=β

F检验与T检验

F检验【线性关系检验】

目的:
检验自变量x与因变量y之间的线性关系是否显著,或者说,他们之间能否用一个线性模型来表示。【对于整个方程显著性的检验】

T检验【回归系数检验】

目的:
通过对回归系数β与0的检验,看其是否有显著性差异,来判断回归系数是否显著。【检验系数是否显著】

代码解读

广告投入与销售额是否符合线性回归模型

import pandas as pd

data = pd.read_csv("data.csv")
x = data[['广告投入']]
y = data[['销售额']]

这是所需要的数据
data,csv
因为要使用T检验和F检验,所以我们要新添加一个库

import statsmodels.api as sm

y=x0β0+x1β1因为在statsmodels库中x0的值不会自动填充为1所以要加上

X = sm.add_constant(x)

用最小二乘法计算出X,y的值从而得到系数

model = sm.OLS(y, X)
result = model.fit()
params = result.params

汇总结果,观察T检验与F检验的值是否符合要求

print(result.summary())

这是得到的结果
假设检验(超详细)_第1张图片
观察可得T检验和F检验都符合,其值均小于0.05,符合结果。

你可能感兴趣的:(python,pandas)