python方差分析样本量太大_十五、方差分析--使用Python进行单因素方差分析(ANOVA)...

方差分析

方差分析(Analysis of Variance,简称ANOVA),又称为“变异数分析”, 是由英国统计学家费歇尔(Fisher)在20世纪20年代提出的,可用于推断两个或两个以上总体均值是否有差异的显著性检验。

由于各种因素的影响,研究所得的数据呈现波动性。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。

方差分析一般可以分为单因素方差分析和多因素方差分析。我们从单因素方差分析开始。

1. 单因素方差分析

所谓单因素方差分析就是只考虑一个因素对实验结果造成的影响。

1.1. 单因素方差分析的理论

设实验只有一个因素(因子)A,有r个水平A 1 , A 2 , . . . , A r A_1, A_2, ..., A_rA1​,A2​,...,Ar​。现在水平A i A_iAi​下进行n i n_ini​次独立观测,得到观测数据X i j , i = 1 , 2 , . . . , r , j = 1 , 2 , . . . , n i X_{ij}, i=1,2,...,r, j=1,2,...,n_iXij​,i=1,2,...,r,j=1,2,...,ni​, 得到实验指标的数据如下:

各总体间相互独立,因此有如下数学模型:

{ X i j = μ i + ε i j , ε i j ∼ N ( 0 , σ 2 ) , 各 ε i j 独 立 , i = 1 , 2 , . . . , r , j = 1 , 2 , . . . , n i . \begin{cases} X_{ij}=\mu_i + \varepsilon_{ij}, \\ \varepsilon_{ij} \sim N(0, \sigma^2), 各\varepsilon_{ij}独立,\\ i=1,2,...,r,\quad j=1,2,...,n_i. \end{cases}⎩⎪⎨⎪⎧​Xij​=μi​+εij​,εij​∼N(0,σ2),各εij​独立,i=1,2,...,r,j=1,2,...,ni​.​

其中的μ i \mu_iμi​就是在第i ii个水平下的均值,ε i j \varepsilon_{ij}εij​是随机误差。

方差分析的目的就是要比较因素A的r个水平下试验指标理论均值的差异,因此方差分析其本质是利用假设检验对多组数据

你可能感兴趣的:(python方差分析样本量太大)