实际场景中,也需要研究两个变量的关系.检验也可能出现两个以上的总体.
假设检验中,若需检验 H 0 : μ 1 = μ 2 , H 1 : μ 1 ≠ μ 2 H_0:μ_1=μ_2,H_1:μ_1 \not=μ_2 H0:μ1=μ2,H1:μ1=μ2,则可用t检验( σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2未知),但如果有两个以上的总体需要检验呢?
H 0 : μ 1 = μ 2 = L = μ s , H 1 : μ 1 , μ 2 , L , μ s 不全相等 H_0:μ_1=μ_2=L=μ_s,H_1:μ_1,μ_2,L,μ_s不全相等 H0:μ1=μ2=L=μs,H1:μ1,μ2,L,μs不全相等
这是普遍存在的问题,影响一事物的因素往往很多的,如农业生产中,影响水稻产量的因素可能有:种子、肥料、气象、耕作等;同一种因素下也会有不同的水平状态. 有些因素影响较大,而有些转小,方差分析可以找不那些较显著影响产量的因素.
单因素方差分析的数据模型如下
为了导出检验统计量,我们使用平方和的分解
X ˉ 是数据的总平均 \bar{X}是数据的总平均 Xˉ是数据的总平均. S T 为总偏差 S_T为总偏差 ST为总偏差,反应全部试验数据的差异.同理,以水平 A j A_j Aj得
得出检验表格
若给定一个显著水平α=0.05,求出F值,查得P-value(以前没有统计软件的时候,大家是查表来找到显著性水平0.05时对应的F临界值)
与单因素试验的方差分析差不多,同理得检验表格
回归分析是处理自变量与因变量之间的关系的一种统计方法和技术。而变量间的关系一般有两种:
回归分析就是研究变量间相关关系的一种统计方法。
我们称 y ^ = a ^ + b ^ x \hat{y}=\hat{a}+\hat{b}x y^=a^+b^x为随机变量 Y Y Y 对 X X X的回归函数。
Q Q Q称为残差平方和,再对Q进一步转换
又因为 S Y Y , S x Y 已知 S_{YY},S_{xY}已知 SYY,SxY已知
《数理统计9.1-方差分析(ANOVA)概念与原理》
《我对方差分析原理的通俗理解,请指正》
《概率论与数理统计知识点提炼(第九章:方差分析及回归分析)》