【统计学笔记】方差分析表和回归分析表的解读

F = M S ⊙ M S E ∼ F ( d f ( ⊙ ) , d f ( E ) ) ( ⊙ 表 示 误 差 来 源 中 因 素 的 简 写 , M S ⊙ 表 示 M S A 、 M S R 或 M S C 等 , d f ( ⊙ ) 表 示 因 素 ⊙ 的 自 由 度 ) F = \frac{MS⊙}{MSE} \sim F(\quad df( ⊙),df(E)\quad) \\ \qquad \\ (⊙表示误差来源中因素的简写,MS⊙表示MSA、MSR或MSC等,df(⊙)表示因素⊙的自由度) F=MSEMSF(df(),df(E))(MSMSAMSRMSCdf())
M S ⊙ = S S ⊙ d f ( ⊙ ) MS⊙ = \frac{SS⊙}{df(⊙)} MS=df()SS

自由度 ( d f df df):degree of freedom
平方和 ( S S SS SS):Sum of Square
均方 ( M S MS MS):Mean Square

1. 方差分析表

1.1 单因素方差分析表

  • k:因素总体的个数
  • n:观测值个数
误差来源 平方和
S S SS SS
自由度
d f df df
均方
M S MS MS
F F F P P P F F F临界值
S i g n i f i c a n c e    F Significance \; F SignificanceF
组间(因素影响)
f a c t o r    A factor \; \bold A factorA
S S A SSA SSA k − 1 k-1 k1 M S A = S S A k − 1 MSA = \frac{SSA}{k-1} MSA=k1SSA M S A M S E \frac{MSA}{MSE} MSEMSA 根据显著性水平 α \alpha α确定
组内(误差)
E r r o r \bold{E}rror Error
S S E SSE SSE n − k n-k nk M S E = S S E n − k MSE = \frac{SSE}{n-k} MSE=nkSSE
总和
T o t a l \bold Total Total
S S T SST SST n − 1 n-1 n1

1.2 双因素方差分析表

  • k k k:行因素个数
  • r r r:列因素个数
    (为什么不是 r r r为行因素个数, c c c是列因素个数呢?哼?)
1.2.1 无交互作用的双因素方差分析表
误差来源 平方和
S S SS SS
自由度
d f df df
均方
M S MS MS
F F F P值 F临界值
行因素
R o w \bold Row Row
S S R SSR SSR k − 1 k-1 k1 M S R = S S R k − 1 MSR = \frac{SSR}{k-1} MSR=k1SSR F R = M S R M S E F_R = \frac{MSR}{MSE} FR=MSEMSR 根据显著性水平 α \alpha α确定
列因素
C o l u m n \bold Column Column
S S C SSC SSC r − 1 r-1 r1 M S C = S S C r − 1 MSC = \frac{SSC}{r-1} MSC=r1SSC F C = M S C M S E F_C = \frac{MSC}{MSE} FC=MSEMSC
误差
E r r o r \bold{E}rror Error
S S E SSE SSE ( k − 1 ) × ( r − 1 ) (k-1)\times(r-1) (k1)×(r1) M S E = S S E ( k − 1 ) × ( r − 1 ) MSE = \frac{SSE}{(k-1)\times(r-1)} MSE=(k1)×(r1)SSE
总和
T o t a l \bold Total Total
S S T SST SST k r − 1 kr-1 kr1
1.2.2 有交互作用的双因素方差分析表

【统计学笔记】方差分析表和回归分析表的解读_第1张图片


2. 回归分析表

2.1 一元回归分析表

  • 回归统计:
统计量 公式
M u l t i p l e    R Multiple \; R MultipleR 相关系数 r = R 2 r = \sqrt{R^2} r=R2
R    S q u a r e R \; Square RSquare 判定系数 R 2 = S S R S S T = r 2 R^2 = \frac{SSR}{SST} = r^2 R2=SSTSSR=r2
A d j u s t e d    R    S q u a r e Adjusted \; R \; Square AdjustedRSquare 调整的 R 2 = 1 − ( 1 − R 2 ) n − 1 n − k − 1 R^2 = 1-(1-R^2)\frac{n-1}{n-k-1} R2=1(1R2)nk1n1
标准误差 s e = M S E s_e = \sqrt{MSE} se=MSE
  • 方差分析:回归统计需要用到方差分析里的数据
误差来源 S S SS SS d f df df M S MS MS F F F S i g n i f i c a n c e    F Significance \; F SignificanceF
回归
R e g r e s s i o n \bold Regression Regression
S S R SSR SSR 1 1 1 M S R = S S R 1 MSR = \frac{SSR}{1} MSR=1SSR F = M S R M S E ∼ F ( 1 , n − 2 ) F = \frac{MSR}{MSE} \sim F(1, n-2) F=MSEMSRF(1,n2) 根据显著性水平 α \alpha α确定
残差
E r r o r \bold{E}rror Error
S S E SSE SSE n − 2 n-2 n2 M S E = S S E n − 2 MSE = \frac{SSE}{n-2} MSE=n2SSE
总计
T o t a l \bold Total Total
S S T SST SST n − 1 n-1 n1
  • 回归分析估计:
估计量 系数
C o e f f i c i e n t s Coefficients Coefficients
标准误差
t t t 统计量
t    S t a t t \; Stat tStat
P值
P − v a l u e P-value Pvalue
置信区间
L o w e r    95 % Lower \; 95\% Lower95%
置信区间
U p p e r    95 % Upper \; 95\% Upper95%
截距
I n t e r c e p t Intercept Intercept
β ^ 0 \hat \beta_0 β^0 s β ^ 0 s_{\hat \beta_0} sβ^0 t = β ^ 0 s β ^ 0 t = \frac{\hat \beta_0}{s_{\hat \beta_0}} t=sβ^0β^0
斜率
X    V  ⁣ a r i a b l e    1 X \; V\!ariable \;1 XVariable1
β ^ 1 \hat \beta_1 β^1 s β ^ 1 s_{\hat \beta_1} sβ^1 t = β ^ 1 s β ^ 1 t = \frac{\hat \beta_1}{s_{\hat \beta_1}} t=sβ^1β^1

2.2 多元回归分析表(其实只用看这个就好了,当k=1时就是一元回归分析)

k:自变量x的个数

  • 回归统计:
统计量 公式
M u l t i p l e    R Multiple \; R MultipleR 相关系数 r = R 2 r = \sqrt{R^2} r=R2
R    S q u a r e R \; Square RSquare 判定系数 R 2 = S S R S S T = r 2 R^2 = \frac{SSR}{SST} = r^2 R2=SSTSSR=r2
A d j u s t e d    R    S q u a r e Adjusted \; R \; Square AdjustedRSquare 调整的 R 2 = 1 − ( 1 − R 2 ) n − 1 n − k − 1 R^2 = 1-(1-R^2)\frac{n-1}{n-k-1} R2=1(1R2)nk1n1
标准误差 s e = M S E s_e = \sqrt{MSE} se=MSE
  • 方差分析:回归统计需要用到方差分析里的数据
误差来源 S S SS SS d f df df M S MS MS F F F S i g n i f i c a n c e    F Significance \; F SignificanceF
回归
R e g r e s s i o n \bold Regression Regression
S S R SSR SSR k ( 自 变 量 x 的 个 数 ) k(自变量x的个数) k(x) M S R = S S R k MSR = \frac{SSR}{k} MSR=kSSR F = M S R M S E ∼ F ( k , n − k − 1 ) F = \frac{MSR}{MSE} \sim F(k, n-k-1) F=MSEMSRF(k,nk1) 根据显著性水平 α \alpha α确定
残差
E r r o r \bold{E}rror Error
S S E SSE SSE n − k − 1 n-k-1 nk1 M S E = S S E n − k − 1 MSE = \frac{SSE}{n-k-1} MSE=nk1SSE
总计
T o t a l \bold Total Total
S S T SST SST n − 1 n-1 n1
  • 回归分析估计:
估计量 系数
C o e f f i c i e n t s ( β ^ i ) Coefficients(\hat \beta_i) Coefficients(β^i)
标准误差( s β ^ i s_{\hat \beta_i} sβ^i) 检验统计量( t t t )
t    S t a t t \; Stat tStat
P值
P − v a l u e P-value Pvalue
置信区间
L o w e r    95 % Lower \; 95\% Lower95%
置信区间
U p p e r    95 % Upper \; 95\% Upper95%
截距
I n t e r c e p t Intercept Intercept
β ^ 0 \hat \beta_0 β^0 s β ^ 0 s_{\hat \beta_0} sβ^0 t 0 = β ^ 0 s β ^ 0 t_0 = \frac{\hat \beta_0}{s_{\hat \beta_0}} t0=sβ^0β^0
x 1 x_1 x1
X    V  ⁣ a r i a b l e    1 X \; V\!ariable \;1 XVariable1
β ^ 1 \hat \beta_1 β^1 s β ^ 1 s_{\hat \beta_1} sβ^1 t 1 = β ^ 1 s β ^ 1 t_1 = \frac{\hat \beta_1}{s_{\hat \beta_1}} t1=sβ^1β^1
x 2 x_2 x2
X    V  ⁣ a r i a b l e    2 X \; V\!ariable \;2 XVariable2
β ^ 2 \hat \beta_2 β^2 s β ^ 2 s_{\hat \beta_2} sβ^2 t 2 = β ^ 2 s β ^ 2 t_2 = \frac{\hat \beta_2}{s_{\hat \beta_2}} t2=sβ^2β^2
. . . . . . ...... ......
x k x_k xk
X    V  ⁣ a r i a b l e    k X \; V\!ariable \;k XVariablek
β ^ k \hat \beta_k β^k s β ^ k s_{\hat \beta_k} sβ^k t k = β ^ k s β ^ k t_k = \frac{\hat \beta_k}{s_{\hat \beta_k}} tk=sβ^kβ^k

你可能感兴趣的:(统计学笔记,回归,机器学习,算法)