总体:研究对象的全体或研究对象的某项(或某些)数量指标的全体,用 X X X表示(正态总体: X ~ N ( μ , σ 2 ) \newcommand{\td}{\,\text{\large\textasciitilde}\,}X\td N(\mu,\sigma^2) X~N(μ,σ2))
个体:总体的每个元素
有限总体:含有有限个个体的总体
无限总体:含有无限个个体的总体
总体分布:数量指标 X X X取不同值的比率(是客观存在的)
样本/子样:总体中取得的一部分个体
样本容量( n n n):样本中所含个体的个数
抽样:取得样本的过程
抽样法:抽样过程所采取的方法
随机抽样法:每一个个体是从总体中随机抽取的
随机样本:采用随机抽样法得到的样本
样本: n 维随机向量 ( X 1 , X 2 , ⋯ , X n ) ⟶ 观测 样本值:一组具体的实数 ( x 1 , x 2 , ⋯ , x n ) \text{样本:}n\text{维随机向量}(X_1,X_2,\cdots,X_n)\overset{\text{观测}}{\longrightarrow}\text{样本值:一组具体的实数}(x_1,x_2,\cdots,x_n) 样本:n维随机向量(X1,X2,⋯,Xn)⟶观测样本值:一组具体的实数(x1,x2,⋯,xn)简单随机样本:各 X i X_i Xi与 X X X同分布且相互独立(不做特殊声明,样本均指简单随机样本)
简单随机抽样:获得简单随机样本的方法
简单随机样本 ( X 1 , X 2 , ⋯ , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,⋯,Xn)的分布函数:设总体 X X X的分布函数为 F ( x ) F(x) F(x),则样本的分布函数为 F ( x 1 , x 2 , ⋯ , x n ) = P { X 1 ≤ x 1 , X 2 ≤ x 2 , ⋯ , X n ≤ x n } = ∏ i = 1 n P { X i ≤ x i } = ∏ i = 1 n F ( x i ) F(x_1,x_2,\cdots,x_n)=P\{X_1\le x_1,X_2\le x_2,\cdots,X_n\le x_n\}=\prod\limits_{i=1}^n P\{X_i\le x_i\}=\prod\limits_{i=1}^n F(x_i) F(x1,x2,⋯,xn)=P{X1≤x1,X2≤x2,⋯,Xn≤xn}=i=1∏nP{Xi≤xi}=i=1∏nF(xi)
样本频数分布:样本值中不同数值在样本值中出现的频数(即次数)
样本频率分布:样本值中不同数值在样本值中出现的频率(即次数/样本容量)
设样本值中不同的数值记为 x 1 ∗ , x 2 ∗ , ⋯ , x l ∗ x_1^*,x_2^*,\cdots,x_l^* x1∗,x2∗,⋯,xl∗(递增),相应的频数为 m 1 , m 2 , ⋯ , m l m_1,m_2,\cdots,m_l m1,m2,⋯,ml( ∑ i = 1 l m i = n \sum\limits_{i=1}^l m_i=n i=1∑lmi=n),则样本频数分布表:
指标 X X X | x 1 ∗ x_1^* x1∗ | x 2 ∗ x_2^* x2∗ | ⋯ \cdots ⋯ | x l ∗ x_l^* xl∗ |
---|---|---|---|---|
频数 m i m_i mi | m 1 m_1 m1 | m 2 m_2 m2 | ⋯ \cdots ⋯ | m l m_l ml |
样本频率分布表:
指标 X X X | x 1 ∗ x_1^* x1∗ | x 2 ∗ x_2^* x2∗ | ⋯ \cdots ⋯ | x l ∗ x_l^* xl∗ |
---|---|---|---|---|
频率 m i n \frac{m_i}{n} nmi | m 1 n \frac{m_1}{n} nm1 | m 2 n \frac{m_2}{n} nm2 | ⋯ \cdots ⋯ | m l n \frac{m_l}{n} nml |
如果总体 X X X是离散型随机变量,则事件 { X = x i ∗ } \{X=x_i^*\} {X=xi∗}的频率 m i n \frac{m_i}{n} nmi应接近其发生的概率 p i p_i pi。
如果总体 X X X是连续型随机变量,那么事件 { X = x i ∗ } \{X=x_i^*\} {X=xi∗}发生的概率都是 0 0 0,此时考察样本频率分布意义不大,需要考察样本的频率直方图。
设总体 X X X是一个连续型随机变量,具有概率密度 f ( x ) f(x) f(x), ( x 1 , x 2 , ⋯ , x n ) (x_1,x_2,\cdots,x_n) (x1,x2,⋯,xn)是来自总体 X X X的一个样本值。作频率直方图的方法为:
整理数据:把样本值 x 1 , x 2 , ⋯ , x n x_1,x_2,\cdots,x_n x1,x2,⋯,xn从小到大排序得 x ( 1 ) ≤ x ( 2 ) ≤ ⋯ ≤ x ( n ) x_{(1)}\le x_{(2)}\le\cdots\le x_{(n)} x(1)≤x(2)≤⋯≤x(n)。
分组:在包含所有观测值的区间 [ a , b ] [a,b] [a,b]中插入一些分点 a = t 0 < t 1 < ⋯ < t l − 1 < t l = b a=t_0
一般采取等分(各组的组距相等),此时 d i = b − a l d_i=\frac{b-a}{l} di=lb−a。组距 l l l的选取:
注意划分原则:要使每个区间内都有样本观测值落入其中。
列分组频率分布表:以 m i m_i mi表示观测值落入 ( t i − 1 , t i ] (t_{i-1},t_i] (ti−1,ti]中的个数(即这个区间或这组的频数), f i = m i n f_i=\frac{m_i}{n} fi=nmi为这组的频率,记 y i = f i d i = m i n d i y_i=\frac{f_i}{d_i}\textcolor{#aaaaaa}{=\frac{m_i}{nd_i}} yi=difi=ndimi,将分组整理的数据列成表:
分组 | 组中值 | 频数 m i m_i mi | 频率 f i f_i fi | y i y_i yi |
---|---|---|---|---|
[ 27 , 30 ] [27,30] [27,30] | 28.5 28.5 28.5 | 8 8 8 | 0.105 0.105 0.105 | 0.035 0.035 0.035 |
( 30 , 33 ] (30,33] (30,33] | 31.5 31.5 31.5 | 10 10 10 | 0.132 0.132 0.132 | 0.044 0.044 0.044 |
⋯ \cdots ⋯ | ⋯ \cdots ⋯ | ⋯ \cdots ⋯ | ⋯ \cdots ⋯ | ⋯ \cdots ⋯ |
设有样本值 ( x 1 , x 2 , ⋯ , x n ) (x_1,x_2,\cdots,x_n) (x1,x2,⋯,xn),其经验分布函数为 F n ( x ) = 1 n ∑ i = 1 n [ x i ≤ x ] F_n(x)=\frac{1}{n}\sum\limits_{i=1}^n\left[x_i\le x\right] Fn(x)=n1i=1∑n[xi≤x]其中 [ x i ≤ x ] \left[x_i\le x\right] [xi≤x]表示当 x i ≤ x x_i\le x xi≤x时取 1 1 1, x i > x x_i>x xi>x时取 0 0 0。总结起来, F n ( x ) F_n(x) Fn(x)就是 n n n个样本值中小于等于 x x x的 x i x_i xi的个数除以样本容量 n n n。换言之,就是小于等于 x x x的样本值的个数占总的样本个数的比例。
经验分布函数具有如下性质:
(1) 单调增;
(2) 右连续;
(3) F n ( − ∞ ) = 0 F_n(-\infty)=0 Fn(−∞)=0, F n ( + ∞ ) = 1 F_n(+\infty)=1 Fn(+∞)=1。
如果样本值以频数分布表给出,则经验分布函数 F n ( x ) F_n(x) Fn(x)可具体表达为 F n ( x ) = { 0 , x < x i ∗ m 1 + m 2 + ⋯ + m i n , x i ∗ ≤ x < x i + 1 ∗ , ( i = 1 , 2 , ⋯ , l − 1 ) 1 , x ≥ x l ∗ F_n(x)=\begin{cases} 0,&x
经验分布函数不仅与样本容量有关,还与得到的样本值 ( x 1 , x 2 , ⋯ , x n ) (x_1,x_2,\cdots,x_n) (x1,x2,⋯,xn)有关。
统计量:设 ( X 1 , X 2 , ⋯ , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,⋯,Xn)是来自总体 X X X的一个样本, T = g ( X 1 , X 2 , ⋯ , X n ) T=g(X_1,X_2,\cdots,X_n) T=g(X1,X2,⋯,Xn)为 ( X 1 , X 2 , ⋯ , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,⋯,Xn)的一个实值函数,且 g g g中不包含任何未知参数,则称 T T T为样本 ( X 1 , X 2 , ⋯ , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,⋯,Xn)的一个统计量。
统计量的观测值:若 ( x 1 , x 2 , ⋯ , x n ) (x_1,x_2,\cdots,x_n) (x1,x2,⋯,xn)是样本 ( X 1 , X 2 , ⋯ , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,⋯,Xn)的一个观测值,则 t = g ( x 1 , x 2 , ⋯ , x n ) t=g(x_1,x_2,\cdots,x_n) t=g(x1,x2,⋯,xn)称为统计量 T T T的一个观测值。
设 ( X 1 , X 2 , ⋯ , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,⋯,Xn)是来自总体 X X X的样本, ( x 1 , x 2 , ⋯ , x n ) (x_1,x_2,\cdots,x_n) (x1,x2,⋯,xn)是这一样本的观测值。
样本均值: X ‾ = 1 n ∑ i = 1 n X i \overline{X}=\frac{1}{n}\sum\limits_{i=1}^n X_i X=n1i=1∑nXi(其观测值记为 x ‾ \overline{x} x)
设 E ( X ) = μ E(X)=\mu E(X)=μ、 D ( X ) = σ 2 D(X)=\sigma^2 D(X)=σ2存在,则
样本方差: S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 = 1 n − 1 ( ∑ i = 1 n X i 2 − n X ‾ 2 ) S^2=\frac{1}{\textcolor{red}{n-1}}\sum\limits_{i=1}^n(X_i-\overline{X})^2=\frac{1}{\textcolor{red}{n-1}}\left(\sum\limits_{i=1}^n X_i^2-n\overline{X}^2\right) S2=n−11i=1∑n(Xi−X)2=n−11(i=1∑nXi2−nX2)(其观测值记为 s 2 s^2 s2)
样本标准差: S = S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S=\sqrt{S^2}=\sqrt{\frac{1}{\textcolor{red}{n-1}}\sum\limits_{i=1}^n(X_i-\overline{X})^2} S=S2=n−11i=1∑n(Xi−X)2(其观测值记为 s s s)
它们是反映样本值分散程度的量。
设 E ( X ) = μ E(X)=\mu E(X)=μ、 D ( X ) = σ 2 D(X)=\sigma^2 D(X)=σ2存在,则
样本 k k k阶原点矩: A k = 1 n ∑ i = 1 n X i k A_k=\frac{1}{n}\sum\limits_{i=1}^n X_i^k Ak=n1i=1∑nXik(其观测值记为 a k a_k ak)
样本 k k k阶中心矩: B k = 1 n ∑ i = 1 n ( X i − X ‾ ) k B_k=\frac{1}{n}\sum\limits_{i=1}^n(X_i-\overline{X})^k Bk=n1i=1∑n(Xi−X)k(其观测值记为 b k b_k bk)
显然, A 1 = X ‾ A_1=\overline{X} A1=X, B 1 = 0 B_1=0 B1=0, B 2 = n − 1 n S 2 B_2=\textcolor{red}{\frac{n-1}{n}}S^2 B2=nn−1S2。
设总体 X X X的 k k k阶原点矩 α k = E ( X k ) \alpha_k=E(X^k) αk=E(Xk)存在,则
设 ( X 1 , X 2 , ⋯ , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,⋯,Xn)是来自总体 X X X的样本, ( x 1 , x 2 , ⋯ , x n ) (x_1,x_2,\cdots,x_n) (x1,x2,⋯,xn)是这一样本的一个观测值。将观测值 x 1 , x 2 , ⋯ , x n x_1,x_2,\cdots,x_n x1,x2,⋯,xn从小到大排列为 x ( 1 ) ≤ x ( 2 ) ≤ ⋯ ≤ x ( n ) x_{(1)}\le x_{(2)}\le\dots\le x_{(n)} x(1)≤x(2)≤⋯≤x(n)。
定义统计量 X ( k ) X_{(k)} X(k)取值为 x ( k ) x_{(k)} x(k)( k = 1 , 2 , ⋯ , n k=1,2,\cdots,n k=1,2,⋯,n),由此得到 n n n个统计量 X ( 1 ) , X ( 2 ) , ⋯ , X ( n ) X_{(1)},X_{(2)},\cdots,X_{(n)} X(1),X(2),⋯,X(n),且它们满足 X ( 1 ) ≤ X ( 2 ) ≤ ⋯ ≤ X ( n ) X_{(1)}\le X_{(2)}\le\dots\le X_{(n)} X(1)≤X(2)≤⋯≤X(n),称 X ( 1 ) , X ( 2 ) , ⋯ , X ( n ) X_{(1)},X_{(2)},\cdots,X_{(n)} X(1),X(2),⋯,X(n)为该样本的顺序统计量或次序统计量。
最小顺序统计量: X ( 1 ) = min { X ( 1 ) , X ( 2 ) , ⋯ , X ( n ) } X_{(1)}=\min\{X_{(1)},X_{(2)},\cdots,X_{(n)}\} X(1)=min{X(1),X(2),⋯,X(n)}
最大顺序统计量: X ( n ) = max { X ( 1 ) , X ( 2 ) , ⋯ , X ( n ) } X_{(n)}=\max\{X_{(1)},X_{(2)},\cdots,X_{(n)}\} X(n)=max{X(1),X(2),⋯,X(n)}
样本极差: R = X ( n ) − X ( 1 ) R=X_{(n)}-X_{(1)} R=X(n)−X(1)(其观测值记为 r = x ( n ) − x ( 1 ) r=x_{(n)}-x_{(1)} r=x(n)−x(1))
样本 p p p分位数:对于 0 < p < 1 0 0<p<1
样本中位数: p = 1 2 p=\frac{1}{2} p=21时的样本中位数( n n n为奇数时等于 X ( ⌈ n 2 ⌉ ) X_{\left(\left\lceil\frac{n}{2}\right\rceil\right)} X(⌈2n⌉), n n n为偶数时等于 1 2 ( X ( n 2 ) + X ( n 2 + 1 ) ) \frac{1}{2}\left(X_{\left(\frac{n}{2}\right)}+X_{\left(\frac{n}{2}+1\right)}\right) 21(X(2n)+X(2n+1)))
抽样分布:统计量的概率分布
X X X服从参数为 α , λ \alpha,\lambda α,λ的 Γ \Gamma Γ分布: X ~ Γ ( α , λ ) \newcommand{\td}{\,\text{\large\textasciitilde}\,}X\td\Gamma(\alpha,\lambda) X~Γ(α,λ),其中 α > 0 , λ > 0 \alpha>0,\lambda>0 α>0,λ>0
性质:
在 Γ \Gamma Γ分布中取 α = n 2 \alpha=\frac{n}{2} α=2n、 λ = 1 2 \lambda=\frac{1}{2} λ=21, Γ \Gamma Γ分布就是自由度为 n n n的 χ 2 \chi^2 χ2分布。
Z Z Z服从自由度为 n n n的 χ 2 \chi^2 χ2分布: Z ~ χ 2 ( n ) \newcommand{\td}{\,\text{\large\textasciitilde}\,}Z\td\chi^2(n) Z~χ2(n)
性质:
T T T服从自由度为 n n n的 t t t分布: T ~ t ( n ) \newcommand{\td}{\,\text{\large\textasciitilde}\,}T\td t(n) T~t(n)
t t t分布又称为学生氏分布。
t t t分布的概率密度关于 x = 0 x=0 x=0对称( Γ \Gamma Γ分布、 χ 2 \chi^2 χ2分布、 F F F分布的概率密度都仅在 x > 0 x>0 x>0时为正),且 lim n → ∞ t ( x ; n ) = 1 2 π e − x 2 2 \lim\limits_{n\to\infty} t(x;n)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}} n→∞limt(x;n)=2π1e−2x2,故当 n → ∞ n\to\infty n→∞时自由度为 n n n的 t t t分布收敛于标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1)。
性质:若 X ~ N ( 0 , 1 ) \newcommand{\td}{\,\text{\large\textasciitilde}\,}X\td N(0,1) X~N(0,1), Y ~ χ 2 ( n ) \newcommand{\td}{\,\text{\large\textasciitilde}\,}Y\td\chi^2(n) Y~χ2(n),且 X X X与 Y Y Y相互独立,则 T = X Y / n ~ t ( n ) \newcommand{\td}{\,\text{\large\textasciitilde}\,} T=\frac{X}{\sqrt{Y/n}}\td t(n) T=Y/nX~t(n)
F F F服从自由度为 ( n 1 , n 2 ) (n_1,n_2) (n1,n2)的 F F F分布: F ~ F ( n 1 , n 2 ) \newcommand{\td}{\,\text{\large\textasciitilde}\,}F\td F(n_1,n_2) F~F(n1,n2)
性质:
设随机变量 X X X的分布函数为 F ( x ) = P { X ≤ x } F(x)=P\{X\le x\} F(x)=P{X≤x}。 0<p<1
下侧 p p p分位数:对于 0 < p < 1 0
上侧 α \alpha α分位数:对于 0 < α < 1 0<\alpha<1 0<α<1,若 x α x_\alpha xα使 P { X > x α } = 1 − F ( x α ) = α P\{X>x_\alpha\}=1-F(x_\alpha)=\alpha P{X>xα}=1−F(xα)=α,则称 x α x_\alpha xα为分布 F ( x ) F(x) F(x)(或随机变量 X X X)的上侧 α \alpha α分位数。
上侧 α \alpha α分位数=下侧 1 − α 1-\alpha 1−α分位数;
下侧 p p p分位数=上侧 1 − p 1-p 1−p分位数。
总的来说,上侧 α \alpha α分位数就是使得 X X X大于它的概率为 α \alpha α的那个数。
标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1)的上侧 α \alpha α分位数:用 u α u_\alpha uα表示, 1 − Φ ( u α ) = α 1-\Phi(u_\alpha)=\alpha 1−Φ(uα)=α; u 1 − α = − u α u_{1-\alpha}=-u_\alpha u1−α=−uα
t ( n ) t(n) t(n)分布的上侧 α \alpha α分位数:用 t α ( n ) t_\alpha(n) tα(n)表示; t 1 − α = − t α t_{1-\alpha}=-t_\alpha t1−α=−tα
χ 2 ( n ) \chi^2(n) χ2(n)分布的上侧 α \alpha α分位数:用 χ α 2 ( n ) \chi^2_\alpha(n) χα2(n)表示
F ( n 1 , n 2 ) F(n_1,n_2) F(n1,n2)分布的上侧 α \alpha α分位数:用 F α ( n 1 , n 2 ) F_\alpha(n_1,n_2) Fα(n1,n2)表示; F α ( n 1 , n 2 ) = 1 F 1 − α ( n 2 , n 1 ) F_\alpha(n_1,n_2)=\frac{1}{F_{1-\alpha}(n_2,n_1)} Fα(n1,n2)=F1−α(n2,n1)1
若分布的概率密度函数关于 x = 0 x=0 x=0对称,则它的上侧 1 − α 1-\alpha 1−α分位数等于上侧 α \alpha α分位数的相反数。以标准正态分布为例,我们知道 Φ ( u α ) = 1 − α \Phi(u_\alpha)=1-\alpha Φ(uα)=1−α, Φ ( u 1 − α ) = α \Phi(u_{1-\alpha})=\alpha Φ(u1−α)=α,则 Φ ( u α ) + Φ ( u 1 − α ) = 1 \Phi(u_\alpha)+\Phi(u_{1-\alpha})=1 Φ(uα)+Φ(u1−α)=1。而 Φ ( u α ) = ∫ − ∞ u α φ ( x ) d x = ∫ − u α + ∞ φ ( x ) d x \newcommand{\dif}{\mathop{}\!\mathrm{d}}\Phi(u_\alpha)=\int_{-\infty}^{u_\alpha}\varphi(x)\dif x=\int_{-u_\alpha}^{+\infty}\varphi(x)\dif x Φ(uα)=∫−∞uαφ(x)dx=∫−uα+∞φ(x)dx, Φ ( u 1 − α ) = ∫ − ∞ u 1 − α φ ( x ) d x \newcommand{\dif}{\mathop{}\!\mathrm{d}}\Phi(u_{1-\alpha})=\int_{-\infty}^{u_{1-\alpha}}\varphi(x)\dif x Φ(u1−α)=∫−∞u1−αφ(x)dx,两者之和为 1 1 1,说明前者积分的下限等于后者积分的上限,故 u 1 − α = − u α u_{1-\alpha}=-u_\alpha u1−α=−uα。同理 t 1 − α = − t α t_{1-\alpha}=-t_\alpha t1−α=−tα。
关于 F α ( n 1 , n 2 ) = 1 F 1 − α ( n 2 , n 1 ) F_\alpha(n_1,n_2)=\frac{1}{F_{1-\alpha}(n_2,n_1)} Fα(n1,n2)=F1−α(n2,n1)1,证明如下:设 X ~ F ( n 1 , n 2 ) \newcommand{\td}{\,\text{\large\textasciitilde}\,}X\td F(n_1,n_2) X~F(n1,n2),则 P { X > F α ( n 1 , n 2 ) } = α P\{X>F_\alpha(n_1,n_2)\}=\alpha P{X>Fα(n1,n2)}=α, P { 1 X < 1 F α ( n 1 , n 2 ) } = α P\left\{\frac{1}{X}<\frac{1}{F_\alpha(n_1,n_2)}\right\}=\alpha P{X1<Fα(n1,n2)1}=α,而 1 X ~ F ( n 2 , n 1 ) \newcommand{\td}{\,\text{\large\textasciitilde}\,}\frac{1}{X}\td F(n_2,n_1) X1~F(n2,n1),故 P { 1 X < F 1 − α ( n 2 , n 1 ) } = 1 − ( 1 − α ) = α P\left\{\frac{1}{X}
设 ( X 1 , X 2 , ⋯ , X n ) (X_1,X_2,\cdots,X_n) (X1,X2,⋯,Xn)是来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的样本, X ‾ \overline{X} X为样本均值, S 2 S^2 S2为样本方差,则:
设 ( X 1 , X 2 , ⋯ , X n 1 ) (X_1,X_2,\cdots,X_{n_1}) (X1,X2,⋯,Xn1), ( Y 1 , Y 2 , ⋯ , Y n 2 ) (Y_1,Y_2,\cdots,Y_{n_2}) (Y1,Y2,⋯,Yn2)是分别来自 N ( μ 1 , σ 2 ) N(\mu_1,\sigma^2) N(μ1,σ2), N ( μ 2 , σ 2 ) N(\mu_2,\sigma^2) N(μ2,σ2)的样本(注意方差是相等的),且两样本相互独立, X ‾ = 1 n 1 ∑ i = 1 n 1 X i \overline{X}=\frac{1}{n_1}\sum\limits_{i=1}^{n_1}X_i X=n11i=1∑n1Xi, Y ‾ = 1 n 1 ∑ i = 1 n 2 Y i \overline{Y}=\frac{1}{n_1}\sum\limits_{i=1}^{n_2}Y_i Y=n11i=1∑n2Yi, S 1 n 1 2 = 1 n 1 − 1 ∑ i = 1 n 1 ( X i − X ‾ ) 2 S_{1n_1}^2=\frac{1}{n_1-1}\sum\limits_{i=1}^{n_1}{\left(X_i-\overline{X}\right)}^2 S1n12=n1−11i=1∑n1(Xi−X)2, S 2 n 2 2 = 1 n 2 − 1 ∑ i = 1 n 2 ( Y i − Y ‾ ) 2 S_{2n_2}^2=\frac{1}{n_2-1}\sum\limits_{i=1}^{n_2}{\left(Y_i-\overline{Y}\right)}^2 S2n22=n2−11i=1∑n2(Yi−Y)2,则有:
解释: