【数理统计】学习笔记01:数理统计的基本概念

文章目录

  • 一、统计的基本概念
    • 1.1 总体
    • 1.2 简单随机样本
    • 1.3 样本 ( X 1 , X 2 , ⋯   , X n ) (X_1, X_2, \cdots , X_n) (X1,X2,,Xn) 的联合分布
    • 1.4 统计量
      • 1.4.1 常用统计量
      • 1.4.2 顺序统计量【重点】
      • 1.4.3 经验分布函数
      • 1.4.4 充分统计量(统计量的性质)

一、统计的基本概念

1.1 总体

  • 总体的概念:
    • 总体: 研究对象的全体。
    • 个体: 总体中的每一个研究个体。
    • 总体容量: 总体中包含的个体数。
    • 有限总体: 容量有限。
    • 无限总体: 容量无限,通常将容量很大的总体按无限总体处理。
  • 处理概率问题时,随机变量X的分布都是已知的。
  • 但是在统计中,总体X的分布要么未知,要么分布形式已知但参数未知,需要抽取部分个体来推断。

例1: 某高校针对学生对教学管理是否满意,在全体学生中展开调查,全体学生是总体,是有限总体,只关心“对教学管理满意或不满意”这个指标值,通常赋值 ( 0 , 1 ) (0, 1) (0,1)

例2: 某药厂研究某种药物在人体中的吸收情况,总体是全体国民,只关心国民服药的吸收量值,是有限总体,但容量很大,按无限总体处理。

例3: 考察渤海水质有机磷污染情况,渤海海水是总体,只关心其中的有机磷含量值,是无限总体。总体是随机变量,一般地,可以认为:总体 ⇔ X \Leftrightarrow X X

1.2 简单随机样本

X 1 , X 2 , ⋯   , X n X_1, X_2, \cdots , X_n X1,X2,,Xn 独立同分布)

  • 概念: 在总体 X X X 所有观察值中抽取部分观察值 ( x 1 , x 2 , ⋯   , x n ) (x_1, x_2, \cdots , x_n) (x1,x2,,xn),这n个观察值是随机的,称 ( X 1 , X 2 , ⋯   , X n ) (X_1, X_2, \cdots , X_n) (X1,X2,,Xn) 为容量为n的一个随机样本。n为样本容量。
  • 特性:
    1. 代表性: X i X_i Xi 与总体 X X X 同分布。(保证总体中每个值都有同样的机会被抽到)
    2. 独立性: 每次抽取独立进行,各样本值互不影响。简称样本

例1: 给一个理想化总体,抽取(放回)样本来推断总体,观察推断效果某棵树每年产果10个,1等果3个每个价格8元,2等果4个每个价格6元,3等果2个每个价格2元,次果1个每个价格0元,考察果子收益情况,每次抽取两个果,如何抽才能得到简单随机样本?列出所有简单随机抽样样本值,并列出下列指标值:


总体: 树上的果子。
总体容量: 10。
总体分布:

0 2 6 8
1 10 \frac{1}{10} 101 2 10 \frac{2}{10} 102 4 10 \frac{4}{10} 104 3 10 \frac{3}{10} 103

期望: E ( X ) = 4 10 + 24 10 + 24 10 = 5.2 E(X)=\frac{4}{10} + \frac{24}{10} + \frac{24}{10}=5.2 E(X)=104+1024+1024=5.2
方差: D ( X ) = 1 10 ( 0 − 5.2 ) 2 + 2 10 ( 2 − 5.2 ) 2 + 4 10 ( 6 − 5.2 ) 2 + 3 10 ( 8 − 5.2 ) 2 = 7.36 D(X)=\frac{1}{10} (0-5.2)^2 + \frac{2}{10} (2-5.2)^2 + \frac{4}{10} (6-5.2)^2 + \frac{3}{10}(8-5.2)^2 = 7.36 D(X)=101(05.2)2+102(25.2)2+104(65.2)2+103(85.2)2=7.36
简单随机样本:
每次抽样得到观察值 ( x 1 , x 2 ) (x_1, x_2) (x1,x2) x 1 x_1 x1 是随机变量 X 1 X_1 X1的一个随机取值, x 2 x_2 x2 是随机变量 X 2 X_2 X2的一个随机取值, X 1 X_1 X1 X 2 X_2 X2相互独立并与总体 X X X同分布, ( X 1 , X 2 ) (X_1, X_2) (X1,X2) 构成二维随机变量。
样本值:
【数理统计】学习笔记01:数理统计的基本概念_第1张图片

1.3 样本 ( X 1 , X 2 , ⋯   , X n ) (X_1, X_2, \cdots , X_n) (X1,X2,,Xn) 的联合分布

  • 离散型:
    • 总体 X X X 的分布列 P ( X = x i ) = p i , i = 1 , 2 , ⋯ P(X=x_i)=p_i, \quad i=1, 2, \cdots P(X=xi)=pi,i=1,2,
    • 样本 ( X 1 , X 2 , ⋯   , X n ) (X_1, X_2, \cdots , X_n) (X1,X2,,Xn) 的联合分布列:
      P ( X 1 = x 1 , X 2 = x 2 , ⋯   , X n = x n ) = ∏ i = 1 n P ( X = x i ) P(X_1=x_1, X_2=x_2, \cdots , X_n=x_n) = \prod_{i=1}^{n}P(X=x_i) P(X1=x1,X2=x2,,Xn=xn)=i=1nP(X=xi)
  • 连续型:
    • 总体 X X X 的分布密度 f ( x ) f(x) f(x)
    • 样本 ( X 1 , X 2 , ⋯   , X n ) (X_1, X_2, \cdots , X_n) (X1,X2,,Xn) 的联合密度:
      f ( x 1 , x 2 , ⋯   , x n ) = f ( x 1 ) f ( x 2 ) ⋯ f ( x n ) f(x_1, x_2, \cdots , x_n)=f(x_1)f(x_2) \cdots f(x_n) f(x1,x2,,xn)=f(x1)f(x2)f(xn)
  • 总体 X X X分布函数 F ( x ) F(x) F(x)
    • 样本 ( X 1 , X 2 , ⋯   , X n ) (X_1, X_2, \cdots , X_n) (X1,X2,,Xn) 的分布函数:
      F ( x 1 , x 2 , ⋯   , x n ) = F ( x 1 ) F ( x 2 ) ⋯ F ( x n ) F(x_1, x_2, \cdots , x_n)=F(x_1)F(x_2) \cdots F(x_n) F(x1,x2,,xn)=F(x1)F(x2)F(xn)

例1: X ∼ B ( 0 , 1 ) , P ( X = k ) = p k ( 1 − p ) 1 − k , k = 0 , 1 X \sim B(0, 1), \quad P(X=k)=p^k(1-p)^{1-k}, \quad k=0, 1 XB(0,1),P(X=k)=pk(1p)1k,k=0,1


答: 样本的联合分布列为:
P ( X 1 = x 1 , X 2 = x 2 , ⋯   , X n = x n ) = p x 1 ( 1 − p ) 1 − x 1 ⋯ p x n ( 1 − p ) 1 − x n P(X_1=x_1, X_2=x_2, \cdots , X_n=x_n) =p^{x_1}(1-p)^{1-x_1} \cdots p^{x_n}(1-p)^{1-x_n} P(X1=x1,X2=x2,,Xn=xn)=px1(1p)1x1pxn(1p)1xn P ( X 1 = x 1 , X 2 = x 2 , ⋯   , X n = x n ) = p ∑ i = 1 n x i ( 1 − p ) n − ∑ i = 1 n x i P(X_1=x_1, X_2=x_2, \cdots , X_n=x_n) =p^{\sum_{i=1}^nx_i}(1-p)^{n-\sum_{i=1}^nx_i} P(X1=x1,X2=x2,,Xn=xn)=pi=1nxi(1p)ni=1nxi

例2:
X ∼ N ( μ , σ 2 ) , f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < + ∞ X \sim N(\mu , \sigma ^2), \quad f(x)=\frac{1}{\sqrt{2 \pi} \sigma}e^{-\frac{(x-\mu)^2}{2 \sigma ^2}}, \quad -\infty < x < +\infty XN(μ,σ2),f(x)=2π σ1e2σ2(xμ)2,<x<+


答: 样本的联合分布密度为:
f ( x 1 , x 2 , ⋯   , x n ) = 1 2 π σ e − ( x 1 − μ ) 2 2 σ 2 ⋯ 1 2 π σ e − ( x n − μ ) 2 2 σ 2 = 1 ( 2 π σ ) n e − 1 2 σ 2 ∑ i = 1 n ( x i − μ ) 2 f(x_1, x_2, \cdots , x_n)=\frac{1}{\sqrt{2 \pi}\sigma}e^{-\frac{(x_1-\mu)^2}{2 \sigma ^2}} \cdots \frac{1}{\sqrt{2 \pi}\sigma}e^{-\frac{(x_n-\mu)^2}{2 \sigma ^2}} = \frac{1}{(\sqrt{2 \pi}\sigma)^n}e^{-\frac{1}{2 \sigma ^2} \sum_{i=1}^n(x_i - \mu)^2} f(x1,x2,,xn)=2π σ1e2σ2(x1μ)22π σ1e2σ2(xnμ)2=(2π σ)n1e2σ21i=1n(xiμ)2

1.4 统计量

概念: ( X 1 , X 2 , ⋯   , X n ) (X_1, X_2, \cdots , X_n) (X1,X2,,Xn) 为总体 X X X 的样本, T = T ( X 1 , X 2 , ⋯   , X n ) T = T(X_1, X_2, \cdots , X_n) T=T(X1,X2,,Xn) 是样本函数,且不含任何未知参数,称 T T T 为统计量。

1.4.1 常用统计量

  • 样本均数:
    X ˉ = 1 n ∑ i − 1 n X i ⟹ E ( X ) = ∑ i − 1 n x i p i \bar{X}=\frac{1}{n}\sum_{i-1}^nX_i \quad \Longrightarrow \quad E(X)=\sum_{i-1}^nx_ip_i Xˉ=n1i1nXiE(X)=i1nxipi
  • 样本k阶矩:
    A k = 1 n ∑ i = 1 n X i k ⟹ E ( X k ) = ∑ i = 1 n x i k p i A_k=\frac{1}{n}\sum_{i=1}^nX_i^k \quad \Longrightarrow \quad E(X^k)=\sum_{i=1}^nx_i^kp_i Ak=n1i=1nXikE(Xk)=i=1nxikpi
  • 样本中心矩:
    B k = 1 n ∑ i = 1 n ( X i − X ˉ n ) k ⟹ E { X − E ( X ) } k B_k=\frac{1}{n}\sum_{i=1}^n(X_i - \bar{X}_n)^k \quad \Longrightarrow \quad E\{ X-E(X)\}^k Bk=n1i=1n(XiXˉn)kE{XE(X)}k
  • 样本方差:
    S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ n ) 2 ⟹ D X = E { X − E ( X ) } 2 S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i - \bar{X}_n)^2 \quad \Longrightarrow \quad DX=E\{X-E(X)\}^2 S2=n11i=1n(XiXˉn)2DX=E{XE(X)}2
    样本标准差:
    S = 1 n − 1 ∑ i = 1 n ( X i − X ˉ n ) 2 ⟹ D X S=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i - \bar{X}_n)^2} \quad \Longrightarrow \quad \sqrt{DX} S=n11i=1n(XiXˉn)2 DX
  • 样本相关系数:
    R = ∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) ∑ i = 1 n ( X i − X ˉ ) 2 ∑ i = 1 n ( Y i − Y ˉ ) 2 ⟹ ρ X Y R=\frac{\sum_{i=1}^n(X_i - \bar{X})(Y_i - \bar{Y})}{\sqrt{\sum_{i=1}^n(X_i-\bar{X})^2 \sum_{i=1}^n(Y_i-\bar{Y})^2}} \quad \Longrightarrow \quad \rho_{XY} R=i=1n(XiXˉ)2i=1n(YiYˉ)2 i=1n(XiXˉ)(YiYˉ)ρXY ρ X Y = E ( X − E X ) ( Y − E Y ) E ( X − E X ) 2 E ( Y − E Y ) 2 \rho_{XY}=\frac{E(X-EX)(Y-EY)}{\sqrt{E(X-EX)^2E(Y-EY)^2}} ρXY=E(XEX)2E(YEY)2 E(XEX)(YEY)
  • 顺序统计量: 详见1.4.2
  • 经验分布函数: 详见1.4.3

1.4.2 顺序统计量【重点】

( X 1 , X 2 , ⋯   , X n ) ⟹ ( X ( 1 ) , X ( 2 ) , ⋯   , X ( n ) ) (X_1, X_2, \cdots , X_n) \quad \Longrightarrow \quad (X_{(1)}, X_{(2)}, \cdots , X_{(n)}) (X1,X2,,Xn)(X(1),X(2),,X(n))

  • i i i 个顺序统计量密度:
    f ( i ) ( x ) = n ! ( i − 1 ) ! ( n − i ) ! F i − 1 ( x ) f ( x ) { 1 − F ( x ) } n − i f_{(i)}(x)=\frac{n!}{(i-1)!(n-i)!}F^{i-1}(x)f(x)\{ 1-F(x) \} ^{n-i} f(i)(x)=(i1)!(ni)!n!Fi1(x)f(x){1F(x)}ni
  • i , j i,j i,j 个顺统联合分布:
    f ( i ) ( j ) ( x , y ) = n ! ( i − 1 ) ! ( j − i − 1 ) ! ( n − j ) ! F i − 1 ( x ) f ( x ) { F ( y ) − F ( x ) } j − i − 1 f ( y ) { 1 − F ( y ) } n − j ( x < y ) f_{(i)(j)}(x, y)=\frac{n!}{(i-1)!(j-i-1)!(n-j)!}F^{i-1}(x)f(x)\{ F(y)-F(x) \} ^{j-i-1} f(y) \{ 1-F(y) \} ^{n-j} \qquad (xf(i)(j)(x,y)=(i1)!(ji1)!(nj)!n!Fi1(x)f(x){F(y)F(x)}ji1f(y){1F(y)}nj(x<y)
  • n n n 个顺统联合分布:
    f 1 ⋯ n ( x 1 , ⋯   , x n ) = n ! f ( x 1 ) ⋯ f ( x n ) , ( x 1 < ⋯ < x n ) f_{1 \cdots n}(x_1, \cdots , x_n)=n! f(x_1) \cdots f(x_n), \qquad (x_1 < \cdots < x_n) f1n(x1,,xn)=n!f(x1)f(xn),(x1<<xn)

1.4.3 经验分布函数

总体分布 F ( x ) F(x) F(x) 未知, X ( 1 ) , X ( 2 ) , ⋯   , X ( n ) X_{(1)}, X_{(2)}, \cdots , X_{(n)} X(1),X(2),,X(n) 为样本顺序统计量,当固定一组样本值 x ( 1 ) , x ( 2 ) , ⋯   , x ( n ) x_{(1)}, x_{(2)}, \cdots , x_{(n)} x(1),x(2),,x(n),则称如下函数为总体 X X X 的经验分布函数:
F n ( x ) = { 0 , x < x ( 1 ) k n , x ( k ) ≤ x < x ( k + 1 ) 1 , x ≥ x ( n ) F_n(x)=\begin{cases}0, \qquad xFn(x)= 0,x<x(1)nk,x(k)x<x(k+1)1,xx(n)

例5:
已知总体 X ∼ B ( 4 , 0.1 ) X\sim B(4, 0.1) XB(4,0.1) 的10个样本值: ( 0 , 1 , 0 , 3 , 0 , 2 , 0 , 4 , 0 , 1 ) (0, 1, 0, 3, 0, 2, 0, 4, 0, 1) (0,1,0,3,0,2,0,4,0,1),求其经验分布函数


答:
该样本的顺序统计量为: ( 0 , 0 , 0 , 0 , 0 , 1 , 1 , 2 , 3 , 4 ) (0, 0, 0, 0, 0, 1, 1, 2, 3, 4) (0,0,0,0,0,1,1,2,3,4)
各样本值出现的概率为:
[ 0 1 2 3 4 5 10 2 10 1 10 1 10 1 10 ] \begin{bmatrix}0 & 1 & 2 & 3 & 4 \\ \frac{5}{10} & \frac{2}{10} & \frac{1}{10} & \frac{1}{10} & \frac{1}{10}\end{bmatrix} [01051102210131014101]
故,
F n ( x ) = { 0 x < 0 5 10 0 ≤ x < 1 7 10 1 ≤ x < 2 8 10 2 ≤ x < 3 9 10 3 ≤ x < 4 1 x ≥ 4 F_n(x)=\begin{cases}0 \qquad x<0 \\ \frac{5}{10} \qquad 0 \leq x<1 \\ \frac{7}{10} \qquad 1 \leq x<2 \\ \frac{8}{10} \qquad 2 \leq x<3 \\ \frac{9}{10} \qquad 3 \leq x<4 \\ 1 \qquad x \geq 4 \end{cases} Fn(x)= 0x<01050x<11071x<21082x<31093x<41x4
显然 F n ( − ∞ ) = 0 , F n ( + ∞ ) = 1 , 0 ≤ F n ( x ) ≤ 1 F_n(-\infty)=0, \quad F_n(+\infty)=1, \quad 0 \leq F_n(x) \leq 1 Fn()=0,Fn(+)=1,0Fn(x)1,且 F n ( x ) F_n(x) Fn(x) 是右连续单调不减函数,满足分布函数的性质,称 F n ( x ) F_n(x) Fn(x) 为经验(样本)分布函数。

1.4.4 充分统计量(统计量的性质)

  • 定义: 总体分布函数为 F ( x ; θ ) F(x; \theta) F(x;θ),设 X 1 , X 2 , ⋯   , X n X_1, X_2, \cdots , X_n X1,X2,,Xn 是来自总体的样本, T = T ( x ) T=T(x) T=T(x) 是统计量,若在给定了 T T T 的取值后, X 1 , X 2 , ⋯   , X n X_1, X_2, \cdots , X_n X1,X2,,Xn 的条件分布与参数 θ \theta θ 无关,则统计量 T = T ( x ) T=T(x) T=T(x) 称为 θ \theta θ 的充分统计量。
    P ( X 1 = x 1 , X 2 = x 2 , ⋯   , X n = x n ∣ T = t ) = P ( X 1 = x 1 , X 2 = x 2 , ⋯   , X n = x n , T = t ) P ( T = t ) P(X_1=x_1, X_2=x_2, \cdots , X_n=x_n | T=t)= \frac{P(X_1=x_1, X_2=x_2, \cdots , X_n=x_n , T=t)}{P(T=t)} P(X1=x1,X2=x2,,Xn=xnT=t)=P(T=t)P(X1=x1,X2=x2,,Xn=xn,T=t)本来样本的联合分布与 θ \theta θ 有关,除掉 T T T 的因素后与 θ \theta θ 无关。说明所有 θ \theta θ 的信息都包含在统计量 T = T ( x ) T=T(x) T=T(x) 内。称为充分统计量。

例6:
设总体 X ∼ B ( 1 , p ) X\sim B(1, p) XB(1,p),设 X 1 , X 2 , ⋯   , X n X_1, X_2, \cdots , X_n X1,X2,,Xn 是样本,样本值 x 1 , x 2 , ⋯   , x n x_1, x_2, \cdots , x_n x1,x2,,xn,证明统计量 T ( X 1 , X 2 , ⋯   , X n ) = ∑ i = 1 n X i T(X_1, X_2, \cdots , X_n)=\sum_{i=1}^nX_i T(X1,X2,,Xn)=i=1nXi 是参数 p p p 的充分统计量。


证明:
显然 T ( X 1 , X 2 , ⋯   , X n ) = ∑ i = 1 n X i ∼ B ( n , p ) T(X_1, X_2, \cdots , X_n)=\sum_{i=1}^nX_i \sim B(n,p) T(X1,X2,,Xn)=i=1nXiB(n,p)
P ( X 1 = x 1 , X 2 = x 2 , ⋯   , X n = x n ∣ ∑ i = 1 n X i = t ) = P ( X 1 = x 1 , X 2 = x 2 , ⋯   , X n = x n , ∑ i = 1 n X i = t ) P ( ∑ i = 1 n X i = t ) = p x 1 ( 1 − p ) 1 − x 1 p x 2 ( 1 − p ) 1 − x 2 ⋯ p x n ( 1 − p ) 1 − x n C n t p t ( 1 − p ) n − t = p ∑ i = 1 n X i    ( 1 − p ) n − ∑ i = 1 n X i C n t p t ( 1 − p ) n − t = p t ( 1 − p ) n − t C n t p t ( 1 − p ) n − t = 1 C n t ( 与 p 无关 ) \begin{aligned}P(X_1=x_1, X_2&=x_2, \cdots , X_n=x_n | \sum_{i=1}^nX_i=t) \\ &=\frac{P(X_1=x_1, X_2=x_2, \cdots , X_n=x_n , \sum_{i=1}^nX_i=t)}{P(\sum_{i=1}^nX_i=t)} \\ &=\frac{p^{x_1}(1-p)^{1-x_1}p^{x_2}(1-p)^{1-x_2} \cdots p^{x_n}(1-p)^{1-x_n}}{C_n^tp^t(1-p)^{n-t}} \\ &=\frac{p^{\sum_{i=1}^nX_i} \; (1-p)^{n-\sum_{i=1}^nX_i}}{C_n^tp^t(1-p)^{n-t}} \\ &=\frac{p^t(1-p)^{n-t}}{C_n^tp^t(1-p)^{n-t}} \\ &=\frac{1}{C_n^t} \quad (与p无关)\end{aligned} P(X1=x1,X2=x2,,Xn=xni=1nXi=t)=P(i=1nXi=t)P(X1=x1,X2=x2,,Xn=xn,i=1nXi=t)=Cntpt(1p)ntpx1(1p)1x1px2(1p)1x2pxn(1p)1xn=Cntpt(1p)ntpi=1nXi(1p)ni=1nXi=Cntpt(1p)ntpt(1p)nt=Cnt1(p无关) 因此,统计量 T ( X 1 , X 2 , ⋯   , X n ) = ∑ i = 1 n X i T(X_1, X_2, \cdots , X_n)=\sum_{i=1}^nX_i T(X1,X2,,Xn)=i=1nXi 是参数 p p p 的充分统计量。

  • 因子分解定理: 设总体 X X X 的概率函数为 p ( x ; θ ) p(x; \theta) p(x;θ),样本 X 1 , X 2 , ⋯   , X n X_1, X_2, \cdots , X_n X1,X2,,Xn 的统计量 T = T ( x ) T=T(x) T=T(x) θ \theta θ 的充分统计量的充要条件是:
    对任意的 θ \theta θ,存在两个函数 g ( t , θ ) g(t, \theta) g(t,θ) h ( X 1 , X 2 , ⋯   , X n ) h(X_1, X_2, \cdots , X_n) h(X1,X2,,Xn),有:
    p ( x 1 , x 2 , ⋯   , x n , θ ) = g { T ( x 1 , x 2 , ⋯   , x n ) , θ } h ( x 1 , x 2 , ⋯   , x n ) p(x_1, x_2, \cdots , x_n, \theta)=g\{ T(x_1, x_2, \cdots , x_n), \theta \} h(x_1, x_2, \cdots , x_n) p(x1,x2,,xn,θ)=g{T(x1,x2,,xn),θ}h(x1,x2,,xn)

例10:
设总体 X ∼ N ( μ , σ 2 ) ,    θ = ( μ , σ 2 ) X \sim N(\mu, \sigma^2), \; \theta=(\mu, \sigma^2) XN(μ,σ2),θ=(μ,σ2),证 T = ( ∑ i = 1 n x i , ∑ i = 1 n x i 2 ) T=(\sum_{i=1}^nx_i,\sum_{i=1}^nx_i^2) T=(i=1nxi,i=1nxi2) θ \theta θ 的充分统计量


证明:
X 1 , X 2 , ⋯   , X n X_1, X_2, \cdots , X_n X1,X2,,Xn为样本,联合密度为:
f ( x 1 , x 2 , ⋯   , x n ) = ( 1 2 π σ ) n e − 1 2 σ 2 ∑ i = 1 n ( x i − μ ) 2 = ( 1 2 π σ ) n e − 1 2 σ 2 { ∑ i = 1 n x i 2 − 2 μ ∑ i = 1 n x i + n μ 2 } = ( 1 2 π σ ) n e − n μ 2 2 σ 2 e − 1 2 σ 2 { ∑ i = 1 n x i 2 − 2 μ ∑ i = 1 n x i } \begin{aligned}f(x_1, x_2, \cdots, x_n)&=(\frac{1}{\sqrt{2 \pi}\sigma})^ne^{-\frac{1}{2\sigma^2}\sum_{i=1}^n(x_i-\mu)^2} \\ &=(\frac{1}{\sqrt{2 \pi}\sigma})^ne^{-\frac{1}{2\sigma^2}\{ \sum_{i=1}^nx_i^2 - 2\mu \sum_{i=1}^nx_i + n\mu^2 \}} \\ &=(\frac{1}{\sqrt{2 \pi}\sigma})^ne^{-\frac{n\mu^2}{2\sigma^2}}e^{-\frac{1}{2\sigma^2}\{ \sum_{i=1}^nx_i^2-2\mu \sum_{i=1}^n x_i \}}\end{aligned} f(x1,x2,,xn)=(2π σ1)ne2σ21i=1n(xiμ)2=(2π σ1)ne2σ21{i=1nxi22μi=1nxi+nμ2}=(2π σ1)ne2σ2nμ2e2σ21{i=1nxi22μi=1nxi} g ( t 1 , t 2 , θ ) = ( 1 2 π σ ) n e − n μ 2 2 σ 2 e − 1 2 σ 2 { t 2 − 2 μ t 1 } , h ( x 1 , x 2 , ⋯   , x n ) = 1 g(t_1, t_2, \theta)=(\frac{1}{\sqrt{2 \pi}\sigma})^ne^{-\frac{n\mu^2}{2\sigma^2}}e^{-\frac{1}{2\sigma^2}\{ t_2 - 2\mu t_1 \}}, \qquad h(x_1, x_2, \cdots, x_n)=1 g(t1,t2,θ)=(2π σ1)ne2σ2nμ2e2σ21{t22μt1},h(x1,x2,,xn)=1
T = ( ∑ i = 1 n x i , ∑ i = 1 n x i 2 ) T=(\sum_{i=1}^nx_i,\sum_{i=1}^nx_i^2) T=(i=1nxi,i=1nxi2) θ = ( μ , σ 2 ) \theta=(\mu,\sigma^2) θ=(μ,σ2) 的充分统计量

  • 由因子分解定理可以有如下结论:
    T = T ( X 1 , X 2 , ⋯   , X n ) T=T(X_1, X_2, \cdots , X_n) T=T(X1,X2,,Xn) θ \theta θ 的一个充分统计量,若 W ( t ) W(t) W(t) 是单值可逆函数,则 W ( t ) W(t) W(t) 也是 θ \theta θ 的一个充分统计量。
    例如上例10中, T = ( ∑ i = 1 n x i , ∑ i = 1 n x i 2 ) T=(\sum_{i=1}^nx_i,\sum_{i=1}^nx_i^2) T=(i=1nxi,i=1nxi2) θ = ( μ , σ 2 ) \theta=(\mu,\sigma^2) θ=(μ,σ2) 的充分统计量可推导出:
    ⟹ \Longrightarrow T = ( X ˉ , S 2 ) T=(\bar{X}, S^2) T=(Xˉ,S2) 也是 θ = ( μ , σ 2 ) \theta=(\mu,\sigma^2) θ=(μ,σ2) 的充分统计量

下一篇:统计量的分布、正态总体的抽样分布

你可能感兴趣的:(#,数理统计,专业与数学基础,概率论,学习,算法)