数理统计复习笔记二——充分统计量

一、背景

统计量的引入是为了简化样本的繁杂,但所使用的统计量是否把样本中关于感兴趣问题的信息全部吸收进来了?这就引出充分统计量的概念。它是Fisher正式提出的,其思想源于他和Eddington关于估计标准差的争论。

二、定义

对于某分布族 F = { F θ ( x ) : θ ∈ Θ } \mathcal F=\{F_\theta(x):\theta\in\Theta\} F={Fθ(x):θΘ} ∀ F ∈ F \forall F\in\mathcal F FF,设 X 1 , ⋯   , X n X_1, \cdots, X_n X1,,Xn是来自 F F F的样本, T = T ( X 1 , ⋯   , X n ) T=T(X_1, \cdots, X_n) T=T(X1,,Xn)是一统计量,如在给定 T = t T=t T=t下,样本 ( X 1 , ⋯   , X n ) (X_1, \cdots, X_n) (X1,,Xn)的条件概率分布与总体分布 F F F或参数 θ \theta θ无关,则称统计量 T T T是此分布族 F \mathcal F F充分统计量,也称统计量 T T T是参数 θ \theta θ的充分统计量。

  • 对于连续型随机变量,其概率分布为概率密度函数;对于离散型随机变量,其概率分布为累积分布函数
  • 充分统计量 T T T可以是向量,但不一定与参数的维度相同
  • 如果统计量 T T T是参数 θ \theta θ的充分统计量,且 S ( t ) S(t) S(t)是单值可逆的,则 S ( T ) S(T) S(T)也是 θ \theta θ的充分统计量

三、因子分解定理

对于分布族 F = { F θ ( x ) : θ ∈ Θ } \mathcal F=\{F_\theta(x):\theta\in\Theta\} F={Fθ(x):θΘ},设 X 1 , ⋯   , X n X_1, \cdots, X_n X1,,Xn是一组IID样本, T T T是一统计量,则 T T T θ \theta θ的充分统计量的充要条件是:其样本分布 f θ ( x 1 , ⋯   , x n ) f_\theta(x_1, \cdots, x_n) fθ(x1,,xn)可做如下分解: f θ ( x 1 , ⋯   , x n ) = g θ ( T ( x 1 , ⋯   , x n ) ) ⋅ h ( x 1 , ⋯   , x n ) f_\theta(x_1, \cdots, x_n)=g_\theta(T(x_1, \cdots, x_n))\cdot h(x_1, \cdots, x_n) fθ(x1,,xn)=gθ(T(x1,,xn))h(x1,,xn)
其中, h ( x ) h(\bm x) h(x)不依赖于参数 θ \theta θ

证明:

给出离散情况下的证明:
此时 f θ ( x 1 , ⋯   , x n ) = P { X 1 = x 1 , ⋯   , X n = x n } f_\theta(x_1, \cdots, x_n)=P\{X_1=x_1, \cdots,X_n=x_n\} fθ(x1,,xn)=P{X1=x1,,Xn=xn},对于给定的 t t t,定义 A ( t ) = { ( x 1 , ⋯   , x n ) : T ( x 1 , ⋯   , x n ) = t } A(t)=\{(x_1, \cdots, x_n): T(x_1, \cdots, x_n)=t\} A(t)={(x1,,xn):T(x1,,xn)=t}

⋅ \cdot 充分性:对于给定当前样本值 x \bm x x,当 x ∉ A ( t ) \bm x\notin A(t) x/A(t)时, P { X = x ∣ T = t } = 0 P\{ \bm X=\bm x|T=t\}=0 P{X=xT=t}=0与参数 θ \theta θ无关;当 x ∈ A ( t ) \bm x\in A(t) xA(t)时,有 P { X = x ∣ T = t } = P { X = x , T = t } P θ { T = t } = P { X = x } P θ { T = t } = g θ ( t ) h ( x ) ∑ y ∈ A ( t ) g θ ( t ) h ( y ) = h ( x ) ∑ y ∈ A ( t ) h ( y ) P\{ \bm X=\bm x|T=t\}=\frac{P\{ \bm X=\bm x, T=t\}}{P_\theta\{T=t\}}=\frac{P\{ \bm X=\bm x\}}{P_\theta\{T=t\}}=\frac{g_\theta(t)h(x)}{\sum\limits_{\bm y\in A(t)}g_\theta(t)h(\bm y)}=\frac{h(x)}{\sum\limits_{\bm y\in A(t)}h(\bm y)} P{X=xT=t}=Pθ{T=t}P{X=x,T=t}=Pθ{T=t}P{X=x}=yA(t)gθ(t)h(y)gθ(t)h(x)=yA(t)h(y)h(x),与参数 θ \theta θ无关
⋅ \cdot 必要性:设 T T T是充分统计量,由定义可知 P { X = x ∣ T = t } P\{ \bm X=\bm x|T=t\} P{X=xT=t}与参数 θ \theta θ无关,则它只能是 x \bm x x的函数,我们记之为 h ( x ) h(\bm x) h(x),对于给定的 t t t x ∈ A ( t ) \bm x\in A(t) xA(t),我们有 P θ { X = x } = P { X = x ∣ T = t } P θ { T ( x ) = t } = g θ ( t ) h ( x ) P_\theta\{\bm X=\bm x\}=P\{ \bm X=\bm x|T=t\}P_\theta\{T(\bm x)=t\}=g_\theta(t)h(\bm x) Pθ{X=x}=P{X=xT=t}Pθ{T(x)=t}=gθ(t)h(x)

四、例子

  1. 均匀分布 U ( 0 , θ ) U(0,\theta) U(0,θ)的充分统计量: T = max ⁡ { X 1 , ⋯   , X n } = X ( n ) T=\max\{X_1,\cdots,X_n\}=X_{(n)} T=max{X1,,Xn}=X(n)
  2. 正态分布 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2)的充分统计量: T = ( X ‾ , ∑ i = 1 n ( X i − X ‾ ) 2 ) T=(\overline X, \sum_{i=1}^n(X_i-\overline X)^2) T=(X,i=1n(XiX)2)
  3. 伯努利分布 b ( 1 , p ) b(1, p) b(1,p)的充分统计量: T 1 = ( X 1 , ⋯   , X n ) T_1=(X_1, \cdots, X_n) T1=(X1,,Xn) T 2 = ( X 1 + X 2 , ⋯   , X n ) T_2=(X_1+X_2, \cdots, X_n) T2=(X1+X2,,Xn) ⋯ ⋯ ⋯ \cdots\cdots\cdots T n = X 1 + ⋯ + X n T_n=X_1+\cdots+X_n Tn=X1++Xn
  4. 柏松分布 P ( λ ) P(\lambda) P(λ)的充分统计量: T = ∑ i = 1 n X i T=\sum_{i=1}^nX_i T=i=1nXi

你可能感兴趣的:(概率论与数理统计)