本文摘自《概率论与数理统计》 陈希孺著 中国科学技术大学出版社
相关链接
参数的点估计问题
极大似然估计
矩估计法是点估计方法的一种,点估计法还有极大似然估计法和贝叶斯估计法。详情请参考上面的链接。
矩估计法是皮尔逊在19世纪末到20世纪初的一系列文章中引进的。这个方法的思想很简单:设总体分布为 f(x;θ1,⋯,θk) ,则它的矩(原点矩和中心矩都可以,此处以原点矩为例)
连续型:
离散型:
依赖于 θ1,⋯,θk 。另一方面,至少在样本 n 较大时, αm 又应接近于样本原点矩 am 。于是
取 m=1,⋯,k ,并将上面的近似式改成等式,就得到一个方程组:
解此方程组,得其根 θi^=θi^(X1,⋯,Xn) (i=1,⋯,k) ,就以 θi^ 作为 θi 的估计 (i=1,⋯,k) 。如果要估计的是 θ1,⋯,θk 的某个函数 g(θ1,⋯,θk) ,则用 ĝ (X1,⋯,Xn)=g(θ1^,⋯,θk^) 去估计它。这样定出的估计量就叫矩估计。
设 X1,⋯,Xn 是从正态总体 N(μ,σ2) 中抽出的样本,要估计 μ 和 σ2 。 μ 是总体的一阶原点矩,按矩估计,用样本的一阶原点矩即样本的均值 X⎯⎯⎯ 去估计。 σ2 是总体方差,即总体的二阶中心距,可用样本的二阶的二阶中心矩 m2 去估计。一般地,在估计方差时候常用样本方差 S2 而不用 m2 ,即对矩估计做了一定的修正。
如果要估计的是标准差 σ2 ,则由 σ=σ2‾‾‾√ ,按矩估计法,它可以用 m2‾‾‾√ 去估计,一般用 S2‾‾‾√=S 去估计,或者还做点修正。又当 μ≠0 时,(特别在 μ>0 时,在有些问题中, μ 虽然未知,但事先可知道 μ>0 。比如某个班级的平均成绩,它必然会大于0,因为没有人会考负分,全班也不太可能考0分), σ/μ 称为总体的变异系数,变异系数是以均值为单位去衡量总体的标准差。在有些问题中,反映变异程度的标准差意义如何,要看总体均值 μ 而定。比如一大群人收入的标准差为50元,若其平均工资只有70元,则这个变异系数可算很大了;但若平均工资为850元,则这个变异程度就不算大了。所以,变异系数 σ/μ 不过是一定意义上的“相对误差”,按矩估计法,为估计 σ/μ 可用 m2‾‾‾√/X⎯⎯⎯ ,一般用 S/X⎯⎯⎯ 。
设 X1,⋯,Xn 是从指数分布总体中抽出的样本,要估计参数 λ 的倒数 1λ 。根据指数分布的特点,我们知道 1λ 就是总体分布的均值,故按矩估计法,就用 X⎯⎯⎯ 去估计。如要估计的是参数 λ 本身,就用 1X⎯⎯ 去估计。
另一方面,指数分布的方差为 1λ2 ,即 1λ=总体二阶中心矩‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾√ 。按矩估计法, 1λ 也可以用 m2‾‾‾√ (或 S )去估计。
设 X1,⋯,Xn 是从区间 [θ1,θ2] 上均匀分布的总体中抽出的样本,要估计 θ1,θ2 。
我们知道,均匀分布的均值、方差分别是 (θ1+θ2)2 和 (θ2−θ1)212 。因此,按矩估计法,建立方程
得出 θ1,θ2 的解分别为
也可以用 S 代替 m2‾‾‾√
设总体有二项分布 B(N,p) , X1,⋯,Xn 为从该总体中抽出的样本,要估计 p ,矩估计为 X⎯⎯⎯/N 。
我们知道,
根据上面的式子,我们可以得到 p=X⎯⎯⎯/N ,当然也可用 m2 来求。
设总体有泊松分布 P(λ),X1,⋯,Xn 为从该总体中抽出的样本,要估计 λ 。
由于 λ 是总体分布的均值,按矩估计法,可用样本均值 X⎯⎯⎯ 去估计;另一方面, λ 也是总体分布的方差,故按矩估计法,也可以用 m2 或 S2 去估计。在这里,用均值 X⎯⎯⎯ 为优。在一般的情况下,能用低阶矩处理的就不用高阶矩。