统计所研究的对象是受随机因素影响的数据,是以概率论为基础的一门应用学科。统计推断的基础是描述性统计,也就是搜集整理加工分析统计数据,使其系统化和条理化,以显示出数据资料的趋势、特征和数量关系的过程。
掌握 参数估计 和 假设检验 这两个数理统计的最基本方法,方能有效地对数据进行描述和分析。
参数估计包括 点估计 和 区间估计.
点估计是使用单个数值作为参数的一种估计方式。点估计在抽样推断中 不考虑抽样误差 ,直接以抽样指标代替全体指标。因为个别样本的抽样指标不等于全体指标,因此用抽样指标直接代替全体指标不可避免的会有误差。目前使用较多的点估计方法是最大似然法和矩法。
最大似然法是在待估参数的可能取值范围内,挑选使似然函数值最大的参数值作为最大似然估计量。
最大似然估计法得到的估计量通常不仅仅满足无偏性、有效性等基本条件,还能保证其为充分统计量,因此一般建议在点估计和区间估计中使用最大似然法。
M A T L A B MATLAB MATLAB 使用函数 mle
进行最大似然估计:
phat = mle('dist',data)
使用 d a t a data data 向量中的样本数据,返回 d i s t dist dist 指定的分布的最大似然估计。
矩估计,就是利用样本矩来估计总体中相应的参数的方法。我们首先推导涉及感兴趣的参数的总体矩(即所考虑的随机变量的幂的期望值)的方程。然后取出一个样本并从这个样本估计总体矩。接着使用样本矩取代(未知的)总体矩,解出感兴趣的参数。从而得到那些参数的估计。
待估参数通常作为总体原点矩或原点矩的函数,此时可以用该总体样本的原点矩或样本原点矩的函数值作为待估参数的估计,称这种方法为矩法。
例如:样本均值总是总体均值的矩估计量、样本方差是总体方差的矩估计量,样本标准差是总体标准差的矩估计量。
M A T L A B MATLAB MATLAB 中计算矩的函数为 moment(X,order)
.
区间估计是在点估计的基础上,通过给出总体参数估计的一个区间范围(该区间通常由样本统计量加减估计误差得到)从而减少误差的估计方法。
求参数的区间估计,首先需要求出该参数的点估计,随后构造一个含有该参数的随机量,并根据一定的置信水平求该估计值的范围。
在 M A T L A B MATLAB MATLAB 中使用 mle
函数进行最大似然估计时,有如下几种调用格式:
1. [phat,pci] = mle('dist',data)
2. [phat,pci] = mle('dist',data,alpha)
3. [phat,pci] = mle('dist',data,alpha,p1)
- 返回最大似然估计和 95 % 95\% 95% 置信区间。
- 返回指定分布的最大似然估计值和 100 ( 1 − a l p h a ) % 100(1-alpha)\% 100(1−alpha)% 置信区间。
- 该形式只用于二项分布,其中 p 1 p1 p1 为试验次数。
在总体分布函数完全或部分未知时,为推断总体的某些性质,我们需要提出关于总体的假设。为了确定所提出的假设是否合理,我们还需要对其进行检验。
在给定方差的条件下,我们可以使用 ztest
函数检验单样本数据是否服从给定均值的正态分布。
1. h = ztest(x,m,sigma)
2. h = ztest(x,m,sigma,alpha)
3. [h,sig,ci,zval] = ztest(x,m,sigma,alpha,tail)
- 在 0.05 0.05 0.05 的显著性水平下进行 z z z 检验,以确定服从正态分布的样本均值是否为 m m m,其中 s i g m a sigma sigma 为标准差。
- 给出显著性水平的控制参数 a l p h a alpha alpha. 若 a l p h a = 0.01 alpha = 0.01 alpha=0.01,则当结果为 h = 1 h = 1 h=1 时,可在 0.01 0.01 0.01 的显著性水平上拒绝零假设;若 h = 0 h = 0 h=0,则不能在该水平上拒绝零假设。
- 允许指定是进行单侧检验还是进行双侧检验。
t a i l = 0 tail = 0 tail=0 或 ′ b o t h ′ 'both' ′both′ 时表示指定备择假设均值不等于 m m m;
t a i l = 1 tail = 1 tail=1 或 ′ r i g h t ′ 'right' ′right′ 时表示指定备择假设均值大于 m m m;
t a i l = − 1 tail = -1 tail=−1 或 ′ l e f t ′ 'left' ′left′ 时表示指定备择假设均值小于 m m m。
c i ci ci 为均值真值的 1 − a l p h a 1-alpha 1−alpha 置信区间, z v a l zval zval 是统计量 z = x ‾ − m σ / n z = \frac{\overline{x}-m}{\sigma / \sqrt{n}} z=σ/nx−m 的值。
在数理统计中,正态总体均值检测包括方差未知时单个正态总体均值的假设检验和两个正态总体均值的假设检验。
ttest
进行样本均值的 t t t 检验。 1. h = ttest(x,m)
2. h = ttest(x,m,alpha)
3. [h,sig,ci] = ttest(x,m,alpha,tail)
- 在 0.05 0.05 0.05 的显著性水平下进行 t t t 检验,以确定在标准差未知的情况下取自正态分布的样本均值是否为 m m m .
- 给定显著性水平的控制参数 a l p h a alpha alpha.
- 指定是进行单侧检验还是进行双侧检验.
ttest2
函数对两个样本的均值差异进行 t t t 检验:1. h = ttest2(xy)
2. [h,significance,ci] = ttest2(x,y,alpha)
3. ttest2 = (x,y,alpha,tail)
- 假设 x x x 和 y y y 是取自服从正态分布的两个样本,在它们标准差未知但相等时检验它们的均值是否相等。当 h = 1 h = 1 h=1 时,可在 0.05 0.05 0.05 的水平下拒绝零假设; h = 0 h = 0 h=0 时,不能在该水平下拒绝零假设.
- 给定显著性水平的控制参数 a l p h a alpha alpha.
- 允许指定进行单侧检验或双侧检验。