统计学-R语言-5.3

文章目录

  • 前言
  • 分位数
  • 统计量的标准误
  • 总结


前言

本篇文章即为概率与分布的最后一篇文章。


分位数

分位数函数是累积分布函数的反函数。
p-分位数是具有这样性质的一个值:小于或等于它的概率为p。
根据定义,中位数即50%分位数。
分位数通常用于置信区间的计算,以及与设计试验有关的势函数的计算。
下面给出一个置信区间计算的简单例子:如果= 12,测量了n=5个观测值,得到均值,通过相关的分位数得到的一个置信度为95%的置信区间:

xbar=83
sigma=12
n=5
sem=sigma/sqrt(n) #标准误
sem

[1] 5.366563

xbar+sem*qnorm(0.025)

[1] 72.48173

xbar+sem*qnorm(0.975)

[1] 93.51827

qnorm():输入的是小于或等于这个分位数的概率为p,区间为0—1,输出的是z-score(分位数)
统计学-R语言-5.3_第1张图片
由于标准正态分布的对称性,统计学-R语言-5.3_第2张图片
通常把置信度为95%的置的置信区间写成统计学-R语言-5.3_第3张图片

统计量的标准误

统计量的抽样分布的标准差,简称标准误差
衡量统计量的离散程度
在参数估计与假设检验中,用于衡量样本统计量估计总体参数的精确程度
样本均值和样本比例的标准误分别为
统计学-R语言-5.3_第4张图片
当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误(在统计软件中得到的都是估计标准误)
以样本均值为例:当总体标准差未知时,可用样本标准差s代替,则在重复抽样条件下,样本均值的估计标准误为
统计学-R语言-5.3_第5张图片
标准误与前面讲的标准差是两个不同的概念。标准差是根据原始观测值计算,反映一组原始数据的离散程度。而标准误是根据样本统计量计算的,反映统计量的离散程度的。


总结

统计学-R语言-5.3_第6张图片

你可能感兴趣的:(r语言,开发语言)