健康管理|医学统计学的基本知识(2)统计描述

数值变量资料的统计描述

频数表:相同观察结果出现的次数称为频数。将所有观察结果的评述按一定顺序排列在一起,便是频数表。

编制频数表的主要目的,一是简化数据,二是便于考察观察结果的分布特征。

频数分布图:为了更直观的反映计量资料的分布特点,可进一步绘制频数分布图,以评分组段为底,相应频数为高,作一系列密闭的矩形。

频数分布图又称直方图,它能直观的反映连续变量各种取值出现的机会。

描述集中趋势的指标:

当资料服从对称分布时,统计中常采用算术均数描述其平均水平(或集中趋势)。

中位数指一组由小到大顺序排列的观测值中,位次居中的那个观测值。

中位数具有不受两端特大或特效值影响的特点,当资料的一端或两端无确定数值时,算术均数不能计算,而中位数却可以。

几何均数是描述偏态分布资料集中趋势的另一种重要指标。

它尤其是用于描述一下两类资料的集中趋势。

1.等比资料如医学上血清抗体低度人口几何增长资料等。

2.对数正态分布资料,如正常成人血清值或某些疾病的潜伏期等。


描述离散趋势的指标

方差与标准差:是描述对称分布资料离散趋势的重要指标。方差与标准差的数值越大,说明观测值的变异度越大,即离散程度越大,此时的数据就会越分散,均数的代表性越差。

极差:也称全距(range),用符号R表示。极差是一组观察值中最大值与最小值之差用于反应观察值变异的范围大小。级差大说明变异度大。用极差描述变异度大小简单明了。

但缺点是:除最大值和最小值外,不能反映组内其他数据的变异度,因此用它来描述资料的离散趋势是粗略的;易受个别特大指特小值的影响,不够稳定。

百位分数:是一个位置指标用符号,Pₓ表示。将由小到大顺序排列的观察值分为100等份,对应于x%的观察值即为d第x百分位数,P₅₀百分位数就是中位数,所以中位数是一个特定的百分位数,百分位数常用于描述偏态分布资料在某百分位置上的水平及确定偏态分布资料医学参考值范围。

变异系数:用符号CV表示及标准差s与均数⁻⁻x⁻⁻之比用百分数表示。



分类资料的统计描述一般用频数表和相对数(包括比例和率)。

图片发自App

你可能感兴趣的:(健康管理|医学统计学的基本知识(2)统计描述)