描述性统计学

计量尺度

定类尺度:数据表现为类别,各类数据等级无次序之分

定序尺度:数据按某种特性排序,如,优、良、差等

定距尺度:可以比较大小,两个值的差有实际意义;“0”是只是尺度上的一个点,不代表“不存在”;如,温度、年龄

定比尺度:有绝对0点,“0”表示“没有”或“不存在”,例如,体重、身高。

描述集中程度

反映数据中心点的位置

平均数:反映数据的平均水平,受极值影响

中位数:数据根据排序,位于中间的数值

众数:重复数据最多的数,不唯一

离中程度(cv)

极差:最大值-最小值

四分距:反映中间50%的数据的离散程度,数据越小表示越集中

方差和标准差: 反映数据的离散程度

   【 标准差:度量了偏离平均数的大小;根据统计得出68%的数落在一个标准差之间,95%的数落在两个标准差之间,99%落在三个标准差之间】

离散系数:   标准差/平均数;使用情况:当需要比较两组数据的离散程度大小的时候,如果两组数据的测量尺度相差太大,或者均值不同,直接使用标准差进行比较不太合适,此时就可以使用cv来衡量离散程度。

分布形态

偏态:数据的不对称性称为偏态;偏态系数(sk)是对数据的不对称性(偏斜程度)的测量

测量公式:



峰度:数据分布的扁平或尖峰程度;峰度系数(K):数据分布峰度的度量值,对数据分布尖峰或扁平程度的测量。

公式:



不同的数据类型使用的统计图

定型数据:条形图;饼图

定量数据:线图;直方图;箱图;茎叶图

条形图:用宽度相同的条形高度或长短来表示数据变动的图形,条形的排列可以横排,也可以纵排。条形图有单式、复式等形式。


饼图:它是用圆形及圆内扇形的面积来表示数值大小的图形。主要用于总体内部的结构,各组成部分所占比例等。

线性图:利用线形的升降起伏来表现描述的变量在一段时期内的变动情况,主要用于显示时间数列的数据。

直方图:• 用来反映定量变量的分布状况。在统计分组的基础上,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图。

• 注意对不等距分组:纵轴必须表示为频数密度。– 频数密度=频数/组距(面积之和=总频数)

你可能感兴趣的:(描述性统计学)