SPSS——连续变量的参数估计

连续变量的描述统计与参数估计

根据样本数据对总体的客观规律性做出合理的估计就是统计推断,其中又分为参数估计和假设检验两大类。

正态分布特征:

  1. 是一条对称曲线,关于均数对称。均数被称为正态分布的位置参数
  2. 单峰,均值出最高
  3. 标准差决定线峰的矮阔与尖峭,标准差越大,个体差异越大,线峰越矮阔。
  4. 向左右延申,横轴为渐近线。
  5. 一个标准差范围下曲线面积为68%
  6. 约95%的个体取值与平均数的距离在1.96个标准差之内
  7. 99%个体取值与平均数的距离在2.58个标准差之内

如何确认数据实际上是否符合正态分布,通过P-P图和非参数检验来判定,常用的指标是偏度和峰度。

偏度指分布不对称的方向和程度。常见的有矩阵法、分位数法、Pearson规则等。正偏,长尾在右;负偏,长尾在左。

峰度指分布图形的尖峭程度和峰凸程度。高峰度,比正态分布还要陡峭;低峰度,比正态分布的峰要平缓。

参数的点估计:矩法、极大似然估计法、稳健估计值

参数的区间估计:标准误越大,说明相应参数的点估计值不可信;

分类变量的描述统计与参数估计

频数分布情况描述;集中趋势描述;使用相对数进行描述

二项分布的参数估计、多项分布、超几何分布、Poisson分布、

 

 

你可能感兴趣的:(Python数据分析)