第六讲 数据整理(描述统计分析)

一,属性标志的频数分布:


运用EXCEL数据透视表(数据→数据透视表)、countif(range,criteria)函数、IF函数、AND函数、OR函数。

(略)



二,数量标志的频数分布:


第一步:用EXCEL排序(数据→排序)。

第二步:分组。

原则:较好地显示观察值分配的真相,归纳原始数据的分布特征。

1用公式确定组数:

组数(K)=1+3.322log(n) 或(K)=1+lg(n)/lg(2)

注:n=总频数

2用开平方确定组数:

组数(K)=√n(n开根号)

n=总频数

3查表确定组数:(此方法可靠性较低,不精确)

4也可根据实际需要采取不等距分组。如:根据数据的性质不同分组;根据数据的疏密程度分组(特别是有极端值存在时),密集处用较短组距,疏散处用较长组距。

第三步:组距(C)=全距(R)/组数(K)=(上限—下限)/组数(K)

原则:组距的大小最好是测量值最小单位的整数倍。

第四步:第一组的下组界=测量值的最小值—测定值最小单位/2

第一组的上组界(第二组的下组界)=第一组的下组界+组距(C)

依次类推。

第五步:各组中心值=(该组上组界+该组下组界)/2

注:对开口组求组中值时,假定开口组的组距与相邻的组距相同,确定出该组的上限或下限,从而求得。

第六步:用EXCEL编制频数分配表。

1利用直方图(工具→数据分析→直方图)。

如果工具中没有数据分析,可以进行加载:工具→加载宏→分析工具库。

(略)

2用频数函数=frequency(待分组的数据区域,组上限区域)。

(略)



三,统计表:


1,合理安排统计表结构

2,总标题应满足3W(Why?What?Where?)要求。

3,数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明。

4,表中的上下两条横线一般用粗线,其他线用细线。

5,通常情况下,统计表的左右两边不封口。

6,表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。

7,对于没有数值的表格单元,一般用“—”表示。

8,必要时可在表的下方加上注释。




四,统计图(重点):


Excel:插入→图表。

注意:图中的尺度和坐标只有反映了数据的全貌(从头到脚),才能给人正确的直观印象,从而得出正确的结论。

(略)

你可能感兴趣的:(第六讲 数据整理(描述统计分析))