16种常用的数据分析方法-列联分析

列联分析通常用来分析两个分类变量之间或者一个分类变量与顺序变量之间是否存在关联,关联的紧密程度如何。

 

对关联性问题的处理称为独立性检验(Test of Independence),通过交叉列联表和c2检验进行列联分析。

 

交叉列联表分为二维表与三维表两种,二维表交叉表可进行卡方检验,三维交叉表,可作Mentel-Hanszel分层分析。

 

 

列联表结构

 

2*2 列联表

 

16种常用的数据分析方法-列联分析_第1张图片

 

 

r*c 列联表

 

16种常用的数据分析方法-列联分析_第2张图片

 

 

案例

 

公司在4个不同的地区设有分公司,公司准备进行工资级别调整。采用抽样调查方式,从4个分公司共抽取420个样本 (人),了解职工对此调整的看法,交叉统计结果如下:

 

16种常用的数据分析方法-列联分析_第3张图片

 

 

观察频数分布表&百分比分布表的分布

 

列联交叉表中的统计值有两种类型:频数与百分比,对于两种类型的分布表,观察其分布时,要注意:

 

一、频数分布表

 

  1、观察边缘分布

 

行边缘分布:行观察值的合计数的分布

 

列边缘分布:列观察值的合计数的分布

 

2、观察条件分布与条件频数

 

变量 条件下变量 Y  的分布,或在变量 Y  条件下变量 X的分布

 

每个具体的观察值称为条件频数

 

16种常用的数据分析方法-列联分析_第4张图片

 

 

二、百分比分布

 

为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布

 

1、观察行百分比:行的每一个观察频数除以相应的行合计数(fijri)

2、观察列百分比:列的每一个观察频数除以相应的列合计数( fijcj )

3、观察总百分比:每一个观察值除以观察值的总个数( fij)

 

16种常用的数据分析方法-列联分析_第5张图片

 

 

交叉列联表分析步骤

 

1.【分析】—【描述统计】—【交叉表】

 

16种常用的数据分析方法-列联分析_第6张图片

 

【精确】

一般情况下,"精确检验"(Exact Tests)对话框的选项都默认为系统默认值,不作调整。

 

16种常用的数据分析方法-列联分析_第7张图片

 

【统计量】

 

16种常用的数据分析方法-列联分析_第8张图片

 

【单元格】

 

16种常用的数据分析方法-列联分析_第9张图片

 

 

【格式】

 

16种常用的数据分析方法-列联分析_第10张图片

 

2.结果分析:

 

16种常用的数据分析方法-列联分析_第11张图片

 

卡方检验

 

16种常用的数据分析方法-列联分析_第12张图片

a. 16 单元格(100.0%) 的期望计数少于 5。最小期望计数为 .56。

 

原假设:H0:职称、学历两者相互独立。

皮尔逊(Pearson)的Chi-Square 值为18.553,自由度为9,

p=.029<0.05,拒绝原假设,即在5%的显著性水平下不同文化程度对职称的影响存在着显著差异。

 

结论:文化程度越高,职称越高。

你可能感兴趣的:(产品经理,技术,数据)