R语言3.12 对应分析

对应分析是主成分和因子分析的进一步扩展
对应分析的提出是基于因子分析的不足,因子分析方法分为R型因子分析和Q型因子分析。R型因子分析研究变量(指标)之间的相关关系,Q型因子分析研究样本之间的相关关系。但有时不仅关心变量之间或样本之间的相关关系,还关心变量和样本之间的对应关系,这是因子分析不能解释的。
对应分析的作用:分析两组或多组因素之间关系的有效方法,在离散情况下,建立因素间的列联表来对数据进行分析。
什么情况进行对应分析:对数据做对应分析之前,需要先了解因素间是否独立,如果因素间相互独立,则没有必要进行对应分析。所以在决定是否做对应分析之前做卡方检验检验因素间是否独立。

d3.12=read.table("clipboard",header = T)
d3.12
X=data.frame(d3.12)
X
chisq.test(X)(卡方检验)

在这里插入图片描述
卡方=118.1 自由度(5-1)×(4-1)=12 p值<0.01,认为收入和满意程度是有关联的。
对应分析的基本原理:
对数据矩阵X做概率变换得概率矩阵p=(pij)
在这里插入图片描述
接着多概率矩阵做标准化变换可得过渡矩阵z=(zij)

过渡矩阵有非常好的性质,eg计算变量的协方差矩阵在这里插入图片描述
计算样品的协方差矩阵在这里插入图片描述
定理:在这里插入图片描述
因此复杂的问题就转化成计算特征根和特征向量的问题。
Q型与R型因子分析反映了数据的不同方面,他们之间必然有内在的联系,对应分析通过巧妙的数学转换,将Q型和R型因子分析有机的结合起来。
即通过求过渡矩阵z,从而求得变量协差阵A,样本协差阵B,而A与B有相同的非零特征根。
对应分析函数ca的用法
ca(X) X数据矩阵,通常是频数表数据

library(ca)
ca1=ca(X)
summary(ca1)

R语言3.12 对应分析_第1张图片
压缩到二维就包含了99.8的信息

ca1$rowcoord(行坐标)
ca1$colcoord(列坐标)

R语言3.12 对应分析_第2张图片

plot(ca1,gap=0)

R语言3.12 对应分析_第3张图片
对应分析图:
第一组:变量:<1万
样品:有些不满、很不满
第二组:变量:1-3万、3-5万
样品:比较满意
第三组:变量:5-10万、>10万
样品:很满意

对应分析几个应该注意的问题:
1.不能用相关关系的假设检验
2.维度由变量所含的最小类别决定
3.对极端值敏感性研究
4.研究对象要有可比性
5.变量的类别应涵盖所有情况
6.不同标准化分析结果不同
R语言3.12 对应分析_第4张图片

你可能感兴趣的:(R语言3.12 对应分析)