【答案】学堂在线《数据分析方法与R软件》期末答案

1. 常用的多元统计分析方法有哪些?

(1)多元正太分布检验
(2)多元方差-协方差分析
(3)聚类分析
(4)判别分析
(5)主成分分析
(6)对应分析
(7)因子分析
(8)典型相关性分析
(9)定性数据模型分析
(10)路径分析(或称 多重回归、联立方程)
(11)结构方程模型
(12)联合分析
(13)联合分析
(14)多维标度法

2. 简单相关分析、复相关分析和典型相关分析有何不同?并举例说明之。

简单相关分析:简单相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。
例如,以X、Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由X去预测Y。

复相关分析:研究一个变量 x0与另一组变量 (x1,x2,…,xn)之间的相关程度。
举例:房屋销售均价X1, 全国居民消费水平X2、地产投资总额X3、固投房屋竣工面积X4、国内生产总值X5。房屋销售均价X1与其他相关变量X2,X3,X4,X5的关系是复相关关系。

典型相关分析:典型性相关分析方法研究多个随机变量与多个随机变量之间的相关关系。利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。
举例:理科学生的高中成绩(如数学、语文、外语等)与大学成绩(如数学分析、C语言、大学英语等)之间的相关关系等。

3. 判别分析以及Fisher判别和Bayes判别的基本思想是什么?

判别分析:判别分析是一种有效的多元数据处理方法。其基本思想:根据一批分析明确的样本在若干指标上的观察值,建立一个关于指标的判别函数和判别准则,然后根据这个判别函数和判别准则对新的样本进行分类,并且根据回带判别的准确率评估它的实用性。
 
Fisher判别法:基本思想是投影,将K个总体所有的p维空间的样本点投影到一维空间上,使得在一维空间中,来自不同总体的样本尽可能分开,来自同一总体的样本点尽可能集中,结点一元方差分析的思想到处投影函数,这个投影函数就作为判别函数。这个函数可以是线性的,也可以是其他类型的。

Bayes判别法:假定对研究对象已有一定的认识,一般用先验概率来描述,当取得训练样本后,就可以用训练本来修正已有的先验概率分布,得出后概率分布,然后通过后验概率的分布进行统计推断。

4. 指出综合评价中指标的标准化方法及其优缺点和有哪些综合评价方法。

标准化方法
Z-score标准化、离差标准化、MaxAbsScaler、RobustScaler、log函数转换、atan函数转换

(1)主成分分析法。主成分分析是多元统计分析的一个分支,是将其分量相关的原随机向量,借助于一个正交变换,转化成其分量不相关的新随机向量,并以方差作为信息量的测度,对新随机向量进行降维处理。再通过构造适当的价值函数,进一步做系统转化。
优点:
可消除评价指标之间的相关影响;
可减少指标选择的工作量;
当评级指标较多时还可以在保留绝大部分信息的情况下用少数的几个综合指标代替原指标进行分析;
在综合评价函数中,各主成分的权数为其贡献率,它反映了该主成分包含原始数据的信息量占全部信息量的比重,这样确定全书比较客观、合理。
缺点:
主成分分析首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平,其次对这些被提取的主成分必须都能够给出符合实际北京和意义的解释。
主成分的解释含义一般多少带有模糊性,不像原始变量的含义那么清楚、确切。

(2)数据包络分析法。它是创建人以其名字命名的DEA模型——CR模型。DEA法不仅可对同一类型各决策单元的相对有效性做出评价与排序,而且还可进一步分析各决策单元非DE有效的原因及其改进方向,从而为决策者提供重要的管理决策信息。
(3)模糊评价法。模糊评价法奠基于模糊数学。它不仅可对评价对象按综合分值的大小进行评价和排序,而且还可根据模糊评价集上的值按最大隶属度原则去评定对象的等级。

 

综合评价方法
(1)计分法 
(2)综合指数法 
(3)Topsis法
(4)秩和比(RSR)法
(5)层次分析(AHP)法 
(6)模糊评价方法 
(7)多元统计分析方法
(8)灰色系统评价方法

5. 试说明主成分分析和因子分析不同点和相同之处。

不同点
(1)因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。
(2)主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。
(3)主成分分析中不需要有假设,因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子之间也不相关,共同因子和特殊因子之间也不相关。
(4)主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,其主成分一般是独特的;而因子分析中的因子不是独特的,可以旋转得到不同的因子。

相同点:
(1)都可以降维、分析多个变量的基本结构。
(2)因子分析是主成分分析的进一步推广。主成分分析可被视为一种固定效应的因子分析,是因子分析的特列。
(3)都是利用变量之间的相关性将它们进行分类。
(4)主成分分析中,各个主成分之间互不相关;因子分析中,公因子之间不相关、特殊因子之间不相关、公因子与特殊因子之间不相关。
 

你可能感兴趣的:(知识/技能,积累)