数学建模分享part2--主成分分析(spss)

首先我们学习一个算法最开始需要明确三个问题:1、这个算法可以解决什么类型的问题?2、这个算法需要什么样的条件?3、这个算法的步骤是什么?所以这次的主成分分析我们也将从这三个问题出发为大家介绍:

1、主成分分析是用来解决评价类问题,可以应用于针对相同的多因子的多个对象的评价并排序,举个例子就是现在如果让你去给中国的城市的生活指数排序,那么你可能会想到很多的指标如:GDP、人口密度、平均工资、平均房价等多个指标,那么以上这些指标就是主成分所需要的因子,而评价的对象便是中国的每座城市。

2、运用主成分分析需要什么样的条件呢?答案是需要指标间的关联性很强,顺承上面的例子,很明显我们可以感受到某座城市的GDP应该和平均工资和平均房价之间有着很强的关联性,这里拿北上广深就可以很好的作为样例,GDP高的同时,平均工资也高,同时平均的房价也会更高,那么遇到这种具有相关性的指标的时候我们便可以对其进行主成分分析。

3、主成分分析的步骤:

  1. 指标数据标准化(SPSS软件自动执行/excel/matlab都可实现); [1]

  2. 指标之间的相关性判定;

  3. 确定主成分个数m;

  4. 主成分Fi表达式;

  5. 根据贡献率写出最终的评价表达式。

[1]数据标准化:

概念:在多指标评价体系中,由于各评价指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,为了保证结果的可靠性,需要对原始指标数据进行标准化处理。

数据标准化的方法:http://002ii.cn/oEJ9R

这里我将通过spss做一个实际的例子来给大家演示主成分的用法:

数学建模分享part2--主成分分析(spss)_第1张图片

题目:我们想通过上面这些指标去衡量这些企业的信贷风险,我们很明显知道,以上这些因子都是负向指标,即利润、利润率、增长率、信誉星级和违约情况得分越高,信贷风险越低,因此我们需要注意的是我们计算出来之后的得分应该是和信贷风险负相关的。那么现在我们开始根据步骤来进行分析:

第一步:数据标准化:

首先将数据导入spss

点击1分析-2统计描述-3统计,最后就能出现如下所示界面,然后我们点击将标准化值另存为变量(Z)

数学建模分享part2--主成分分析(spss)_第2张图片

点击确定就能在原数据集中看到标准化的数据:
数学建模分享part2--主成分分析(spss)_第3张图片
数学建模分享part2--主成分分析(spss)_第4张图片

第二步:指标之间的相关性判定&确定主成分个数m

点击分析-降维-因子,就可以进到以下界面,选择我们标准化好的数据,然后在提取里面的方法选择主成分,在提取里推荐选择因子的特定数目,然后提取的因子数选择你所需要分析的因子总数,这样可以确保完整不遗漏。

数学建模分享part2--主成分分析(spss)_第5张图片

点击继续之后我们就能够得到以下结果:

数学建模分享part2--主成分分析(spss)_第6张图片
数学建模分享part2--主成分分析(spss)_第7张图片

由于我们是选择提取出全部的因子,因此五个成分都会被提取出来,但是主成分的好处便是在于如果有相关性强的因子,会合并为一个因子,也就是如果我们不考虑最后一组成分,及只考虑到贡献率为97%的几组因子即可基本完整反映企业的信贷风险情况,下面就是看图说话的过程:

第三步:列出成分矩阵得到的主成分表达式:
Y1=0.091X1+0.074X2+0.165X3+0.954X4+0.958X5

Y2=0.768X1+0.003X2-0.660X3-0.011X4+0.052X5
Y3=-0.225X1+0.943X2-0.255X3-0.027X4+0.019X5
Y4=0.592X1+0.325X2+0.687X3-0.124X4-0.076X5
Y5=0.018X1+0.016X2-0.005X30.271X4-0.272X5
当我们忽略最后一个成分时:
第四步:写出最终的评价体系的表达式:
Y=0.37363Y1+0.2057Y2+0.20104Y3+0.18994Y4
于是根据这个计算式我们我们可以利用MATLAB编写一个简单的程序进行计算最终可以算出每家企业的得分,得分越高信贷风险越低,即可通过量化的数据来反应企业的信贷风险。

数学建模分享part2--主成分分析(spss)_第8张图片

当然这里只是举一个简单的例子给大家讲解,里面还会有很多不足的地方也欢迎大家的批评指正!

小伙伴们可以实际找数据操作一下哦,后续一段时间会日更数模等相关知识,而且会涉及到具体的模型建立和算法实现,欢迎大家关注和交流哦!

你可能感兴趣的:(数学建模,美国大学生数学建模竞赛)