SIMCA-P计算变量投影重要性分析值(VIP)_偏最小二乘

变量投影重要性(VIP)主要用于变量筛选,基于偏最小二乘回归的有点,VIP技术可用于样本较小而且几个自变量间相关性较强的情形。

1.打开SIMCA-P软件,导入excel数据,注意数据格式

SIMCA-P计算变量投影重要性分析值(VIP)_偏最小二乘_第1张图片
第一行是变量名,第一列是序号,自己提前设置好
同时确认一下绿色的代表是变量,黄色代表的是序号

2.设置一下项目名,我这里是SIMCA_111,然后完成SIMCA-P计算变量投影重要性分析值(VIP)_偏最小二乘_第2张图片

3.点击工具栏上的workset设置一下参数

SIMCA-P计算变量投影重要性分析值(VIP)_偏最小二乘_第3张图片
右击因变量,选择Y
SIMCA-P计算变量投影重要性分析值(VIP)_偏最小二乘_第4张图片
SIMCA-P计算变量投影重要性分析值(VIP)_偏最小二乘_第5张图片
点击确定后Type会变成PLS
SIMCA-P计算变量投影重要性分析值(VIP)_偏最小二乘_第6张图片

4.点击工具栏的autofit

SIMCA-P计算变量投影重要性分析值(VIP)_偏最小二乘_第7张图片
会出现model view,对我没啥用,关掉
重点来了

5.点击analysis,出现了Variance importance,可以选择图表数据和列表数据

SIMCA-P计算变量投影重要性分析值(VIP)_偏最小二乘_第8张图片
SIMCA-P计算变量投影重要性分析值(VIP)_偏最小二乘_第9张图片
结束

花絮:
为了算这个VIP数值我真的是要哭了,写个论文太难了。刚开始百度变量投影重要性分析说是在偏最小二乘里,去找偏最小二乘法的论文,发现说是用SAS软件。我花了一下午装好这个30g的软件,打开后不会使,又百度出代码,结果只显示VIP的柱状图没有具体数值。本以为就要凉凉,老师告诉我她用的是SIMCA-P软件。又去找,找完一步一步对着书上的例子看,最后终于出来了数值,而且和SAS软件比较结果一样。到这我的论文数据部分算结束了,太难了。。。。

你可能感兴趣的:(论文,回归,数据挖掘,人工智能)