r语言pls分析_基于R语言的PLS算法的实现解读.pptx

基于R语言的PLS算法的实现及研究

目录

使用的开发工具

偏最小二乘的设计思想

基于R语言、MATLAB的偏最小二乘的实现

通径分析

测定系数

实验分析

使用的开发工具

R 语言(R是用于统计分析、绘图的语言和操作环境。它是一个用于统计计算和统计制图的优秀工具。)

MATLAB(它是一种以矩阵运算为基础的交互式程序语言。它作为一种编程语言和可视化工具,可解决工程、科学计算和数学学科中许多问题。)

偏最小二乘回归法

最小二乘

偏最小二乘

1.数目较少

2.无多重共线性

3.各解释变量与反应变量之间的关系易于解释

1.在自变量存在严重多重共线性时可以进行回归建模;

2.在样本点个数比变量个数(维数)明显过少时可以进行

回归建模;

3. PLS模型可以识别系统信息与噪声;

4. PLS模型中,每一个自变量的回归系数容易解释;

5. PLS最终回归模型中包含原有的所有自变量。

偏最小二乘回归法

算法的设计思想

①两组潜变量分别最大程度承载自变量与因变量的变异信息;

②二者之间的协方差最大化(相关程度最大)。

算法的设计思想

提取多少个主成分最合适???

交叉性检验

>=0.0975

实例分析(基于MATLAB)

芦荟大黄素

大黄素

大黄酸

大黄酚

大黄素甲醚

厚朴酚

和厚朴酚

橙皮苷

辛弗林

d-乳酸

x1

x2

x3

x4

x5

x6

x7

x8

x9

y1

0.0625

0.0468

0.0945

0.0724

0.0265

0.0072

0.0138

0.2448

0.2198

0.0625

0.045

0.0317

0.0558

0.0899

0.0214

0.0164

0.0134

0.4913

0.4865

0.0525

0.0075

0.0085

0.0126

0.0139

0.0063

0.0213

0.016

0.0286

0.0176

0.03

0.035

0.0278

0.0434

0.0532

0.0155

0.0239

0.0161

0.1661

0.0709

0.04

0.018

0.0097

0.0232

0.0159

0.0036

0.0179

0.0122

0.4199

0.4249

0.06

0.034

0.0233

0.0631

0.0654

0.0184

0.0117

0.0085

0.1936

0.0722

0.06

0.0227

0.0104

0.03195

0.0213

0.0478

0.0032

0.003

0.3548

0.3716

0.0675

0.1006

0.0875

0.1841

0.2119

0.068

0.0136

0.014

0.2078

0.1239

0.0575

0.106

0.096

0.1982

0.1701

0.0495

0.0045

0.0079

0.0872

0.0536

0.1325

0.054

0.0441

0.0871

0.0998

0.0277

0.0871

0.0042

0.0666

0.0471

0.19

实例分析

成分个数

Q2h

临界值

1

1

0.0975

2

0.4635

0.0975

3

-0.4888

0.0975

在testpls01.m文件中添加下列几行代码。

%以下计算决定系数的R^2

SST=sum((ppz(:,10)-mu(1,10)).^2);

SSR= sum((ch0+ppz(:,1:9)*xish-mu(1,10)).^2);

RR=SSR/SST;

得到复测定系数为 R^2=0.927

由表可知,当我们主成分取三个,才能更好的拟合方程,拟合结果如下

y=0.0916+0.2229x1+0.2167x2+0.0964x3+0.0292x4+(-0.1552)x5+1.0706x6+

(-5.8149)x7+-0.0155 x8+0.0194x9

实例分析(基于R)

(1)pls包的安装以及载入

>install.packages("pls")

>library(pls)

(2)数据的导入

>C1

>C2

#导入自变量和因变量的样本数据

(3)数据的标准化

X

Y

#使用scale()函数将数据进行标准化消除量纲的影响.记标准化之后的自变量为X,因变量为Y

(4)进行初次线性曲线拟合,指定主成分的个数,并显示结果。

>pls1

你可能感兴趣的:(r语言pls分析)