偏最小二乘回归和偏最小二乘路径模型

1. 偏最小二乘回归(Partial least squares regression, PLS回归)

偏最小二乘 (PLS) 回归是将预测变量减少为较小的一组不相关分量对这些分量(而不是原始数据)执行最小二乘回归的方法。当预测变量高度共线,或者预测变量比观测值多并且普通的最小二乘回归所产生的系数标准误高或完全失败时,PLS 回归特别有用。与多个回归不同,PLS 不会假设预测变量是固定的。这意味着预测变量的测量可能会有误差,使 PLS 的测量更具不确定性。


在 PLS 回归中,重点是建立预测模型。因此,通常不用来筛选在解释响应时无用的变量

与最小二乘回归不同的是,PLS 可以在单个模型中拟合多个响应变量。PLS 回归可拟合单个模型中的多个响应变量。因为 PLS 回归以多元方式对响应变量进行建模,所以结果可能与为响应变量单独计算得出的值显著不同。仅在多个响应互不相关时才单独对这些响应建模。

偏最小二乘回归(PLS)其实解决的是一个比较实际的问题:高维数据预测问题。换句话说就是自变量的个数大于观测值的个数。你可能一开始会觉得不可思议,但是在经济学中这是很常见的。

偏最小二乘的基本思路就是——考虑与因变量的相关性情况下的最小二乘算法

回归分析|笔记整理(B)——主成分回归(下),偏最小二乘回归 - 知乎 (zhihu.com)

偏最小二乘回归法用于处理环境因子变量多于样本量多元线性回归情况。普通的多元线性回归,环境因子的数量一定要小于样本量,不然求不出那么多回归系数。只能先通过主成分分析或因子分析方法来处理这个问题:即先通过主成分(或因子分析)获取原始环境变量的线性组合(即新的变量),这样用新的变量代替原来的变量,减少了变量的个数,就可以求出回归系数,然后在通过回归系数与因子的荷载量再来求响应变量与原始环境因子之间的系数。偏最小二乘回归法与普通做法(先不管响应变量y,然后先主成分分析,然后做直接拿主成分做回归)的区别在于前者在主成分分析过程充分考虑到响应变量的角色,即得到的主成分是要让响应变量与主成分之间的回归R2最大,而不是普通的主成分那样让前两几轴承载更多的方差。

科学网—如何在R里面实现偏最小二乘回归法(partial least squares 回归 - 赖江山的博文 (sciencenet.cn)

2. 偏最小二乘路径模型(Partial Least Squares Path Modeling,pls-pm)

特点:1、是结构方程模型的偏最小二乘方式

   2、用于研究显变量和潜变量的完整多元相关关系

   3、是一种数据分析方式,用于研究一组设定的显变量区块中,每个模块都能被潜变量和潜变量之间的相关性所代表

科学网—R语言统计:偏最小二乘路径模型(plspm) - 涂波的博文 (sciencenet.cn)

plspm包使用说明文件:http://www.gastonsanchez.com/PLS Path Modeling withR.pdf

你可能感兴趣的:(统计学习,算法)