基于Python计算PLS中的VIP值(变量投影重要性分析法)

sklearn中PLS回归模型并没有计算VIP值的方法,但VIP又是很重要的筛选变量方法。下附代码思路与完整代码。

计算公式:

基于Python计算PLS中的VIP值(变量投影重要性分析法)_第1张图片

其中:

  • VIPj:对应于第j个特征的VIP值;
  • p:预测变量的总数;
  • A:PLS成分的总数;
  • R矩阵:A个PLS成分中,每个成分a都对应一套系数wa将X转换为成分得分,系数矩阵写作R,大小为p×A;
  • T矩阵:n个样本中,每个样本会计算出A个成分得分,得分矩阵记做T,大小为n×A,ta代表n个样本的第a个成分的得分列表;
  • 以上有T = XR
  • qa:e是残差,X0和y0代表数据和标签。

相关论文应用:

基于Python计算PLS中的VIP值(变量投影重要性分析法)_第2张图片

链接:

你可能感兴趣的:(笔记,python,开发语言)