什么是多重共线性问题?如何判别多重共线性问题?怎么避免多重共线性对模型和学习的干扰?

Multicolliearity多重共线性

而所谓的多重共线性,是指 predictor variable 之间的关系,当预测变量间有很高的相关度时,会造成信息冗余,影响回归模型的结果。

检测的方法是计算所有 predictor variable pairs 间的相关系数,如果有为 1 或者 -1 的,说明两变量间,高度相关,此时应该干掉一个。

 

什么是多重共线性问题?如何判别多重共线性问题?怎么避免多重共线性对模型和学习的干扰?_第1张图片

 

共线性出现的原因:

 

多重共线性问题就是说一个解释变量的变化引起另一个解释变量地变化。

你可能感兴趣的:(数据科学,机器学习面试,数据挖掘,机器学习,逻辑回归)