【教程】SHAP值解释xgboost模型的特征重要性-SofaSofa

利用SHAP解释Xgboost模型

Xgboost相对于线性模型在进行预测时往往有更好的精度,但是同时也失去了线性模型的可解释性。所以Xgboost通常被认为是黑箱模型。

2017年,Lundberg和Lee的论文提出了SHAP值这一广泛适用的方法用来解释各种模型(分类以及回归),其中最大的受益者莫过于之前难以被理解的黑箱模型,如xgboost和神经网络模型。

本教程中,我们在真实数据集上进行实操,利用SHAP来解释Xgboost模型。

预计学习用时:30分钟。

本教程基于Python 3.6版本、Xgboost 0.82版本以及shap 0.28.5版本。
SHAP值
完整教程以及代码地址:
【教程】SHAP值解释xgboost模型的特征重要性-SofaSofa

你可能感兴趣的:(数据科学,SofaSofa,机器学习,python,xgboost,shap)