CSDN 叶庭云:https://yetingyun.blog.csdn.net/
使用因果建模进行特征选择和创建
我们都希望自己的机器学习模型能在未知数据上拥有出色的泛化能力。但我们常常会发现,当新数据与旧数据分布不同时,模型的性能往往会显著下降。
例如,我们用某个国家的数据训练出来的医学诊断系统,可能无法推广到另一个国家,因为两个国家常见疾病的分布不同。针对这个问题,机器学习领域的研究者和从业者开发出了各种鲁棒性算法。一个强大的模型,按照定义来讲是对预测变量或目标变量分布偏移不敏感的。
如何提高模型的鲁棒性,仍然是一个活跃的研究课题,利用因果推断分析模型鲁棒性就是其中一种方法。