ML 训练与测试数据不满足同分布 - 如何检测?如何解决?

同分布问题是数据挖掘中的常见问题,也是ML中的一个重要假设。解决训练与测试数据不满足同分布问题,有助于提高模型的泛化性、稳定性!

文章目录

  • 一、定义:训练与测试数据不满足同分布
    • 定义:
    • ❓疑问:为什么数据会出现不满足同分布
  • 二、检测方法:检测训练与测试数据是否满足同分布
    • 1、基于统计指标的方法
      • 1、PSI检验
      • 2、KS检验
      • 3、Overlap Rate检验
      • 4、KL散度检验
      • 5、KDE核密度估计
    • 2、基于异常点检测的方法
    • 3、基于机器学习分类的方法
  • 三、解决方法:解决训练与测试数据不满足同分布
  • Reference:


一、定义:训

你可能感兴趣的:(算法岗面试,人工智能,深度学习,分类,回归)