几种识别概念漂移(concept drift)的方法

一种方法是将最近一段时间的数据与更长时期的数据进行比较。两个窗口的均值的显著变化是概念漂移的标志。比较参考窗口和最近窗口时,还可以比较平均值以外的其他度量。例如,可以估计它们是否由相同的分布生成。

为了估计分布,有时可以将不同的方法应用于较长和较短的时间窗口。这两个窗口也可以分别用于进行预测。当最近窗口的准确性高于较长窗口的准确性时,就会发生概念漂移(concept drift),因为如果概念保持不变,则较长的窗口应该更准确。

比较两个窗口的分布当然比更简单的方法需要更多的时间和空间,但可能会得出更准确的结果。变化检测方法还可以通过一些预测指标来监视预测指标的性能,如果性能发生变化,则发生了概念漂移(concept drift)。

你可能感兴趣的:(Anomaly,detection,人工智能,机器学习,大数据)