Robust Random Cut Forest Based Anomaly Detection On Streams

如果你是觉得RRCF方法比孤立森林更优才来看这篇论文的话,一定要先看看4.1部分,明确在什么样的情况下RRCF方法比孤立森林更优。另外,RRCF和孤立森林最根本的差异来自抽选出一个维度时服从的规律不同,论文在定义1之后说明了这一点。

来源

机器之心的文章学会五种常用异常值检测方法,亡羊补牢不如积谷防饥中的方法5提到了这篇paper,介绍比孤立森林更准确、更快速。既然这么说有时间还是要看看了。

问题

问题1

Robust Random Cut Forest Based Anomaly Detection On Streams_第1张图片
想不通,红框里边是怎么回事呢?

定义

定义1

Robust Random Cut Forest Based Anomaly Detection On Streams_第2张图片
Robust Random Cut Forest Based Anomaly Detection On Streams_第3张图片

定义2

Robust Random Cut Forest Based Anomaly Detection On Streams_第4张图片
Robust Random Cut Forest Based Anomaly Detection On Streams_第5张图片

定义3

在这里插入图片描述
Robust Random Cut Forest Based Anomaly Detection On Streams_第6张图片

亮点

有待补充

亚马逊官方资料

  1. statistical-variance-deviation-functions

  2. random-cut-forest

  3. random-cut-forest-with-explanation

你可能感兴趣的:(笔记)