吴恩达机器学习入门——异常检测

吴恩达机器学习入门——异常检测

  • 高斯分布
  • 异常检测算法
  • 开发和评估异常检测系统
  • 异常检测与监督学习的区别
  • 异常检测算法的特征
  • 多变量高斯分布

高斯分布

吴恩达机器学习入门——异常检测_第1张图片
对于高斯函数的参数:u为均值,δ2为方差。

异常检测算法

吴恩达机器学习入门——异常检测_第2张图片
首先,选择很有可能出现异常的样本xi,然后进行数据拟合得到 μ \mu μ和δ2 ,最后计算对于新给出的事件,计算p(x),如果p(x)< ε \varepsilon ε,则判断为异常。
下面就是一个例子。
吴恩达机器学习入门——异常检测_第3张图片

开发和评估异常检测系统

吴恩达机器学习入门——异常检测_第4张图片
对于一个飞机引擎检测系统来说,我们把数据分成训练集、交叉验证集、测试集,其中异常的样本也放进CV和test集中。
吴恩达机器学习入门——异常检测_第5张图片
算法评估:首先,利用无标签的训练集来拟合出模型p(x),然后把模型应用到交叉验证集和测试集中,并对样本贴上标签。
吴恩达机器学习入门——异常检测_第6张图片

异常检测与监督学习的区别

吴恩达机器学习入门——异常检测_第7张图片
异常检测是针对正样本的个数很少,负样本的个数很多的情况。而监督学习是在有大量的正样本和负样本的前提下。

异常检测算法的特征

吴恩达机器学习入门——异常检测_第8张图片
如果给出的数据直方图表示并不是高斯分布的,最后通过数据转换,使其为高斯分布,这样可能对算法进行加速。

多变量高斯分布

吴恩达机器学习入门——异常检测_第9张图片
通过给定数据进行拟合,得到均值和方差。然后把新的样本数据代入p(x)。
吴恩达机器学习入门——异常检测_第10张图片

你可能感兴趣的:(机器学习)