每天五分钟机器学习:非监督学习算法之异常检测算法是什么?

本文重点

异常检测问题,这是机器学习的一个常见的应用,它虽然主要用于非监督学习问题,但是从某些角度来看的话,它又类似于一些监督学习的问题。

异常检测是什么?

假如我们要检测汽车发动机是否是正常的,发动机的特征如下:

X1=发动机运转时的震动

X2=发动机运转时的转速

x3=发动机运转时的耗油量

Xn=…

假设现在我们有m个样本x(1)、x(2)...x(m)

如果只考虑每个样本的两个特征x1、x2,我们将其进行可视化

每天五分钟机器学习:非监督学习算法之异常检测算法是什么?_第1张图片

 

上图中的每个×都是我们数据集中的一个样本,都是无标签数据,当有一个新的发动机生产出来,那么异常检测是否可以检测出这个发动机有异常。

每天五分钟机器学习:非监督学习算法之异常检测算法是什么?_第2张图片

 

蓝色的和绿色的都是新样本

就比如说蓝色新发动机,它和以前的发动机好像很相似,而绿色新发动机,它和以前的发动机不是很相似,所以我们有理由怀疑它有问题

异常检测的定义

假如有m个正常样本,然后需要一个算法来确定一个新的样本数据Xtest是否是异常的。我们采取的办法是给定无标签的训练集,我们对该数据集建立一个模型p(x),也就是说对样

你可能感兴趣的:(每天五分钟玩转机器学习算法,算法,人工智能,异常检测,深度学习)