每天五分钟机器学习:为什么多元高斯分布可以解决问题?

本文重点

我们前面学习使用多元高斯分布构造异常检测算法,为什么多元高斯分布就可以解决那个异常点问题,本节课程我们就直观的看一下,为什么它可以?

直观来看

如果不使用多元高斯分布,此时的模型判定边界是

每天五分钟机器学习:为什么多元高斯分布可以解决问题?_第1张图片

 

如果使用多元高斯分布,此时的模型为蓝色的判定边界

每天五分钟机器学习:为什么多元高斯分布可以解决问题?_第2张图片

 

多元高斯分布的判定边界是斜着的,它自动捕捉特征之间的相关性(特征x1和特征x2是线性相关的y=kx的关系)。

现在我们拿到了一个新的样本,我们用多元高斯分布来计算p(x),如果p(x)<ε,那么我们就认为它是一个样本点,所以此时我们的模型肯定会认为这个绿色样本为异常点的,因为它并不在辨别边界内。

高斯核函数可以看成一种多元高斯分布,它的等高线全部沿着轴方向的(x1、x2)

你可能感兴趣的:(每天五分钟玩转机器学习算法,人工智能,深度学习,算法,高斯分布)