机器学习(李宏毅)Lecture04 学习笔记(Anomaly Detection)

Anomaly Detection

设计一个函数能判断 x x x是否与训练集{ x 1 , . . . , x T x^1,...,x^T x1,...,xT}中的训练数据相似。是一个二元分类问题。

应用

1.欺诈检测(Fraud Detection)。
2.网络系统入侵检测(Network Instrusion Detection)。
3.癌细胞检测(Cancer Detection)。

分类器信心分数(y值)做异常检测

训练数据有标记。
机器学习(李宏毅)Lecture04 学习笔记(Anomaly Detection)_第1张图片
f ( x ) = { a n o m a l y , c ( x ) ≤ λ n o r m a l , c ( x ) > λ f(x)=\{^{normal,c(x)>\lambda}_{anomaly,c(x)\leq\lambda} f(x)={anomaly,c(x)λnormal,c(x)>λ
λ : \lambda: λ:阈值

f : f: f:上一讲中的概率分布函数,可以求概率。

存在的问题:有些异常数据具有很明显的正常数据的特征。
解决方法:生成一些异常数据,训练分类器给较低的信心分数。

你可能感兴趣的:(机器学习学习笔记)