异常检测初识pyod TASK3

摘要:本次主要是公式的理解有点难度,可以去看看南瓜书。本次将乳腺癌数据训练集的划分,随机划分了10次,取其平均值。

目录

  • 1. 笔记
    • 公式理解
  • 2.Example
  • 参考文献、链接、联系方式

1. 笔记

异常检测初识pyod TASK3_第1张图片

公式理解

  • 理解PCA的相关知识以及结论,这张图作用很大:
  • 从这张图可以看出:
    异常检测初识pyod TASK3_第2张图片
  1. 往方差大的方向投影,点都是尽可能的散开,往方差小的方向投影,点都是尽可能聚集在一起,所以,如果往方差小的方向投影,有一个点,远离了大多数的点,那么,它是离群点的概率很大。
  2. 从周志华的书,以及南瓜书,来推导出下面的式子,得出方差与特征值线性相关,所以,方差等于特征值,协方差为0是因为不同特征值对应的特征向量正交,相乘为1,带入式子为0
    在这里插入图片描述
    在这里插入图片描述

2.Example

对乳腺癌数据的训练集划分,划分了10次,取平均值
将之前的数据的显示改为了散点图
异常检测初识pyod TASK3_第3张图片
异常检测初识pyod TASK3_第4张图片

参考文献、链接、联系方式

jupyter文档地址
邮箱:[email protected]

你可能感兴趣的:(datawhale异常检测,数据分析)