【论文笔记】Student-Teacher Feature Pyramid Matching for Anomaly Detection

原文地址:https://arxiv.org/pdf/2103.04257.pdf
代码可以参考:https://paperswithcode.com/paper/student-teacher-feature-pyramid-matching-for

核心:利用知识蒸馏的方式在MVTec AD数据集上进行异常检测

【论文笔记】Student-Teacher Feature Pyramid Matching for Anomaly Detection_第1张图片

  1. 论文中的teacher网络是在ImageNet上预训练的ResNet-18
  2. 而student网络中的参数是随机初始化的
  3. 在训练过程中,使得student逼近teacher
    论文利用两点来进行异常检测:
    (1)因为teacher没有教student学习异常的能力,所以在测试异常样本时,teacher和student提取的特征(embedding)不同
    (2)因为student的参数是随机初始化的,那么训练完成后,不同student之间学到的embedding不同

我也是第一次看知识蒸馏方面的论文,读了源码之后,我发现,在训练时,teacher网络是不动的,改变的是student网络。

我的理解是,这里因为teacher是在ImageNet上预训练过的,所以有一定的提取特征的能力,相对于student肯定是比较优越的,所以这里将teacher作为一个参照物

可以这么理解:

在训练过程中,因为正常样本比较相似,我们可以假设训练的图片都一模一样
那么一开始teacher和student提取的特征有差别,根据loss进行一次更新,student的能力得到了一点提升;然后进行第二次训练,因为又是一张一模一样的图片,那么teacher学到的东西和之前一样,那此时teacher又把同样的知识交给student,student的能力又得到了一点提升。
如此继续,student识别这张图片的能力就接近了teacher,最后student也能够识别正常样本了。
在测试时,如果丢进去异常样本,teacher因为是预训练过的,所以也是有一定的提取能力,(也可以理解为有一定的泛化能力),但是student没有学过这个样本,就可能提取出“四不像”,这样就可以比较student和teacher两者提取特征之间的embedding距离来判断异常了。


参考内容:

  1. https://mp.weixin.qq.com/s/snezeHSNwUsGPFmnXJ5QpA
  2. https://zhuanlan.zhihu.com/p/364914260

你可能感兴趣的:(论文笔记,深度学习,计算机视觉,人工智能,异常检测,无监督学习)