【阅读笔记】《Student-Teacher Feature Pyramid Matching for Anomaly Detection》

Student-Teacher Feature Pyramid Matching for Anomaly Detection


文章目录

  • Student-Teacher Feature Pyramid Matching for Anomaly Detection
    • 介绍
    • 整体框架
    • 训练过程
    • 测试过程
    • 结果分析


介绍

  一个再普通不过的教师-学生网络,主要用于缺陷检测。teacher net和student net均使用resnet18作为框架,在框架中集成多尺度特征匹配策略,使学生网络能在更好的监督下从feature pyramid中接收多层次知识的融合,从而允许检测各种大小的异常。以两个网络生成的feature pyramid间的差异作为评分函数,指示某个像素处异常发生的概率,实现了精准、快速的像素级异常检测。


论文地址:https://arxiv.org/pdf/2103.04257.pdf


整体框架

【阅读笔记】《Student-Teacher Feature Pyramid Matching for Anomaly Detection》_第1张图片
  具体而言就是将resnet18的conv2_x(layer1)、conv3_x(layer2)、conv4_x(layer3)几层输出的feature maps抽出,使student net的这三层feature maps与teacher net的这三层的feature maps尽可能接近。

【阅读笔记】《Student-Teacher Feature Pyramid Matching for Anomaly Detection》_第2张图片

训练过程

以下主要介绍其损失函数:
  首先分别对teacher和student进行L2范数标准化,然后计算L2损失函数:
【阅读笔记】《Student-Teacher Feature Pyramid Matching for Anomaly Detection》_第3张图片
  之后在图像上进行平均:
在这里插入图片描述
  再然后对于一张图片的输入,将其所有layer上的损失进行求和:

在这里插入图片描述
  最后batch中的所有图片的loss做一个平均,此为最小化目标损失,优化目标就是要使这东西最小化:
在这里插入图片描述

测试过程

  在测试过程中,将S和T两个网络中间三个层的feature maps对应相减,然后上采样到相同大小,然后相乘,所得为图片各像素点处的anomaly score,选取最大值作为本图片的异常分数。
在这里插入图片描述
(个人感觉相加比相乘好,作者应该是经过大量实验结果相乘更好吧)

结果分析

  整体异常检测效果较好,但仍存在一些检测失误的地方

  上图的cable,其中电线截面的反光情况会干扰到异常检测

【阅读笔记】《Student-Teacher Feature Pyramid Matching for Anomaly Detection》_第4张图片
  上图的zipper,表面的一些小杂物(训练集中也存在)会被误认为是异常

等等等等…

你可能感兴趣的:(楽しい,深度学习,人工智能,机器学习,目标检测)