《Student-Teacher Feature Pyramid Matchingfor Anomaly Detection》论文阅读笔记

作者:Guodong Wang,Shumin Han∗,Errui Ding3,Di Huang†1,2

       作者将知识提取到一个具有相同结构的学生网络中,以学习无异常图像的分布,这种一步转移尽可能地保留了关键线索。作者将多尺度特征匹配策略集成到框架中,这种分层特征匹配使得学生网络能够在更好的监督下接收来自特征金字塔的多层次知识的混合,从而允许检测各种大小的异常。

特点:在给定一个在图像分类方面预先训练的强大网络作为教师,我们将知识提取到具有相同架构的单个学生网络中。在这种情况下,学生网络通过将无异常图像的特征与预先训练的网络的对应特征进行匹配来学习无异常图像的分布,并且这种一步转移尽可能地保留了关键信息。作者还将多尺度特征匹配嵌入到网络中,这种分层特征匹配策略使学生网络能够在更强的监督下接收来自特征金字塔的多层次知识的混合,从而允许检测各种大小的异常。

        与之前的学生教师网络相比,我们的方法的好处是双重的。首先,有用的知识在一步蒸馏内从预训练网络很好地转移到学生网络,因为它们共享相同的结构。第二,由于网络的层次结构,提出的特征金字塔匹配方案可以方便地实现多尺度异常检测。

方法:

        我们需要考虑一个关键因素,即:蒸馏位置

《Student-Teacher Feature Pyramid Matchingfor Anomaly Detection》论文阅读笔记_第1张图片

训练过程:训练集

输入图片I∈Rwxhxc,得到教师和学生的F

损失函数和   Ft和Fs 特征向量之间的距离:

《Student-Teacher Feature Pyramid Matchingfor Anomaly Detection》论文阅读笔记_第2张图片 

整个图像的损失由每个位置处的损失平均值给出: 

《Student-Teacher Feature Pyramid Matchingfor Anomaly Detection》论文阅读笔记_第3张图片

《Student-Teacher Feature Pyramid Matchingfor Anomaly Detection》论文阅读笔记_第4张图片

 测试过程:

获得关于测试图像J ∈ Rw × h × c的大小为w × h的异常图Ω,我们将测试图像J转发给教师和学生。令F1t(J)和F1s(J)分别表示由教师和学生的第l个底层组生成的特征图。我们可以计算出一个大小为wl × hl的异常图Ω

《Student-Teacher Feature Pyramid Matchingfor Anomaly Detection》论文阅读笔记_第5张图片

实验: 

数据集:MVTECAD,STC,CIFAR10

具体措施:选择前三个块(即,conv2_x、conv3_x、conv4_x)作为教师和学生网络的金字塔特征提取器。教师网络的参数是从在ImageNet上预先训练的ResNet-18复制的,而学生网络的参数是随机初始化的。使用随机梯度下降(SGD)训练网络,100个历元的学习率为0.4。批量为32。将训练集和测试集中的所有图像调整为256 × 256。对于每个类别,我们使用80%的训练图像来构建学生,保留剩余的20%用于验证。

你可能感兴趣的:(论文阅读)