少量support的情况,检测全部的属于target目标范畴的前景
问题在于新的类别不错的框的分数低
在RPN前加一个attention,在检测器之前加了3个attention,然后还是用到了负support训练
给定带有target物体特写的support图片 s c s_c sc,包含support中类别物体的query图片 q c q_c qc,support中包含 K K K类物体,每类 N N N个样本,所以就是 K K K-way N N N-shot检测
权重共享的框架由多个分支组成,分别为support和query服务,support根据输入有多个分支,图片只显示了一个。
query分支是一个FasterRCNN网络,包含RPN和检测器。
利用这个框架来学习support和query之间的匹配关系,更好的学习同类之间的一般知识。
以这个框架为基础,提出了attention RPN,还有多联系检测
没有support,RPN就没有目标,后面的子分类就搞不清楚这么多的不相关目标。
使用support信息就能过滤掉大部分的背景框,还有那些不是匹配的类别
通过在RPN中用attention机制来引入support信息,来对其他类的proposal进行压制
通过逐深度的方法计算二者特征值的相似性,相似性用来生成proposal
support的特征是 X ∈ t S × S × C X \in t^{S\times S\times C} X∈tS×S×C,queroy的特征是 Y ∈ t H × W × C Y\in t^{H\times W \times C} Y∈tH×W×C,相似度定义如下:
G h , w , c = ∑ i , j X i , j , c ⋅ Y h + i − 1 , w + j − 1 , c , i , j ∈ { 1 , . . . , S } G_{h,w,c} = \sum_{i,j}X_{i,j,c} \cdot Y_{h+i-1,w+j-1,c},\ \ i,j\in \{1,...,S\} Gh,w,c=i,j∑Xi,j,c⋅Yh+i−1,w+j−1,c, i,j∈{1,...,S}
其中 G G G是attention特征图, X X X作为一个卷积核在query的特征图上滑动,以一种逐深度(取平均)的方式。
使用的是RPN的底部特征,ResNet50的res4-6,发现设置 S = 1 S=1 S=1表现很好,这说明全局特征能提供一个好的先验
G G G用 3 × 3 3\times 3 3×3的卷积处理,然后接分类和回归层。
还是测量相似性的,在query和support的bbox之间,包含三个attention:
不仅匹配而且区分
训练组 ( q c , s c , s n ) (q_c,s_c,s_n) (qc,sc,sn),其中 n ≠ c n\not = c n=c,是跟query不同的类,训练的时候只有 c c c被标记为前景
背景的proposal很多,所以平衡在query和support中三个不同匹配的比例,保持
前景proposal 和 负support( p f , s n p_f,s_n pf,sn) [ 图中(2) ]:
背景proposal 和 正support( p b , s p p_b,s_p pb,sp) [ 图中(1) ]:
proposal(前或后) 和 负support( p , s n p,s_n p,sn)
= 1:2:1
根据匹配的分数选全部的 N ( p f , s n ) N(p_f,s_n) N(pf,sn),选前 2 N ( p b , s p ) 2N(p_b,s_p) 2N(pb,sp),前 N ( p , s n ) N(p,s_n) N(p,sn)
根据第一队确定总个数,后面按分数来,什么样的分数?
错误的根据最不匹配分数?
为什么没有proposal(前或后)和positive support pairs( p , s n p,s_n p,sn) 的?
因为这里是算不同吗?
对于每个采样的proposa计算推荐:
L = L m a t c h i n g + L b o x L = L_{matching} + L_{box} L=Lmatching+Lbox
L b o x L_{box} Lbox和Faster RCNN一样, L m a t c h i n g L_{matching} Lmatching用的二值化交叉熵
是把四个匹配都算上吗
实验表明只有这个对比训练对区分起了作用
和0.5IoU的取前100的RPN对比。表里也显示RPN attention确实有效