目标检测NAS-FPN(文章发表时间2019_4)

转载

首先看这篇文章
https://www.jiqizhixin.com/articles/2019-04-22-12
下面是对上面文章的补充

大纲

abstract
1introduction
FPN就是用来特征融合的层,之前都是手工设计,现在尝试神经网络搜索设计!
其实就是优化FPN
2related work
2.1 architecture for pyramidal representation
2.2 神经网络搜索(理论上可以对任何东西进行搜索,就像是强化学习和进化算法
遗传算法等等,这些都是寻优算法,只不过现在把这些算法应用到了神经网络的领域)
3Method
3.1architecture search space
就是搜索空间 这一个问题是离散变量空间
3.2merging cell
这里介绍了编码的方式 输入|输入|输出|操作方式
不太清楚他们是不是相互独立的
本文中FPN一共有7个上述cell 因此用长度28的串就可以表示一个FPN
4 experiments
4.1 implementation details
4.2 architeture search for NAS-FPN
proxy task代理任务(为减少训练搜索时间 采用代理任务训练RNN controller)
(1)50epochs变为10epochs
(2)repeat the pyramid networks 3 times(这里重复的思想,不知道是作者首先提出的还是谁首先提出的)
controller
discoverd feature pyramid architectures
4.3 scaleable feature pyramid architecture
(1)stacking pyramid networks
(2)adopting differenct backbone architectures
(3)number of dimension in pyramid(这里指的应该是特征图的数目)
太多也不好 容易冗余 过拟合文中采用dropblock解决这个问题
(4)architetures for high detection accuracy
(5)architectures for fast inference
4.4 further improvements with dropblock
we apply DropBlock with block size 3x3 after batch
normalization layers in the the NAS-FPN layers

补充

(1)对于引文中图7的补充理解
初始状态有5个 由于采用了7个merging cells 因此又多了7个状态因此是12个状态
但是上面的12的状态并不是最终的输出
还有一步处理,文中说
Similar to [44], we take all feature layers that have not been
connected to any of output layer and sum them to the output
layer that has the corresponding resolution
正是因为这一点,你会看到有些点的输入是三个输入(merging cell 的输入是两输入)
这是二次处理的结果
但是论文中并不是是 上面的这种理解方式
首先得到28个编码之后,然后检查是否有没有用到的5个状态中的一个,然后
与merging cell的输出进行sum。得到的结果 才是中间状态。
(2)一共有5行 8列 这是因为有5个输入状态 7merging cell的结果
注意每一列都有一个中间状态 一共是7个代表的是7merging cell的输出
如果按照12345对于中间状态的resolution进行编码的的化
从下往上依次是 1 2 3 4 5
对于
(b)图就是4 5 1 4 2 3 5
(f)图就是2 2 1 2 3 5 4

(3)如果对初始状态 分辨率从下往上编码为1 2 3 4 5
对于中间状态编码为6 7 8 9 10 11 12
sum编码为1 global pooling编码为2的化
按照输入|输入|输出|操作的顺序进行编码的的话
输入|输入|输出|操作
目标检测NAS-FPN(文章发表时间2019_4)_第1张图片
因此我个人觉得输出的编码就不要用输出的,而是要用featuremap的大小进行表征。

发现

(1)下一个merging cell的输入 是上一个merging cell的输出
如果能够总结出类似的上面的编码规则的化 就可以降低搜索空间
(2)尝试增大搜索空间比如说 更多的输入 更多的merging cell
总结就是 论文开了 搜索 FPN结构的先河,但是搜索空间的定义不太合理。还有其他的搜索空间的定义方式!
(3)所有的都作为输入,然后根据某种机制,选出某种结构,这样的搜索空间就太大了!

你可能感兴趣的:(目标检测,神经网络结构)