OctConv

首先参考

https://mp.weixin.qq.com/s/NthR9-iE2jqgufnBtToOHA

然后参考原文

补充理解

(1)这里的核心思想就是低频特征图和高频特征图,在概念上是可以理解的,符合人的思维习惯。在实施上述思想的过程中。对于低频特征图 就选择压缩,压缩之后,特征图的size就会减半!
(2)同时低频特征图和高频特征图之间有交流。高频特征图到低频特征图 就是pooling。低频特征图到高频特征图就是上采样
(3)控制低频图和高频特征图和高频特征图的通道比例就是alpha
注意:在文中 似乎是除了第一层和最后一层,其他的层都是alpha in=alpha out
而第一层中alpha in=0 alpha out=alpha
最后一层 alpha in=alpha alpha out=0
(4)理论上说alpha in与alpha out是独立的
但是由于低频和高频之间的交流文中选择的是pooling和upsampling,这一点限制了alpha in=alpha out
一旦去除低频和高频之间的交流或者采用卷积实现交流,alpha in、alpha out就可以独立取值了

期待

(1)之后待做的工作 可以用神经网络搜索 得到超参数alpha在不同阶段的分布情况,进而可以指导更多工作。
(2)这种结构能否提高目标检测的效果,毕竟 他区分了 高频和低频特征图。

你可能感兴趣的:(神经网络结构,卷积核)