darknet53网络结构及配置文件对比

探讨下 https://blog.csdn.net/zhqh100/article/details/94737221 下各位大神的提问,darknet里面有没有maxpooling层,只是探讨,如有错误也请指出

通过以下几个方向来分析

1. 我最初学习该网络结构是通过mxnet来学习的,因为其官方库中包含了yolov3的代码,比较容易上手,而且直接支持 TensorFlow 这边的 eager 模式,mxnet上面应该是叫做 imperative,即命令式编程,http://zh.gluon.ai/chapter_computational-performance/hybridize.html,方便调试打印,而 TensorFlow 还没找到官方的 yolov3 的工程,虽然有民间大神做的

根据https://github.com/pjreddie/darknet/blob/master/cfg/yolov3.cfg 中的配置来找 https://blog.csdn.net/zhqh100/article/details/94737221中的网络结构直接的对应关系,

yolov3.cfg中有五处 # Downsample 的注释,其中对应的参数均为 stride=2,其对应的 filters 为:

37行:filters=64

67行:filters=128

117行:filters=256

288行:filters=512

463行:filters=1024

而 https://blog.csdn.net/zhqh100/article/details/94737221 中,对应下采样的几行:

第12行:Conv2D-4 (1, 64, 256, 352)

第24行:Conv2D-14 (1, 128, 128, 176)

第44行:Conv2D-31 (1, 256, 64, 88)

第113行:Conv2D-90 (1, 512, 32, 44)

第182行:Conv2D-149 (1, 1024, 16, 22)

可见filter是完全对应的,所以这个网络结构不是瞎编的,确实是通过卷积时的stride=2来实现的

 

 

2. 网上有看到文章,链接为https://blog.csdn.net/haoqimao_hard/article/details/82109015, 包含如下图片

darknet53网络结构及配置文件对比_第1张图片

其中的Convolutional 512 3 X 3 / 2,应该是一目了然,确实是通过conv的stride来下采样的

 

主要是懒得看代码了,所以通过一些简单的分析,来互相验证(*^▽^*)

本文完

——————————————————————————————————————

 

闲聊

*  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  *  * 

各位要修改网络结构吗?我觉得像 darknet 这样的结构,也没有那么神圣吧,感觉不过就是一些卷积、池化、残差互相的堆积,自己拼凑一下也能搞出一个神经网络结构,提高步长和池化都可以达到下采样的类似效果,不一定哪个结构就一定比另一个结构准确率更高吧,所以,个人觉得,何必这么纠结  ^_^

 

我现在比较喜欢MobileNet

你可能感兴趣的:(MXNET,TensorFlow)