MixConv 神经网络简介与代码实战

1.介绍

    MixConv是谷歌大牛Quoc V. Le的在AutoML领域的又一力作 ,论文的名字:Mixed Depthwise Convolutional Kernels,通过名字,我们就可以知道该论文的核心所在,混合分离卷积,其实,看到这里之后,我觉论文就可以粗看一下就行,谷歌很多论文,方法简单粗暴好用,思想巧妙,容易懂。

 

2.模型结构

    作者提出一种混合深度分离卷积(MDConv),它将不同尺寸卷积核混叠到同一个卷积OP单元中,故而它可以轻易的捕获不同分辨率的特征模式,在下图中,a图是普通分离卷积,b图是结合了多个不同尺寸的分离卷积,这个思想和GoogLeNet有点相似,GoogLeNet可以参考我写的文章:https://blog.csdn.net/u013289254/article/details/95511079

MixConv 神经网络简介与代码实战_第1张图片

 

3.代码实现

def mdconv(x, filters, **args):
    G = len(filters)
    y = []
    for xi, fi in zip(tf.split(x, G, axis=-1), filters):
        y.append(tf.nn.depthwise_conv2d(xi, fi, **args))
    return tf.concat(y, axis=-1)

 

你可能感兴趣的:(深度学习CNN基本模型)