每天五分钟计算机视觉:GoogLeNet的核心模型结构——Inception

本文重点

当构建卷积神经网络的时候,我们需要判断我们的过滤器的大小,这往往也作为一个超参数需要我们进行选择。过滤器的大小究竟是 1×1,3×3 还是 5×5,或者要不要添加池化层,这些都需要我们进行选择。而本文介绍的Inception网络的作用就是代替你来决定,把它变成参数的一部分,虽然网络架构因此变得更加复杂,但网络表现却非常好。

不同卷积核的介绍

我们使用64个1*1的卷积核对其进行操作(same 卷积),我们假设输出为28*28*64,得到第一个输出

每天五分钟计算机视觉:GoogLeNet的核心模型结构——Inception_第1张图片

我们使用3*3的卷积核对其进行操作(same 卷积),我们假设输出是 28×28×128。从而得到第二个值。然后我们把第二个值堆积到第一个值上

每天五分钟计算机视觉:GoogLeNet的核心模型结构——Inception_第2张图片

使用5*5的卷积核对其进行操作(same 卷积),假设输出变成 28×28×32,从而得到第三个值,然后我们把第三个值再次堆积。

每天五分钟计算机视觉:GoogLeNet的核心模型结构——Inception_第3张图片

或许我们不想对图片进行卷积操作

你可能感兴趣的:(计算机视觉,计算机视觉,人工智能,卷积神经网络,GoogleNet,Inception)