SENet网络框架

一、SENet网络框架

Squeeze-and-Excitation Networks

  • 论文链接:https://arxiv.org/abs/1709.01507
  • 论文代码:https://github.com/hujie-frank/SENet

二、SENet算法

1、SE block结构图
SENet网络框架_第1张图片
2、SE block实现公式
在这里插入图片描述
F t r F_{tr} Ftr是卷积操作, V = [ v 1 , v 2 , … , v c ] V=[v_1,v_2,…,v_c] V=[v1,v2,,vc]是一组滤波器, v c v_c vc是第c个滤波器的参数,输出 U = [ u 1 , u 2 , . . . , u c ] U=[u_1,u_2,...,u_c] U=[u1,u2,...,uc]
SENet网络框架_第2张图片
3、Squeeze
SENet网络框架_第3张图片
Squeeze操作就是在得到U(多个feature map)之后采用全局平均池化操作对其每个feature map进行压缩,使其 C C C个feature map最后变成 1 ∗ 1 ∗ C 1*1*C 11C的实数数列;

4、Excitiation
在这里插入图片描述
δ \delta δ是ReLU激活函数, σ \sigma σ是sigmod激活函数; W 1 ∈ R C r × C W_1 \in \Bbb R^{\frac{C}{r}\times C} W1RrC×C W 2 ∈ R C × C r W_2 \in \Bbb R^{C\times \frac{C}{r}} W2RC×rC

为了限制模型复杂度和辅助泛化,论文通过引入两个全连接(FC)层(都是 1 ∗ 1 1*1 11的conv层),即降维层参数为 W 1 W_1 W1,降维比例为r(论文把它设置为16),然后经过一个ReLU,然后是一个参数为 W 2 W_2 W2的升维层。
在这里插入图片描述
最后得到 1 ∗ 1 ∗ C 1*1*C 11C的实数数列结合U通过上式进行Scale操作得到最终的输出。

4、两种模型
SENet网络框架_第4张图片
SENet网络框架_第5张图片

你可能感兴趣的:(计算机视觉)