2、 Attention U-Net
2.1 structure
2.2 Attention module
Attention U-Net是基于U-Net模型结构的变体,其增加了注意力机制来提高模型在图像分割任务中的性能。与传统的U-Net模型相比,注意力U-Net包括了编码器、解码器和跳跃连接等常见的模块,但在解码器部分引入了注意力机制。
Attention U-Net结构
Attention 结构
Attention 结构图中尤其要注意的是X为解码器的倒数第二层,g为完成上采样的解码器倒数第一层。只有完成上采样后的层才能与X完成后续的加权操作。为了便于理解直接上代码:
def attention_gate(X, g, channel,
attention='add', name='att'):
Self-attention gate modified from Oktay et al. 2018.
attention_gate(X, g, channel, activation='ReLU', attention='add', name='att')
X: input tensor, i.e., key and value.
g: gated tensor, i.e., query.
channel: number of intermediate channel.
Oktay et al. (2018) did not specify (denoted as F_int).
intermediate channel is expected to be smaller than the input channel.
activation: a nonlinear attnetion activation.
The `sigma_1` in Oktay et al. 2018. Default is 'ReLU'.
attention: 'add' for additive attention; 'multiply' for multiplicative attention.
Oktay et al. 2018 applied additive attention.
name: prefix of the created keras layers.
X_att: output tensor.
1. 将输入张量 X 通过一个卷积层映射到中间层 theta_att。
2. 将门控张量 g 通过一个卷积层映射到中间层 phi_g。
3. 使用指定的注意力机制(additive 或 multiplicative)根据 theta_att 和 phi_g 计算 Q,即 query。
4. 对 Q 进行指定的非线性激活函数处理(如 ReLU),得到 f。
5. 将 f 经过卷积层转换到输出通道数为 1 的 tensor psi_f。
6. 对 psi_f 输出进行 sigmoid 激活操作,得到注意力系数 coef_att。
7. 对输入张量 X 乘以 coef_att 得到加权后的张量 X_att。返回 X_att。
activation_func = eval(activation)
attention_func = eval(attention)
# mapping the input tensor to the intermediate channel
# x输入完成卷积操作
theta_att = Conv2D(channel, 1, use_bias=True, name='{}_theta_x'.format(name))(X)
# mapping the gate tensor
# g输入完成卷积操作
phi_g = Conv2D(channel, 1, use_bias=True, name='{}_phi_g'.format(name))(g)
# ----- attention learning ----- #
# 将[conv—x,conx-g] -> add
query = attention_func([theta_att, phi_g], name='{}_add'.format(name))
# nonlinear activation
# 对 Q 进行指定的非线性激活函数处理(如 ReLU),得到 f。
f = activation_func(name='{}_activation'.format(name))(query)
# linear transformation
# 将 f 经过卷积层转换到输出通道数为 1 的 tensor psi_f。
psi_f = Conv2D(1, 1, use_bias=True, name='{}_psi_f'.format(name))(f)
# ------------------------------ #
# sigmoid activation as attention coefficients
# 对psi_f输出进行sigmoid激活操作,得到注意力系数coef_att。
coef_att = Activation('sigmoid', name='{}_sigmoid'.format(name))(psi_f)
# multiplicative attention masking
# 对输入张量 X 乘以 coef_att 得到加权后的张量 X_att。返回 X_att。
X_att = multiply([X, coef_att], name='{}_masking'.format(name))
return X_att
【语义分割系列:七】Attention Unet 论文阅读翻译笔记 医学图像 python实现_attention unet论文_鹿鹿最可爱的博客-CSDN博客