论文阅读5 Cv-CapsNet:Complex-Valued Capsule Network

原论文链接: Cv-CapsNet:Complex-Valued Capsule Network

Abstract

胶囊网络像人类视觉系统一样编码整体和部分的关系并且在图像处理任务中已经获得了较好的结果。然而,复数更具有代表性时却受到了限制。因此,文章中提出两种结构,Complex-Valued Dense CapsNet(Cv-CapsNet)和Complex-Valued Diverse CapsNet(Cv-CapsNet++),每个都包含三个阶段。第一阶段,多尺度的复数特征通过restricted dense complex-valued subnetwork。为了更加适应更复杂的数据集,Cv-CapsNet++融合一个三层的Cv-CapsNet等级模型去挖掘多尺度高层次的特征。第二阶段,复数的特征会被编码进复数Primary Capsules中,尤其,Cv-CapsNet++编码不同等级的复数特征到多维复数Primary Capsules。第三阶段,文章中生成了动态路由的算法去生成复数的domain并且在Primary Caps中和成了实部和虚部。实验结果证明提出的框架需要更少的参数,得到了更好的表现,在训练过程中,使用相同的数据集,比实数的CapsNet需要更少的迭代次数。

1 Introduction

胶囊网络放弃了下采样层去保护位置和姿势信息,用胶囊和转换矩阵实现了旋转不变性。通过稠密连接网络,将CapsNet中的卷积层替换为8层的dense convolution子网络去适应更复杂的数据集。

Complex-Valued CapsNet

(1)Restricted dense complex-valued convolution subnetwork
论文阅读5 Cv-CapsNet:Complex-Valued Capsule Network_第1张图片
虽然复数的实部和虚部是分开的两个部分,但是每复数的实部和虚部以前馈的方式分别被级联进实数部分和虚数部分,然后最终全部会被加到complex-valued convolution layer。利用这个网络去挖掘多尺度的特征,主要包括原始特征、架构特征和语义特征。
论文阅读5 Cv-CapsNet:Complex-Valued Capsule Network_第2张图片
(2)complex-valued capsule encoding unit and complex-valued dynamic routing subnetwork
complex-valued capsule是一组complex-valued神经元,其中活动向量可以表示为
在这里插入图片描述
其中,
论文阅读5 Cv-CapsNet:Complex-Valued Capsule Network_第3张图片
uj的长度表示的是一个实体存在的可能性,事实上用一个实数向量,
在这里插入图片描述
复数胶囊编码单元将特征挖掘阶段的输出当作输入,相同的complex-valued convolution kernels将会编码成相同的complex-valued胶囊,实数部分和虚数部分最终会被分成几个部分,最后级联一个实部部分和虚部部分组成一个Primary Capsules。
论文阅读5 Cv-CapsNet:Complex-Valued Capsule Network_第4张图片
论文阅读5 Cv-CapsNet:Complex-Valued Capsule Network_第5张图片
来自同一个complex-valued的实部和虚部有相同的Wij,也因为这样减少了一半的训练参数。
论文阅读5 Cv-CapsNet:Complex-Valued Capsule Network_第6张图片
Cv-CapNet
论文阅读5 Cv-CapsNet:Complex-Valued Capsule Network_第7张图片
Cv-CapsNet++:可以从原图中挖掘更多更高层次的信息,是一个三层的Cv-CapsNet等级模型,Cv-CapsNet的输出作为第二个Cv-CapsNet的输入,输出为第三个Cv-CapsNet的输入。不同等级Complex-Valued的特征会被编码进不同维度的胶囊中,低层次的复数特征会被编码进高维度的complex-valued primary capsules,高层次complex-valued特征会被编码进低维度的complex-valued primary capsules,最终从高层到低层获得16D,12D,8D的complex-valued primary capsule。主要有两个原因,人脸识别低层次的特征是更多样的,高层次的特征更具有差异性。第二个原因是文章中融合低层次的数字胶囊和高层次的数字胶囊到最后的数 字胶囊表示物体存在的可能性。

你可能感兴趣的:(论文阅读5 Cv-CapsNet:Complex-Valued Capsule Network)