0 - 背景
今年来卷积网络在计算机视觉任务上取得的显著成果,但仍然存在一些问题。去年Hinton等人提出了使用动态路由的新型网络结构——胶囊网络来解决卷积网络的不足,该新型结构在手写体识别以及小图像分类上取得了不错的效果。其成功的原因在于它使用了动态路由算法替代了卷积网络中的池化层从而减少了信息的丢失并且允许捕捉数据中的部分-整体关系,同时,使用胶囊作为网络的基本单位替代了神经元,从而使得网络可以学习除了特征之外的更多的信息(如空间角度、大小量级、特征提取的其它属性等)。
基于胶囊网络的初步成功,我们第一次将其应用到图像分割任务上,改进动态路由算法从而减少了参数,并且构造新的结构使得胶囊网络具备了处理大图片的能力。
1 - 贡献
- 第一次在会议上提出将胶囊网络应用在目标分割上面
- 在原先的动态路由算法上提出了两个改进
- 子胶囊只能在一个定义的本地窗口路由到父胶囊
- 网络中同一类型的胶囊的转换矩阵共享
- 可以处理大尺度图片(512×512),之前的胶囊网络结构最大处理32×32大小的图片
- 我们介绍了“deconvolutional”胶囊的概念并且提出了一个新颖的deep convolutional-deconvolutional胶囊网络架构
- SegCaps在LIDC-IDRI数据集的LUNA16子集上的肺部分割效果有所提升
2 - 整体思路
2.1 - 动态路由算法改进
Hinton提出的原始的胶囊网络中,胶囊间的路由相当于做一个全连接映射,每一条路由路径都需要上一层胶囊和下一层胶囊的所有维度的全连接映射,从而使得参数量特别大,可以用如下图解直观解释。
而这篇论文中,作者提出在映射的时候,通过窗口控制和同一胶囊(同一类型胶囊)共享权重的方法,减少参数,其实可以理解为,在底层的每一个胶囊内做卷积,每一个胶囊都卷出与高层的所有胶囊维度相同的张量,而后对于每一个底层胶囊卷出来的结果做路由选择(更新耦合系数$c_{ij}$),通过下图进行直观理解。
3 - 实验
参数少,效果好!
4 - 结论
- 提出了用于目标分割的新颖的深度学习模型——SegCaps,在具有挑战性的肺部CT图像分割数据集上效果很好(参数少,效果好)
- 改进了胶囊网络原本的动态路由算法使得参数量大大较少并且增大了允许接受的输入图片的尺度
- 提出胶囊反卷积层,从而构造新颖的胶囊卷积-胶囊反卷积的架构
- 扩展了目标类的掩码重构作为分割问题的正则化策略