胶囊网络是 vector in vector out的结构,最后对每个不同的类别,输出不一个向量,向量的模长表示属于该类别的概率。
例如,在数字识别中,两个数字虽然重叠在一起,Capsule中的两个向量能完整表达两个数字的特征,虽然有些特征重叠在一起导致难以分辨。
因为胶囊网络中:用向量模的大小衡量某个实体出现的概率,模值越大,概率越大。
更加形象的解释:https://blog.csdn.net/godwriter/article/details/79216404
MNIST数据集中,胶囊网络(CapsGNN)输出性能远超CNN,胶囊网络的其他应用:
1、通过胶囊网络抵御对抗性攻击
2、胶囊网络+图卷积GCN的图分类能力
3、胶囊网络+注意力机制=零样本意图识别
关于胶囊网络的相关学术论文还有不少,比如基于胶囊网络的手势识别,正确率达到94.2%,能够帮助听障人群进行更有效地沟通;以及在ICLR 2019上发表的图片分类新框架胶囊图神经网络(CapsGNN),也是将胶囊网络与图神经网络(GNN)结合的新模型。
https://zhuanlan.zhihu.com/p/66923740
苏剑林博客: