《Diffusion-Convolutional Neural Networks》论文阅读

《Diffusion-Convolutional Neural Networks》论文阅读
DCNN

主要思想：
1. 这是一篇基于空间域的图神经网络，聚合方式通过采样（hop）1~k 阶的邻居并同 self 使用 mean 的方式得到新的 feature-vector
2. 作者将不同的采样距离并聚合的特征堆叠成一个矩阵，这个矩阵才是最终一个 node(or graph/edge) 的 feature-representation
过程图示1

下图展示过程应该更清晰：

上图就是需要输入的图结构以及节点的特征

对 (v_{3})节点进行一阶邻居【((d(3,.)=1))】信息聚合，并同自己进行求 mean ，其中 (w_3^{0}) 就是对应的一阶的训练的 parameters。类似的，还需要处理其他的剩余节点。
通过对5个节点分别进行处理，即经过一层 hidden-layer，输出结果为

类似的，hop 二阶。是在原图的基础上，而不是在已经经过一层的基础上处理

同理将距离变成二阶，就能一样聚合到二阶邻居信息。得到二阶，三阶... k阶

其中的矩阵就是对同一个node的一阶二阶...信息（文中称为diffusion）
如果需要做一个节点分类，则将该矩阵拿出来，再同 (w) 进行 element-wise(or 全连接？) 即可，得到预测的分类

过程图示2

论文内容

以上过程应该蛮好理解的，可是论文其实可以写的更明白，可是参数和图示写的不怎么明白
- 有图 (mathcal{G}={G_t | t in 1...T})，其中 t 表示graph个数，因为论文也适用于graph-classification
- (mathcal{G_t}=(V_t, E_t)) ，也用 (mathcal{X_t}) 表示
- graph中 (N_t) 个节点，每个节点特征维数 (F)
- (P_t) 为归一化的度矩阵，维数(N_t*N_t)，可以理解成概率，或者 mean
其中graph可以是带/不带权重，有/无向图
PS 作者提出该DCNN 可适用于 node/graph/edge-classification，但是实验却只在node上表现还可以，graph上不行，edge甚至没做

我只以node-classification为例
通过一次计算的公式：
- t 表示某一个graph
- i 表示节点序号
- j 表示第几阶（hop）
- k 表示计算节点的某个维数
通过矩阵表示则：

最后的分类，可适用argmax或者softmax（个人觉得可以全连接或者 element-wise）

实验结果和缺点

在node-classification上尚可，edge的实验却没做。实验在graph-classification上表现极差——因为我看作者通过将所有节点求和并平均了一下来表示graph-feature，着就让我想到了GNN上限的一篇论文，即sum的操作是优于mean的【当然对graph-classification了解不多，个人臆想】，mean反而更不容易区分开不同的graph了

这点没看懂，可能需要看更多论文来理解（ε=ε=ε=┏(゜ロ゜;)┛

杂谈

GNN论文看的也不是很多，但是有个奇怪的想法，就是利用edge进行aggregate就算是利用了graph的structural-info 了吗？

参考文献

【1】https://zhuanlan.zhihu.com/p/76669259

【2】https://media.nips.cc/nipsbooks/nipspapers/paper_files/nips29/reviews/1073.html

【3】https://www.youtube.com/watch?v=5eTJ6yxtU5s

【4】https://www.youtube.com/watch?v=eybCCtNKwzA
相关阅读:
动手动脑
 编写一个程序，用户输入两个数，求出其加减乘除，并用消息框显示计算结果
 实验报告
 《大道至简第二章读后感》
《大道至简》第一章读后感
 CentOS 6.x 播放 mp3 音乐 —— 成功
 CentOS下通过rdesktop连接Windows远程桌面
 Linux之文件系统的简单操作
 Linux之档案管理
 如何判断raid1中哪块硬盘损坏？
原文地址：https://www.cnblogs.com/KongHuZi/p/13166639.html

《Diffusion-Convolutional Neural Networks》论文阅读

DCNN

主要思想：

过程图示1

过程图示2

论文内容

实验结果和缺点

杂谈

参考文献