[Paper] || SkipGNN: Predicting Molecular Interactionswith Skip-Graph Networks

一句话总结:【边预测问题】结合二阶相邻图网络预测分子间相似性

Motivation

一般的图神经网络只计算了相邻节点的相似性,但在生物网络中,不直接相连的节点的相似性也会对预测结果产生重要影响。


图1:直接相似性和跳跃相似性

如图1,一般来说,节点A和节点B之间有边相连说明它们是相似的,反之亦然。但是在分子交互网络中,直接相连的实体不是一定相似。不直接交互的节点之间的间接相似性(比如二阶相邻的),已被证明在各种分子网络中有重要作用。比如在一个DTI网络中,药物A和药物B都直接和一个target相连,因此这两个药物是相似的,但是一个药物和一个target并不相似。
这篇论文基于上述概念引入了skip similarity,描述两个节点间的二阶相互作用。

Method

SkipGNN利用原始分子网络二阶相邻网络来预测新的分子相互作用。


图2:SkipGNN网络结构
Skip graph 的构建

SkipGNN构建了新的跳跃图(skip graph),在原图G中二阶相连的邻居在中用边连接,从而可以得到这个skip graph的邻接矩阵:

迭代融合(Iterative fusion)

为了使模型在训练时自动结合direct similarity和skip similarity的信息,产生最终的node embedding。作者同时训练和两张图,使它们互相影响,迭代更新权重,如图2和下方公式所示。


在每一轮的迭代中,node embedding的更新顺序如下:
先结合 和 得到 ,再根据 和 更新 。
最终的node embedding由下式产生:

这里作者没有选择简单的拼接。

SkipGNN decoder

首先得到要预测的节点对(i,j)的node embedding ,使用直接拼接、加和等方式得到一个embedding作为decoder的输入,最后这个combined embedding送入一个二分类神经网络来获得(i,j)有相似性的概率:

SkipGNN 算法流程

图3:SkipGNN算法

Result

比较有趣的部分是SkipGNN 在异构图上可以学到有生物意义的embedding spaces。如图4,在作者使用的DTI数据上,传统GCN不能区分药物和target,但是SkipGNN可以把两者较好地区分开。

图4:DTI网络可视化

如图5,在gene-disease interaction网络上,也有类似的结果。
图5:基因-疾病网络可视化

原文Link: SkipGNN: Predicting Molecular Interactions with Skip-Graph Networks

你可能感兴趣的:([Paper] || SkipGNN: Predicting Molecular Interactionswith Skip-Graph Networks)