【心得】图卷积神经网络(GCN)的简单介绍

图卷积神经网络(GCN)的简单介绍


1. 什么是GCN
图卷积神经网络是一种能对图数据进行深度学习的方法。
简单的说,GNN就是其研究的对象是图数据(Graph),研究的模型是卷积神经网络。

2. 为什么使用GCN
与传统方法相比,深度学习的效率更高,而卷积神经网络作为深度学习的最成功的应用之一,其主要限制在于Euclidean data。
什么是Euclidean data? Euclidean data最显著的特征就是“有规则的空间结构”,比如图片是规则的正方形栅格。而这些数据结构能够用一维、二维的矩阵表示,这样一来卷积神经网络就可以高效的进行处理。
但是,我们的现实生活中有很多数据并不具备规则的空间结构,称为Non Euclidean data。比如电子交易、分子结构等抽象出的图谱。这些图谱结构每个节点连接都不尽相同,有的节点有三个连接,有的节点有两个连接,是不规则的数据结构。
举个例子,一个电商的图谱如下:
我们假定有三个节点,分别是顾客,商品以及交易,其中顾客关联的节点可能有个人信息,联系方式等;商品的关联节点则是类目,名称等;而交易关联的节点包括交易内容,时间,收货地址等。这些节点之间的关系,比如顾客除了可以通过交易购买商品,还可以对商品进行评分。这样的图数据我们可以用来做两件事情,一是推荐、二是反欺诈。
【心得】图卷积神经网络(GCN)的简单介绍_第1张图片
可以看到,图谱中的每个节点,都包含特征信息以及结构信息。
总的来说,在图数据里面,我们要同时考虑到节点的特征信息以及结构信息,如果靠手工规则来提取,必将失去很多隐含且复杂的模式。为了能同时学到图的特征信息与结构信息,人们提出了“图卷积神经网络”。

3. 图卷积算子
【心得】图卷积神经网络(GCN)的简单介绍_第2张图片
【心得】图卷积神经网络(GCN)的简单介绍_第3张图片
4. 图卷积算法的过程
共三步:
第一,发射(send): 每个节点将自身的特征信息经过变换后发送给邻居节点。
第二,接收(receive):每个节点将邻居节点的特征信息聚合起来。
第三,变换(transform):把前面的信息聚集之后做非线性变换(ReLu),增加模型的表达能力。
可以发现:
感受域正比于层数。最开始的时候,每个节点包含了直接邻居的信息,再计算第二层时就能把邻居的邻居的信息包含进来,这样参与运算的信息就更加充分。层数越多,感受域就更广,参与运算的信息就更多。

5. GCN的四个特征

  • GCN 是对卷积神经网络在图这个领域上的自然推广。
  • 它能同时对节点特征信息与结构信息进行端对端学习,是目前对图数据学习任务的最佳选择。
  • 图卷积适用性极广,适用于任意拓扑结构的节点与图。
  • 在节点分类与边预测等任务上,在公开数据集上效果要远远优于其他方法。

你可能感兴趣的:(心得)