图神经网络-学习日志2

传统图表的机器学习:

结点级别的预测任务
链接级的预测结点是否连接
图级预测对整个图进行预测

假设:

  1. 结点已经具有与它们相关联的某种类型的属性
  2. 创建额外的功能来描述这个特定的结点是定位在网络的其余部分,以及定义了图的网络拓扑结构的额外的特征

两种特征:

  1. 结构特征
  2. 描述结点的attributes和properties的特征

传统机器学习管道:
图神经网络-学习日志2_第1张图片|
|
|
所以特征设计非常重要,直接影响预测的准确率。
三种不同情况下的传统的特征设计:

  1. 点级预测
  2. 边(一对点)

为了简单起见,使用无向图。
图神经网络-学习日志2_第2张图片由于只靠度数无法区分无向图的点在整个图中的重要性(存在度数相同的情况),因此可以考虑采用其他的方式:
图神经网络-学习日志2_第3张图片特征向量中心性Eigenvector centrality:

平均归一化邻居的重要性,即根据邻居的重要性判断自身的重要性

介数中心性Betweenness centrality:

累加(两节点最短路径上存在该节点/所有的两节点间最短路径),即如果结点位于许多最短路径上,则该节点很重要

紧密中心性Closeness centrality:

1/累加(其他结点和该节点之间的最短路径),即如果一个结点有小的最短路径长度到其他结点,则说明它很重要(处于中心)

|
|
|

回过头讨论结点度数:

衡量结点周边的局部结构,一般采用“聚类系数”,它衡量一个人的邻居之间的联系程度,它∈[0,1],0意味着该节点的周边结点之间没有直接联系,1意味着全连接。

聚类系数同时数出自我中心网络中ego-network有多少个三元组结点,描述了点的graphlets属性
三角特征在社交网络中很重要,因为我的朋友的朋友也是我的朋友。

graphlets是一个有根连接的非同构子图,一般对于指定数目的结点来构造相应结点数目的各种子图并区分子图中各种类型的结点:
图神经网络-学习日志2_第4张图片5个结点上有73个graphlets。
当结点数为2时,可以构成一种子图,图中只有一类结点,两个结点同质
当结点数为3时,可以构成两种子图,包含三类结点

定义graphlets度向量GDV:根据给定的结点数给定graphlets出现的次数

度数计量结点接触的边数,聚类系数计算结点接触或参与的三角形的个数,GDV计量一个点参与的graphlets的数量。

图神经网络-学习日志2_第5张图片总结,一个结点的重要性可以从两方面考虑:

  1. 重要性
  2. 图拓扑结构
  3. graphlets很重要,因为它可以表述给定结点周边的网络结构

你可能感兴趣的:(GNN,神经网络,学习)