Junjian Zhang

Cluster-GCN阅读笔记

文章目录

Abstract
Introduction
Previous GCN Training Algorithm
Bachground

Graph Convolutional Neural

Cluster-GCN

Why does vanilla mini-batch SGD have slow per-epoch time?
Embedding utilization can reflect computational efficiency

Vanilla Cluster-GCN

Time and Space complexity

Stochastic Multiple Partitions

Issues of training deeper GCN
Experiment
Training Deeper GCN
Conclusion

Abstract

大规模GCN的训练：目前基于SGD的gcn算法，1）面临随着gcn层数增长，计算复杂度呈指数增长；2）需要保存整个Graph和每个node的embedding，存储量巨大。

本文提出了一种基于Graph聚类结构结构，且基于SGD训练的GCN算法：Cluster-GCN。在每一个步骤中，Cluster-GCN通过graph聚类算法来筛选联系紧密的sub-graph，从而在sub-graph中的一组node进行采样，并且限制该sub-graph中的邻居搜索，可以显著提高搜索效率。

在Amazon2M数据集：200万个node，6100万个边，比Reddit大五倍，实验了三层四层gcn。

Introduction

**对于Graph，GCN网络通过Graph Convolutional Neural逐层地获取节点的embedding：在每一层的每一个节点的embedding，需要采集下一层相邻节点的embedding进行激活。最后一层的embedding将用于一些最终任务。**例如在Graph Classification中，最后一层embedding被输入到分类器（如softmax）来预测各个节点的标签。

需要注意地是，由于GCN运算需要利用graph中节点之间地交互来学习更新embedding，这使得GCN的训练非常有挑战性。与cnn等网络不同，训练loss可以完美地分解为每个样本单独影响（decomposed into individual terms），GCN的损失函数必须依赖大量的其他节点。特别是GCN变深时，由于这种节点依赖，GCN的训练变得非常慢–反向传播时需要计算Graph上的所有embedding。

Previous GCN Training Algorithm

1、 GCN开山之作：Semi-Supervised Classification with Graph Convolutional Networks，应用全批次梯度下降法（Full-batch Gradient Descent），需要计算整个梯度，存储所有节点的embeddings，导致 $O (N F L)$ 内存需求。由于每个epoch只更新一次参数，梯度下降的收敛速度非常慢。

2、Graph-SAGE：Inductive Representation Learning on Large Graphs，提出了mini-batch SGD。由于每次更新参数仅仅基于一个batch的梯度，大大降低了内存需求，并且可以在每个epoch执行多次更新，从而加快了收敛速度。Graph-SAGE存在节点邻居扩展问题，需要计算节点的邻居节点在L-1层的embeddings，而这些邻居节点又需要求在L-2层的embeddings，周而复始，这导致大量的计算复杂度。Graph-SAGE同过在各层的反向传播过程中固定大小的邻居节点，降低了复杂度。

3、VR-GCN采用减小Variance方法来减小邻域采样节点的大小。尽管成功地减小了采样大小，但仍然需要将所有节点的中间embedding，导致 $O (N F L)$ 的内存需求。如果节点数量增加到数百万个，那么对于内存要求过高。

本文利用Graph的聚类结构，目的是划分节点的分区，使同一分区中的节点之间sub-Graph的链接，比不同分区更多。一个mini-batch算法的效率，由embedding utilization（嵌入利用率）来描述：与一个batch或者within-batch的节点之间的链接数量成正比。

Cluster-GCN在大型Graph上实现了最好的内存使用，特别是在deep GCN上；
对于浅层网络（2层），Cluster-GCN可以达到与VR-GCN类似的训练速度。但当网络加深时（4层），可以比VR-GCN更快。这是因为Cluster-GCN的复杂度与网络层数L成线性关系，而VR-GCN时指数关系。
Cluster-GCN能够训练一个非常深且极大规模的网络。

Bachground

Graph Convolutional Neural

GCN中的每一层通过考虑相邻节点的embedding，来更新Graph中的每个节点的特征向量表示。具体来说，GCN的逐层正向传播可以总结为：
$X^{(l+1)}=f(X^l,A)=\delta(\hat D^{-\frac{1}{2}}\hat A\hat D^{-\frac{1}{2}}X^{(l)}W^{(l)})$

$X$ 是所有节点的特征向量构成的特征矩阵（每一行表示一个节点的特征）；
$X^{(l)}$ 和 $X^{(l+1)}$ 分别是 $l$ 层的输入和输出矩阵， $X^{(l)}$ 代表第 $l$ 层对应节点的embedding；
$A$ 是Graph的邻接矩阵；
$\hat A=A+I_N$ 是带有自环的无向图的邻接矩阵；
$\hat D_{ii}=\sum_{j}\hat A_{ij}$ 是度量矩阵；
$W^{(l)}$ 是一个可训练权重矩阵或参数矩阵；
$\delta(\cdot)$ 是激活函数，如ReLU等。

$Z^{(l+1)}=A^{'}X^{(l)}W^{(l)},\\ X^{(l+1)}=\delta(Z^{(l+1)}).$

损失函数
$\mathcal{L}=\frac{1}{|\mathcal{Y}_\mathcal L|\sum_{i\in \mathcal{Y}_\mathcal L}}\text{Loss}(y_i,z^L_i),$

$\mathcal{Y}_\mathcal L$ 是部分有标签的节点的标签；
$z^L_i$ 是ground-truth标签为 $y_i$ 的 $Z^L$ 的第 $i$ 行，表示节点 $i$ 的最终预测；
Cross-Entropy Loss。

Cluster-GCN

batch_size= $|\mathcal{B}|$ 表示一个batch的节点，使用基于mini-batch的SGD：
$\frac{1}{|\mathcal{B}|}\sum_{i\in \mathcal B}\nabla\text{Loss}(y_i,z^L_i),$
需要注意的是，尽管基于mini-batch的SGD在每个epoch收敛得更快，但由于引入了另一个计算开销，所以比Full Gradient Descent要慢。

Why does vanilla mini-batch SGD have slow per-epoch time?

考虑计算一个节点 $i$ 相关的梯度： $\nabla\text{Loss}(y_i,z^L_i)$ 。显然，需要存储节点 $i$ 的embedding，而节点 $i$ 的embedding的计算依赖于， $L - 1$ 层的邻居节点的embeddings。**假设一个 $L$ 层的GCN网络，每个节点的平均度数为 $d$ ，为了获得节点 $i$ 的相关梯度，需要对Graph中的一个节点聚合 $O(d^L)$ 个节点的特征。**换句话说，需要获取Graph中节点的 $hop-k(k=1,\dots,L)$ 邻居节点的信息来执行一次更新。

Embedding utilization can reflect computational efficiency

嵌入利用率用来反应计算效率。

如果节点 $i$ 在第 $l$ 层得embedding： $z^{(l)}_i$ ，在计算第 $l + 1$ 层得embeddings时被重复使用了 $u$ 次，那么 $z^{(l)}_i$ 的嵌入利用率就是 $u$ 。

为了使mini-batch SGD工作，以前的方法试图限制邻域扩展的数量，但是这并没有提高嵌入使用率。

GraphSAGE使用一个固定大小的均匀采样来确定邻居节点集，而不是使用一个完整的邻域集合；
FastGCN提出了一种改进梯度估计的重要采样策略；
VR-GCN提出了一种策略来存储所有 $N$ 个节点和 $L$ 层在先前计算的embedding，并对未采样的邻居节点重复利用。

Vanilla Cluster-GCN

在mini-batch SGD更新中，尝试设计一个batch和相应的计算sub-graph来最大限度地提高embedding utilization。Cluste-GCN通过将embedding utilization连接到一个聚类目标上来实现。

对于一个Graph： $\mathcal G$ ，把节点分成 $c$ 个组： $V=[V_1,\dots,V_c]$ ，这样就会得到 $c$ 个sub-graph：
$\overline G=[G_1,\dots,G_c ]=[\{V_1,E_1\},\dots,\{V_c,E_c\}]$

每个 $E_t$ 只包含在 $V_t$ 中的节点之间的边；

对节点进行重组后，邻接矩阵被划分为 $c^2$ 个子矩阵：
$KaTeX parse error: Undefined control sequence: \label at position 142: …x} \right] \̲l̲a̲b̲e̲l̲{eq:a}$
其中
$\bar A=\left[ \begin{matrix} A_{11}&\dots&0\\ \vdots&\ddots&\vdots\\ 0&\dots&A_{cc} \end{matrix} \right]， \Delta=\left[ \begin{matrix} 0&\dots&A_{1c}\\ \vdots&\ddots&\vdots\\ A_{c1}&\dots&0 \end{matrix} \right]$
对角块 $A_{tt}$ 是一个包含的边在sub-graph $G_t$ 内 $|V_t|\times|V_t|$ 维的邻接矩阵；
$\bar A$ 是 $\bar G$ 的邻接矩阵；
$A_{st}$ 包含了两个部分 $V_s$ 和 $V_t$ 之间的边；
$\Delta$ 是由 $A$ 的所有非对角块组成的矩阵。

类似的，将特征矩阵 $X$ 和训练矩阵 $Y$ 根据区分 $[V_1,\dots,V_c]$ 分组为 $[X_1,\dots,X_c]$ 和 $[Y_1,\dots,Y_c]$ 。

块对角近似的好处是GCN的目标函数可以分解成不同的batches(clusters)。设 $\bar{A^{'}}$ 为 $\bar A$ 的归一化版本，则最终embedding矩阵由 $\bar A$ 的块对角形式变成（ $\bar{A^{'}_{tt}}$ 是 $\bar{A^{'}}$ 的块对角）：
$KaTeX parse error: No such environment: equation at position 8: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \begin{aligned…$
损失函数也被分解成：
$KaTeX parse error: Undefined control sequence: \label at position 163: …ss}(y_i,x^L_i) \̲l̲a̲b̲e̲l̲{eq:step2}$
然后Cluster-GCN基于公式 $KaTeX parse error: Undefined control sequence: \eqref at position 1: \̲e̲q̲r̲e̲f̲{eq:step1}$ 和 $KaTeX parse error: Undefined control sequence: \eqref at position 1: \̲e̲q̲r̲e̲f̲{eq:step2}$ 中的分解形式。**在每一步中，对一个聚类 $V_t$ 进行采样，然后根据 $\mathcal L_{\bar{A^{'}}}$ 的梯度进行SGD更新，**这只需要当前batch上的sub-graph $A_{tt}，X_t,Y_t$ 和模型 $\{W^{(l)}\}^L_l$ 。

Cluster-GCN使用了Graph聚类算法来划分Graph。Graph聚类的方法，如metis和graclus等，旨在在Graph中的顶点上构建分区，使得簇内连接远大于簇间连接，从而更好的捕捉聚类和区分结构。

embedding utilization相当于每个batch的簇内的连接。每个节点及其相邻节点通常位于同一个簇中，因此经过几次跳跃后，高概率的邻域节点仍然位于同一个簇中；
由于使用 $A$ 的对角近似 $\bar A$ 取代 $A$ ，并且误差和簇间的连接成正比，所以要找到一种分区方法最小化簇间连接的数量。

在上图中，全图 $G$ 和聚类分区图 $\bar G$ 来进行邻域展开，如右边所示，Cluster-GCN可以避免大量的邻域搜索，而集中在每个簇中的邻居上。

Time and Space complexity

由于在分区 $V_t$ 中的节点，只连接 $V_t$ 中的节点，所以每个节点不需要再 $A_{tt}$ 外部执行邻居搜索。对每个batch的计算将很纯粹的只是 $\bar{A_{tt}^{'}}X^{(l)}W^{(l)}$ 的矩阵乘积和一些element-wise的操作，时间复杂度低。并且每个batch只需要计算 $O (b L)$ 的embeddings，是线性的，存储要求也低。

Stochastic Multiple Partitions

Cluster-GCN实现了良好的计算和内存复杂性，却存在两个问题：

Graph被分割后，一些链接（等式 $KaTeX parse error: Undefined control sequence: \eqref at position 1: \̲e̲q̲r̲e̲f̲{eq:a}$ 中的 $\Delta$ 部分）被删除。因此，性能可能会受影响。
图聚类算法往往将相似的节点聚集在一起，因此聚类的分布可能不同于原始数据集，从而导致在执行SGD更新时对full gradient的估计有偏差。

随即多聚类方法，在簇与簇之间进行合并，减少batch间的差异（variance）。首先用一个较大的p值把图分割为 $V_1,\dots,V_p$ ，然后对于SGD更新重新构建一个batch $B$ ，而不是只考虑一个簇。随机的选择q个簇： $t_1,\dots,t_q$ ，并把它们的节点 $V_{t_1}\cup\dots\cup V_{t_q}$ 包含在这个batch $B$ 中。此外，在选择的簇之间的连接：
$A_{ij}|i,j\in t_1,\dots,t_q$
被添加回去。这样，簇间的连接会被重新合并，使得batch之间的差异更小。

Issues of training deeper GCN

类似与Resnet的跳接：
$Z^{(l+1)}=A'X^{(l)}W^{(l)},\\ X^{(l+1)}=\delta(Z^(l+1))+X^{(l)}$
本文通过放大每个GCN层中使用的邻接矩阵 $A$ 的对角部分，实现在每个GCN层的聚合中对上一层的表示施加更多的权重，如将单位矩阵添加到 $\bar A$ 中：
$Z^{(l+1)}=(A'+I)X^{(l)}W^{(l)},\\ X^{(l+1)}=\delta(Z^{(l+1)}),\\ X^{(l+1)}=\delta((A'+I)X^{(l)}W^{(l)})$
进而提出对角增强（diagonal enhancement）：

首先向原始 $A$ 添加一个单位矩阵，然后标准化：
$\tilde A=(D+I)^{-1}(A+I)$
$X^{(l+1)}=\delta((\tilde A+\lambda\text{diag}(\tilde A))X^{(l)}W^{(l)})$

Experiment

Training Deeper GCN

多层GCNs，在下表中对比了Cluster-GCN和VRGCN:

对比发现，VRGCN由于其邻域查找的代价呈指数增长，而Cluster-GCN线性增长。

通过对Cluster-GCN的归一化方法，可以进行更深的训练，对于PPI数据集，Cluster-GCN可以通过训练一个包含2048个隐藏单元的5层GCN来达到最先进的效果。对于Reddit数据集，使用了一个包含128个隐藏单元的4层GCN。

Conclusion

此文提出了一种新的训练算法Cluster-GCN。实验结果表明，该方法可以在大型图上训练非常深的GCN，例如在一个超过200万个节点的图上，使用2G左右的内存训练时间不到1小时，精度达到90.41 (F1 score)。使用该方法，能够成功地训练更深入的GCNs，它可以在PPI数据集和Reddit数据集上获得最先进的测试F1 score。

arXiv综述论文“Graph Neural Networks: A Review of Methods and Applications” 硅谷秋水自动驾驶
arXiv于2019年7月10日上载的GNN综述论文“GraphNeuralNetworks:AReviewofMethodsandApplications“。摘要：许多学习任务需要处理图数据，该图数据包含元素之间的丰富关系信息。建模物理系统、学习分子指纹、预测蛋白质界面以及对疾病进行分类都需要一个模型从图输入学习。在其他如文本和图像之类非结构数据学习的领域中，对提取的结构推理，例如句子的依存关系
基于图的推荐算法(12):Handling Information Loss of Graph Neural Networks for Session-based Recommendation 阿瑟_TJRS
前言KDD2020,针对基于会话推荐任务提出的GNN方法对已有的GNN方法的缺陷进行分析并做出改进主要针对lossysessionencoding和ineffectivelong-rangedependencycapturing两个问题：基于GNN的方法存在损失部分序列信息的问题，主要是在session转换为图以及消息传播过程中的排列无关(permutation-invariant)的聚合过程中造
GNN会议&期刊汇总（人工智能、机器学习、深度学习、数据挖掘） Bunny_Ben 科研方法&心得人工智能机器学习深度学习笔记神经网络数据挖掘
会议【NeurIPS】全称ConferenceonNeuralInformationProcessingSystems（神经信息处理系统大会），机器学习和计算神经科学领域的顶级学术会议，CCFA。【ICLR】全称InternationalConferenceonLearningRepresentations（国际学习表征会议），深度学习顶会。【AAAI】由人工智能促进协会AAAI（Associat
图神经网络实战（18）——消息传播神经网络盼小辉丶图神经网络从入门到项目实战 pytorch 深度学习图神经网络
图神经网络实战（18）——消息传播神经网络0.前言1.消息传播神经网络2.实现MPNN框架小结系列链接0.前言我们已经学习了多种图神经网络(GraphNeuralNetworks,GNN)变体，包括图卷积网络(GraphConvolutionalNetwork,GCN)、图注意力网络(GraphAttentionNetworks，GAT)和GraphSAGE等。在本节中，我们将对这些变体GNN结构
[Scene Graph] 图神经网络的核心方法——Message Passing 风中摇曳的小萝卜 Scene Graph 神经网络深度学习机器学习人工智能
GNN中的MessagePassing方法解析一、GNN中是如何实现特征学习的？深度学习方法的兴起是从计算图像处理（ComputerVision）领域开始的。以卷积神经网络（CNN）为代表的方法会从邻近的像素中获取信息。这种方式对于结构化数据（structureddata）十分有效，例如，图像和体素数据。但是，CNN的处理方式对于类似图（graph）数据则并不适用。对于一个图而言，类似图像像素的邻
GNN的理解难点：一种不同于传统神经网络的复杂性小桥流水---人工智能人工智能深度学习机器学习算法神经网络人工智能深度学习
图神经网络（GNN）已经成为深度学习领域的一颗新星，它在处理图形数据方面显示出了巨大的潜力和优势。然而，许多研究者和开发者发现GNN比传统的神经网络更难以理解和掌握。本文将探讨GNN的理解难点，以及它与传统神经网络在概念和实现上的主要差异。一、图数据的复杂性首先，GNN之所以难以理解，一个重要原因在于它处理的数据结构——图。图是一种复杂的数据结构，包含节点（node）和边（edge），这些节点和边
图神经网络GNN的前世今生小桥流水---人工智能 Python程序代码深度学习人工智能神经网络人工智能深度学习
GNN图神经网络（GraphNeuralNetwork，简称GNN）已经成为处理图形结构数据的一种强大工具，广泛应用于社交网络分析、知识图谱、推荐系统等领域。在本文中，我们将深入探讨图神经网络的历史背景、关键的发展阶段以及未来可能的发展方向。一、背景介绍图（Graph）是一种数据结构，由节点（Node）和连接节点的边（Edge）组成。在许多现实世界的应用中，数据自然地呈现出图形结构，如社交网络中的
计算机毕业设计hadoop+spark知识图谱高考分数预测系统高考志愿推荐系统高考可视化大屏高考大数据高考数据分析高考爬虫大数据毕业设计计算机毕业设计大全
开发技术hadoopsparkspringbootvue.jsPython爬虫、机器学习、深度学习mybatis-plusneo4j知识图谱图数据库mysql协同过滤算法(基于物品、基于用户模式)MLP模型SVD神经网络CNN、KNN、GNN卷积神经网络预测算法阿里云平台百度AI平台阿里大于短信平台lstm模型创新点4种机器学习推荐算法进行高考志愿学校推荐1种深度学习模型进行高考分数线预测hado
金融贷款风险预测：使用图神经网络模型进行违约概率评估从零开始学习人工智能金融神经网络人工智能
要使用PyTorch和GNN（图神经网络）来预测金融贷款风险，并加入注意力机制，我们首先需要构建一个贷款风险预测的图数据集。然后，我们将设计一个基于注意力机制的GNN模型。以下是一个简化的代码示例，演示了如何使用PyTorch和PyTorchGeometric（一个流行的图神经网络库）来实现这一点。请注意，这只是一个起点，并且您可能需要根据您的具体需求进行调整。首先，安装必要的库：bash复制代码
Michael Bronstein 最新几何深度学习综述：超越 WL 和原始消息传递的 GNN 人工智能与算法学习大数据算法编程语言 python 机器学习
如何突破基于WL测试和消息传递机制的GNN的性能瓶颈？且看几何深度学习旗手、牛津大学教授MichaelBrostein如是说。编辑丨陈彩娴来源|AI科技评论图可以方便地抽象关系和交互的复杂系统。社交网络、高能物理、化学等研究领域都涉及相互作用的对象（无论是人、粒子还是原子）。在这些场景下，图结构数据的重要性日渐凸显，相关方法取得了一系列初步成功，而一系列工业应用使得图深度学习成为机器学习方向的热门
Michael Brostein 最新几何深度学习综述：超越 WL 和原始消息传递的 GNN 人工智能学家大数据算法编程语言 python 机器学习
来源：前沿科技编译：OGAI编辑：陈彩娴如何突破基于WL测试和消息传递机制的GNN的性能瓶颈？且看几何深度学习旗手、牛津大学教授MichaelBrostein如是说。图可以方便地抽象关系和交互的复杂系统。社交网络、高能物理、化学等研究领域都涉及相互作用的对象（无论是人、粒子还是原子）。在这些场景下，图结构数据的重要性日渐凸显，相关方法取得了一系列初步成功，而一系列工业应用使得图深度学习成为机器学习
[论文精读]FBNETGEN: Task-aware GNN-based fMRI Analysis via Functional Brain Network Generation 夏莉莉iy 论文精读人工智能深度学习学习图论分类笔记
论文网址：https://arxiv.org/abs/2205.12465论文代码：https://github.com/Wayfear/FBNETGEN英文是纯手打的！论文原文的summarizingandparaphrasing。可能会出现难以避免的拼写错误和语法错误，若有发现欢迎评论指正！文章偏向于笔记，谨慎食用！目录1.省流版1.1.心得1.2.论文总结图2.论文逐段精读2.1.Abstr
[代码复现]FBNETGEN: Task-aware GNN-based fMRI Analysis via Functional Brain Network Generation 夏莉莉iy 代码复现深度学习人工智能学习图论笔记 nlp
仅提供ABIDE数据集复现步骤，很简单。代码已经很新了目录1.论文资料2.代码复现步骤及可能存在的问题2.1.环境配置2.2.代码运行1.论文资料（1）论文原文：[2205.12465]FBNETGEN:Task-awareGNN-basedfMRIAnalysisviaFunctionalBrainNetworkGeneration(arxiv.org)（2）论文代码：GitHub-Wayfea
DeepMind加持的GNN框架正式开源,TensorFlow进入图神经网络时代 Python数据挖掘 python python 深度学习神经网络
谷歌在垃圾邮件检测、流量估计以及YouTube内容标签等环境中使用了一种强大的工具GNN（图神经网络）。11月18日，谷歌联合DeepMind对外开源TensorFlowGNN工具，助力流量预测、谣言和假新闻检测、疾病传播建模、物理模拟等领域的基础研究。11月18日，谷歌联合DeepMind发布了TensorFlowGNN（图神经网络）。目前，谷歌已经在诸如垃圾邮件检测、流量估计以及YouTube
Google刚刚推出了图神经网络Tensorflow-GNN 新加坡内哥谈技术神经网络 tensorflow 人工智能
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在当今数字化的世界里，对象及其之间的复杂关系构成了无数的网络，例如交通网络、生产网络、知
Datawhale组队学习GNN-task04 数据完整存储与内存的数据集类+节点预测与边预测任务实践 79f3c66c2fe7
DataWhale开源学习资料:https://github.com/datawhalechina/team-learning-nlp/tree/master/GNN6.1数据完全存于内存的数据集类学习在PyG中如何自定义一个数据完全存于内存的数据集类。InMemoryDataset基类简介根文件夹（root）raw_dirprocessed_dir传递的三个函数：transformpre_tra
论文笔记：NIPS 2020 Graph Contrastive Learning with Augmentations 饮冰l 图弱监督数据挖掘机器学习神经网络深度学习
前言本文主要提出在图对比学习大框架下的图数据增强的若干方法。概括来说，本文提出了一种图对比学习框架来无监督的完成图表示学习，首先作者提出了基于各种先验信息的四种图数据增强方法。然后，作者分析了在四种不同的图数据增强条件下，不同组合对多个数据集的影响:半监督、无监督、迁移学习以及对抗性攻击。作者为GNN的预训练提出了基于图数据增强的对比学习框架来解决图中数据异质性的挑战，本文的主要贡献如下：作者提出
Graph Contrastive Learning with Augmentations tutoujiehegaosou Graph 笔记
GraphCL学习笔记Abstract提出GNN对自监督学习和pre-training较少。本文提出了GraphCL框架，用于学习图的无监督表示。设计四种类型的数据增强，在不同的settings（learningrate，batchsize，dropout参数）下，研究这四种增强对不同数据集的影响。Introduction大多数graph-level的任务场景，GNN都是在监督的情况下进行端到端的
Task02 消息传递图神经网络沫2021
参考链接：https://github.com/datawhalechina/team-learning-nlp/blob/master/GNN/Markdown%E7%89%88%E6%9C%AC/4-%E6%B6%88%E6%81%AF%E4%BC%A0%E9%80%92%E5%9B%BE%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C.md一、引言消息传递范式是一种聚
A.关于图计算&图学习的基础知识概览：前置知识点学习（Paddle Graph L）【一】汀、人工智能图计算图学习图论图神经网络人工智能
图学习图神经网络算法专栏简介：主要实现图游走模型(DeepWalk、node2vec)；图神经网络算法(GCN、GAT、GraphSage)，部分进阶GNN模型（UniMP标签传播、ERNIESage）模型算法等，完成项目实战专栏链接：图学习图神经网络算法专栏简介：含图算法（图游走模型、图神经网络算法等）原理+项目+代码实现+比赛前人栽树后人乘凉，本专栏提供资料：快速掌握图游走模型(DeepWal
ECE755_gnn图神经网络（附完整工程） _max_max GNN 神经网络人工智能深度学习 fpga
ECE755_gnn图神经网络（附完整工程）ECE755课程要求任务1完成：题目要求MS1代码：仿真任务二完成题目要求MS2代码：仿真总结ECE755ECE755_sp23是加拿大渥太华大学（UniversityofOttawa）计算机工程系（SchoolofElectricalEngineeringandComputerScience）的一个研究生课程，涵盖了图神经网络（GraphNeuralN
《Beyond Homophily in Graph Neural Networks: Current Limitations and Effective Designs》阅读笔记斯曦巍峨 Graph Learning 异构图 GNN
文章概述作者指出许多流行的GNN模型在泛化到异构图上时性能都很差，为此，作者确定了一组能够帮助提升GNN在异构图上性能的设计：自嵌入和邻居嵌入分离聚合更高阶的邻居将中间层的表示组合作为最后的表示作者将这些理念应用到了自己设计的H2GCN\text{H}_{2}\text{GCN}H2GCN上，半监督结点分类任务（semi-supervisednodeclassificationtask）的实验结果
人工智能福利站，初识人工智能，图神经网络学习，第一课普修罗双战士人工智能专栏人工智能神经网络学习
作者简介，普修罗双战士，一直追求不断学习和成长，在技术的道路上持续探索和实践。多年互联网行业从业经验，历任核心研发工程师，项目技术负责人。欢迎点赞✍评论⭐收藏人工智能领域知识链接专栏人工智能专业知识学习一图神经网络专栏文章目录初识人工智能(图神经网络)一、图神经网络学习(1)01.什么是图神经网络(GNN)？02.图神经网络与传统神经网络的区别是什么？03.图神经网络有哪些主要的应用领域？04.请
Python GCN、GAT、MP等图神经网络学习，从入门全面概述和讲解GNN，入门到精通图神经网络医学小达人推荐算法人工智能图神经网络图神经网络人工智能推荐系统
1.图的分类：1.1根据边的方向性：有向图（DirectedGraph）：图中的边具有方向性，表示节点之间的单向关系。例如，A指向B的边表示节点A指向节点B。无向图（UndirectedGraph）：图中的边没有方向性，表示节点之间的双向关系。例如，A和B之间的边表示节点A和节点B之间存在连接关系。1.2根据边的是否具有权重：加权图（WeightedGraph）：图中的边具有权重，表示节点之间的强
Transformer在GNN的前沿综述数据派THU transformer 深度学习人工智能
本文约4500字，建议阅读10+分钟本文介绍了Graphormer，一种基于标准Transformer架构的图表示学习方法。1介绍Transformer架构在自然语言处理和计算机视觉等领域表现出色，但在图级预测中表现不佳。为了解决这个问题，本文介绍了Graphormer，一种基于标准Transformer架构的图表示学习方法，在广泛的图表示学习任务中取得了优异成绩，特别是在OGB大规模挑战中。Gr
《图机器学习》-GNN 《A Single Layer of a GNN》白色的生活图机器学习机器学习人工智能神经网络
GNN一、ASingleLayerofaGNN二、ClassicalGNNLayer1、GCN2、GraphSAGE3、GAT三、GNNLayerinPractice四、StackingGNNLayers一、ASingleLayerofaGNN单层的神经网络包括两个部分：消息转换(Message)信息聚合(Aggregation)GNNLayer=Message+AggregationGNN\La
《图机器学习》-GNN Augmentation and Training 白色的生活图机器学习机器学习人工智能算法
GNNAugmentationandTraining一、GraphAugmentationforGNNs1、FeatureAugmentation2、Structureaugmentation3、NodeNeighborhoodSampling二、GNNTrainingPipeline1、Predictionheads2、SupervisedVSUnsupervised3、LossFunction
GNN框架优化GNNAdvisor: An Adaptive and Efficient Runtime System for GNN Acceleration on GPUs ILL. 神经网络性能优化 gpu算力
OSDI’21AbstractGNNAdvisor从GNN模型和输入图中寻找与性能相关的特征，作为优化点实现为GNN计算定制的2D工作负载管理，提升GPU利用率和性能利用GPU内存结构，根据GPU内存结构和GNN工作负载的特点协调GNN的执行为了实现自动优化，继承了一个轻量级的分析模型进行参数搜索1.Introduction目前，支持GNN训练和推理的工作可以分为两类：图处理系统，融合神经操作神经
Neural Improvement Heuristics for Graph Combinatorial Optimization Problems Namnan 组合优化人工智能算法
NeuralImprovementHeuristicsforGraphCombinatorialOptimizationProblemsIEEETRANSACTIONSONNEURALNETWORKSANDLEARNINGSYSTEMS2023摘要图神经网络（GNN）架构的最新进展和增加的计算能力已经彻底改变了组合优化（CO）领域。在所提出的模型CO的问题，神经改进（NI）模型已经特别成功。然而，
1_图神经网络GNN基础知识学习 Waldocsdn #图神经网络与可信AI 人工智能安全与可信AI 神经网络人工智能图神经网络
文章目录对B站前十个视频的补充内容视频链接图神经网络的介绍图神经网络的输入格式图的输入格式：例子：GNNs输入数据的结构GNNS中的MaxPooling“在图神经网络的各个点的特征组合中，对多个点做MaxPooling”这句话是什么意思？举例说明图神经网络中的MaxPooling图的基本组成解释1:解释2:举例说明实例：社交网络GNN的目的——整合特征1.整合特征2.Vertex(ornode)e
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n