歌者And贰向箔

Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks翻译

Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks

ABSTRACT

问题：训练大规模的GCN仍然具有挑战性，当前基于SGD的算法的计算成本随着GCN层数的增长呈指数增长。

方法：Cluster-GCN算法，利用图的聚类结构，适用于基于奇异值分解的训练。

原理：每次对由图聚类算法识别的密集子图相关联的节点块进行采样，并且限制该子图的邻域搜索。

Cluster-GCN works as the following: at each step, it samples a block of nodes that associate with a dense subgraph identified by a graph clustering algorithm, and restricts the neighborhood search within this subgraph.

结果：提高了内存和计算效率，同时达到与之前算法相当的测试精度。在数据集上训练3层的GCN，Cluster-GCN比之前最先进的VR-GCN更快（1523秒vs 1961秒），并且使用更少的内存（2.2GB vs 11.2GB）。训练4层GCN时，算法可以在36分钟左右完成，而现有的GCN训练算法都因内存不足而无法训练。此外Cluster-GCN允许在内存和时间都少的情况下训练更深的GCN，从而提高了预测精度-使用5层GCN，在PPI数据集上进行测试F1 score为99.36，而之前的最佳结果为98.71。

数据集：创建了新的Amazon2M数据，包含200万个节点和6100万条边，比之前最大的公开数据集Reddit大5倍以上。

INTRODUCTION

对于给定的graph，GCN使用图卷积运算逐层获得节点embeddings，在每层上，一个节点的embeddings是通过收集neighbors的embeddings，然后通过一层或者几层的线性变换和非线性激活得到。最后的一层的embeddings用于最终的任务。例如在节点分类任务中，最后一层的embeddings传递给分类器进行预测节点标签，从而以端到端的方式训练GCN参数。

由于GCN中的图卷积算子需要通过图中节点的作用(interaction)来传播embeddings，这使得训练非常具有挑战性。其他神经网络训练损失可可以完全分解为每个样本上的单个项(terms)，而GCN的损失项(例如单个节点上的分类损失)依赖大量的其他节点，尤其是当GCN更加深层后，由于对其他节点的依赖型，GCN的训练速度非常慢，并且需要大量的内存—反向传播需要将计算图中的所有embeddings都储存在GPU内存中。

Previous GCN Training Algorithms：现有方法的优缺点：

三个标准(1)内存需求(2)每个训练epoch的时间(3)每个epoch的收敛速度，这三个因素是评估一个训练算法的关键，内存需求直接限制了算法的可扩展性，后两个因素决定了训练速度。N表示图中节点数，F表示embeddings维数，L表示层数来分析经典的GCN训练算法。

Full-batch gradient descent，为了计算梯度，需要储存所有的intermediate embeddings，导致了大量的内存需求，虽然每个epoch的时间非常efficient，但是梯度下降的收敛速度很慢，因为参数更新的慢，每个epoch只更新一次。

Mini-batch SGD，每次参数更新都是基于一个小批量梯度，这样可以减少内存需求，并且每个epoch可以进行多层更新，从而可以更快地收敛。然而Mini-batch SGD由于neighborhood

expansion problem引入了计算开销。计算损失在某个单节点层L，

VR-GCN提出使用方差减少技术来减少邻域抽样节点的大小，但它需要将所有节点的intermediate embeddings存储在内存中，同样导致内存需要过高。

本文利用图聚类结构提出了一种新的GCN训练算法，小批量算法的效率可以用embeddings利用率的概念来表示，它与节点之间的链接数目或者within-batch批量内的链接数目成正比，该发现促使我们使用图聚类算法来设计批量处理，该算法旨在构建节点分区construct partitions of nodes，使同一分区内的节点之间的图链接比不同分区内的节点之间的图链接数目更多。基于图聚类思想，我们提出了Cluster-GCN。进一步提出了a stochastic multi-clustering framework一个随机多聚类框架来提高Cluster-GCN的收敛性。算法节省了内存消耗，提高了计算能力，在内存方面，只需要储存当前batch的节点embeddings，在计算复杂度方面，算法实现了梯度下降法相同的epoch时间消耗，并且邻域搜索法更快。在收敛速度方面，算法与其他基于SGD的算法具有一定的竞争力。最后算法更容易实现，因为只计算矩阵乘法，不需要邻域抽样。

BACKGROUND

任意两个节点i和j之间的边表示它们的相似度，邻接矩阵A是一个N*N的稀疏矩阵，如果i和j之间有边相连接，则aij=1，否则为0，每个节点都有F维的特征向量，X(N*F)表示所有N个节点的特征矩阵。L层的GCN由L个图卷积层构成，每个图卷积通过混合mixing上一层节点邻居在图中的embeddings来构造每个节点的embedding。

A’是归一化正则邻接矩阵，X(l)是第l层的embedding并且X(0)=X，假设所有层的特征大小都相同(F1=F2= F)，激活函数为ReLU，半监督节点分类使用GCN时，目标是通过最小化损失函数来学习(1)的权重矩阵。

其中y(l)包括所有含标签的节点，zi的ground-truth标签是yi，表示节点i的预测。通常使用交叉熵损失函数。

PROPOSED ALGORITHM

在本文中将使用数目b=B表示一个batch的索引，并且每步SGD都会计算梯度估计进行更新

在epoch方面收敛速度变快，但是SGD将引入GCN训练的另一个计算开销，这使得每个epoch时间比full batch下降慢很多。

mini-batch SGD为什么每个epoch的时间变长了？

当考虑某个节点相关的梯度计算时，需要得到节点的embedding，当前节点的embedding取决于其邻居节点的embeddings，并且我们还需要邻居节点的邻居节点的embeddings，假设GCN有L+1层，为了得到节点的梯度，需要从许多节点中为一个节点聚合特征。

Embedding利用率可以反映计算效率。使用Embedding利用率来表征计算效率。如果节点在第l层的Embedding被反复利用u次用于计算第l+1层的嵌入计算则说节点的Embedding利用率是u。图1左图说明了邻域扩展问题，相反full batch梯度下降的Embedding利用率最大。

为了使mini-batch SGD工作，之前的方法限制邻域扩展大小的方法，但是并不能提高Embedding利用率，GraphSAGE统一采用固定大小的邻域集合，而不是使用全邻域集合。FastGCN提出了一种重要的采样策略来改进梯度计算，VR-GCN提出了储存所有N个节点和L层之前的Embedding的方法，并在未采样的邻居中重新使用。尽管储存所有Embedding的内存使用很高，但是这个策略非常有用。

图1传统的图卷积方法与提出的聚类方法的邻域扩展差异，红色是起始起点。传统的图卷积存在指数邻域扩张的问题，而我们的方法可以避免。

Vanilla Cluster-GCN

在mini-batch SGD更新中可以设计一个batch和相应的子图来最大化Embedding利用率？

通过将Embedding利用的概念和聚类目标联系起来。

在每个batch中计算一组节点B从第1层到第L层的Embedding，由于每一层计算都使用相同的子图，为了最大化Embedding利用率，通过它我们将SGD更新的效率与图聚类算法联系起来。

Cluster-GCN

对于一个图，将其节点划分为c组：V=[V1,V2,V3,….Vc]，其中Vt表示第t个子图中的节点，因此有c个子图

ξ由Vt节点的之间的链接组成，对节点进行重组后，将邻接矩阵划分为c2个子矩阵

每个矩阵的对角块Att是一个|Vt|*|Vt|邻接矩阵，包含在Gt内的链接，是图的邻接矩阵；Ast包含两个子图节点Vs和Vt的链接，∆是A中所有非对角线块组成的矩阵，同样，我们可以将特征矩阵和标签划分为[X1,· · · ,Xc]和[Y1,· · · ,Yc]，其中Xt和Yt分别由节点的特征和标签组成。

使用对角线块近似的好处就是可以将GCN的目标函数划分为不同的batches(clusters)。令表示的规范化形式，最终的Embedding矩阵为

由于，由于的对角形式，损失函数也可以进行划分

，

基于Cluster-GCN的分解形式(6)和(7)，在每一步，我们对其中一个节点子集Vt进行采样然后根据的梯度进行SGD更新，仅需要子图Att，当前batch的Xt、Yt和模型,实现只需要向前和向后传播矩阵乘积((6)的一块)，这样比以前基于SGD的训练方法中使用的邻域搜索过程更容易实现。

我们使用图聚类算法对图进行划分，Metis [8]和Graclus [4]等图聚类方法的目的是在图的节点上构造分区，使簇内链接多于簇间链接，从而更好地捕捉图的聚类和区域结构。这正是我们需要的，因为(1)如前文所述，对于每个batch而言，Embedding利用率等同于簇内链接。每个节点和它的neighbors一般在同一个cluster，因此在几次hops后，高概率的neighbors节点仍然在同一个cluster内。(2)因为我们使用了对角块A来近似代替A，且误差与簇间链接△成正比，所以我们需要找到一个分区来最小化簇间链接的数目。

我们在图1中演示了使用full Graph G的邻域扩展和使用clustering 分区,我们可以看到ckuster-GCN可以避免大量的邻域搜索，将注意力集中在每个cluster内的邻域上。在图2中，我们展示了两种不同的节点分区策略，随机分区和cluster分区。我们利用随机划分和METIS方法将图划分为10个分部分。然后是使用一个分区来执行SGD更新。可以看出，在相同的epochs下，使用clustering划分可以达到更高的精度。这表明使用图聚类是重要的，分区不应该随机生成。

时间和空间复杂性。在Vt中的每个节点都只链接到Vt中的其他节点，每个节点不需要在Att外进行外部邻域搜索。每个batch的计算将纯粹是矩阵乘积和一些元素操作，平均来说，每个batch仅需要计算embeddings，而这是与L呈线性关系而不是指数关系。在空间复杂度中，我们只需要加载b个样本并且将其存储在每层，导致内存用于储存embeddings。本文算法比之前算法内存的效率更高。

表2 图的随机划分与clustering划分(小批量SGD训练)对比。clustering划分带来了更好的性能(F1 score)，因为它删除的分区链接更少。这三个数据都是公共的GCN数据集。我们将在实验部分解释PPI数据。Cora有2708个节点和13,264条边，而Pubmed有19,717个节点和108,365条边。

图2 基于label分布的熵值直方图。我们在每个batch中分别使用随机划分和clustering划分。大多数clustering划分batch的label熵都很低，表明每个batch中的label分布是倾斜skewed的。相比之下，随机划分将导致batch中更大的label熵值。在本例中，我们使用300个cluters来划分Reddit数据集。因此我们的算法只需要将一个子图加载到GPU内存中，而不是整个图(尽管图的大小通常不是内存瓶颈)。表1总结了详细的时间和内存复杂度。

3.2随机多重分区Stochastic Multiple Partitions

Cluster-GCN存在的两个问题：

图被分割后，一些链接(等式(4)中的△)被移除，性能可能会受到影响。
图聚类算法倾向于将相似的节点聚集在一起。因此聚类的分布可能不同于原始数据集，导致在执行SGD更新时对整个梯度的有偏估计。

在图2中，我们使用Reddit数据集演示了一个具有不平衡标签分布的例子，该数据具有由Metis形成的聚类，我们根据每个类别标签分布计算其熵值，与随机划分相比，我们可以看到使用聚类方法的熵更小，这表明类别的label分布偏向于一些特殊label。这增加了不同batch之间的差异性，并可能影响SGD的收敛性。

图3 提出的随机多分区方案。在每个epoch时，随机抽取q个clusters(本例中q=2)和其他的类间类别进行链接，形成一个新的batch，图中相同的颜色在同一个batch中。

图4 选择一个cluster与选择多个clusters的比较。前者使用300个分区，后者使用1500并随机选择5个形成一个batch，x轴代表epoch，y轴表示F1 score。

为解决上述问题，提出了一种随机多重聚类stochastic multiple clustering approach来合并类间链接between-cluster links来减少batch之间的差异。首先将图分为p个clustersV1，…Vp，并且p相对大。当为SGD更新构建一个batch时，不仅考虑一个cluster，而是随机选择q个clusters，用t1….tq表示，并且将他们的节点包括到batch中。所选clusters之间的链接需要重新添加进来

通过这种方式，类间链接被重新合并，clusters的组会使得batch之间的差异更小。图3展示了我们的算法，对于每个epochs，clusters的不同组合被组成一个batch。图4中，我们发现将多个clusters作为一个batch可以提高收敛性。

3.3 Issues of training deeper GCNs

之前研究表明训练更深的GCNs似乎表明增加更多的层没有帮助。可能因为之前的数据量比较小。[9]中使用了类似残差网络的结构，修改(1)将第l层的隐藏表达传递到下一层。

我们提出了另外一种技术来提高深层神经元的训练，在原始GCN中，每个节点都会聚合上一层邻居节点的表达。但是附近的节点应该会比远处的节点由更多的贡献。我们提出，放大每个GCN层中使用的邻接矩阵的对角线部分。通过这种方式，我们在每个GCN层的信息聚合中对来自前一层的表达赋予了更多的权重，可以给A添加一个标识，

对所有的节点使用相同的权重而不管其邻居的数量是不合理的，当使用更多层时，数值会呈指数级的增长，因此可能出现数值不稳定，我们提出(9)的修改版本，首先向原始的A添加一个标志，

并且

4 EXPERIMENTS

Reddit数据集是我们迄今为止看到的最大的公共数据集，Amazon2M是自己收集的，比较的算法有

VRGCN，保留了所有节点之前的embeddings,并且只扩展到几个邻居进行加速训练，采样邻居的数量为2

GraphSAGE，对每个节点固定数目的邻居进行采样，表中S1=25，S2=10为默认的采样设置。

对于实验中使用的所有方法，Adam优化器的学习率0.01，dropout rate 为20%，weight decay为0。对于VRGCN和GraphSAGE，按原始论文算法将batch sizes设为512。对于Cluster-GCN，表4中列出了每个数据集每个batch的分区和clusters数目。

4.1 Training Performance for median size datasets 中等大小数据集的训练性能，图6为不同算法训练时间和准确率的对比，x轴为训练时间，单位为秒，y轴为F1 score

表5 不同数据集上内存使用情况的比较，括号内的数字为模型使用的隐藏单元的大小

在表5中，当增加层数时，cluster-GCN的内存使用并没有增加多少，因为，当增加一层时，引入的额外变量是权重矩阵W(l)，与子图和节点特征相比，权重矩阵相对较小。cluster-GCN比VRGCN内存效率高很多。

4.2 Experimental results on Amazon2M

Amazon2M数据集，新的GCN数据集，超过200万个节点和6100万条边，图数据集中，每个节点都是一个产品，节点的链接表示两个产品是否一起购买。节点的特征通过主成分分析降维到100维来生成，使用top-level类类作为该产品/节点的标签。常见的类别表7所示。

当网络为2层时，达到相似的F1 score，VRGCN比cluster-GCN更快，但是再增加一层时，VRGCN比cluster-GCN更慢。VRGCN使用的内存比cluster-GCN更多(3层网络时多5倍)。

表9 使用不同层数GCN时，运行时间的比较，使用PPI，并且epochs为200。

我们研究使用更深的GCNs是否获得更好的准确性。在第4.3节中，我们讨论了修改邻接矩阵A的不同策略，以促进深层神经网络的训练。我们将对角增强技术应用于深度GCNs，并在PPI上运行实验。结果如表11所示。对于2到5层的情况，所有方法的准确性随着更多层的增加而增加，这表明更深的GCNs可能是有用的。然而，当使用7或8个GCN层时，前三种方法不能在200个纪元内收敛，并且获得了显著的精度损失。一个可能的原因是对更深的GCNs的优化变得更加困难。

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
具身语义导航算法总揽 Shilong Wang 具身导航算法算法
端到端方法小脑大脑GNMNavDPNaVILAViNTNomadNavidStreamVLNMapNavNavGPTUni-NavidOctoNavNavGPT2模仿学习行为克隆BCDAgger模块化方法GOATVLFMSayPlanLM-NavETPNavVoroNavEmbodiedRAGVL-NavStairwaytoSuccess业内大佬北大王鹤NavidUni-NavidOctoNav吴
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
android去除gps漂移代码,GPS漂移过滤算法扇贝君
GPS漂移过滤算法基本思想：逐点过滤，再经过基础过滤后，进行判断运动状态，静止状态和运动中。如果静止，则使用电子围栏；如果运动，则先过滤大速度，再过滤加速度，然后过滤距离(包括超大距离，和速度相关距离)。对于要过滤的点，采用之前最近的可靠点，进行替换，同时，无效次数+1，如果后面是有效点，则无效次数-1，如果无效次数归0，认为这个点才是真正可靠点(无效次数为正时，都为要被替换的点)。如果遇到不定点
项目开发日记
框架整理学习UIMgr：一、数据结构与算法1.1关键数据结构成员变量类型说明m_CtrlsList当前正在显示的所有UI页面m_CachesList已打开过、但现在不显示的页面（缓存池）1.2算法逻辑查找缓存页面：从m_Caches中倒序查找是否已有对应ePageType页面，找到则重用。页面加载：从资源管理器ResMgr加载prefab并绑定控制器/视图组件。页面关闭：从m_Ctrls移除，添加
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
《C++性能优化指南》 linux版代码及原理解读第四章 v俊逸 C++性能优化指南性能优化 C++性能优化指南性能优化
目录概述为什么字符串很麻烦字符串是动态分配的字符串赋值背后的操作如何面对字符串会进行大量复制写时复制COW（copyonwrite）尝试优化字符串避免临时字符串通过预留存储空间减少内存分配通过传递引用减少实参复制使用迭代器操作减少循环中的比较操作减少返回值的复制还没有结束，使用字符数组代替字符串再次优化字符串尝试其他的算法叠加以前的优化方式使用其他的编译器使用其他字符串的库功能丰富的字符串库使用s
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc

Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks翻译

你可能感兴趣的:(深度学习,神经网络,算法,大数据)