TsingMr

【Graph Embedding/Network Embedding 图嵌入/网络表示学习】主要工作（Deepwalk/LINE/node2vec）总结

前言

首先，花了两年时间从Web开发往AI转行，也阔别CSDN已久。这是回归后第一篇笔记，最开始先放一张非常全面的图，来自清华大学唐杰老师的演讲PPT，很全面地总结了近几十年来人工智能/深度学习算法发展进程中的主要工作和大佬们：从上往下的四个区域分别代表着卷积神经网络CNN、自动编码器AutoEncoder、循环神经网络RNN、强化学习Reinforcement Learning。

而没有提到的图神经网络（Graph Neural Network, GNN），算是目前比较新且逐渐热门的方向，它以CNN的延伸泛化（GCN）为模型基础、以语言模型（word2vec）衍生出来的图嵌入/表示学习方法为数据基础，解决图结构中的分类、预测、可视化等问题。
这篇主要总结图嵌入/表示学习方法，侧重于思路和算法，不涉及具体代码实现。

基础

概念

图嵌入（Graph Embedding）/图表示学习（Graph Representation Learning），也称作网络嵌入（Network Embedding）/网络表示学习（Network Representation Learning），本质上就是给定一个图（网络），学习其中每一个节点Vertice甚至边Edge在低维空间上的表示，即稠密、实值的低维向量。

word2vec

简单介绍一下word2vec：它是2013年被发明出来的工具，已经成为自然语言处理领域的基础，它的主要作用是把词内容表示成向量，即Word Embedding，向量可以表达不同词之间的相似度和类比关系，用来作为后续具体机器学习任务的模型的输入。
word2vec是基于语言模型（language model）的一种“副产物”：语言模型尝试在词语x和上下文y之间建立映射f，在模型训练后，神经网络中被x的one-hot encoder模式激活的部分权重参数W组成一个向量vx，这个vx就是词x的唯一表示，也就是x的词向量。

上文说到的语言模型，主要有两类：

Skip-gram模型：用一个词作为输入，预测它的上下文。（1-n）
词袋（continuous bag of words, CBOW）模型：用一个词的上下文作为输入，来预测这个词本身。（n-1）
此外，在训练语言模型时，由于实际工作中文本的词语个数会非常多，导致计算困难，所以需要使用*分层softmax（Hierarchical Softmax）和负采样（negative sampling）*这两种技巧来加速训练过程。

这一块的内容是DeepWalk的基础，没有深入细节，知道原理即可。总而言之，word2vec利用词与词的共现关系，通过两类语言模型Skip-gram和CBOW实现了文本中词的向量表示。

DeepWalk

生活中有许多天然形成的图（Graph）结构，比如社交网络、交通路网、化学元素，也有人为制造的图结构比如知识图谱，这些图不同于NLP中的文本和语音识别中的声波序列，也不同于CV中规则方网状结构的图片。

思路

关于一张图G的定义如下，其中V是顶点vertice的集合，E是边edge的集合。
$G = (V, E)$ 在word2vec中，文本或者句子可以理解为由词组成的序列，所以该方法也可以理解为对于序列中节点特征的嵌入/表示学习。但是，当我们的对象是图时，因为数据结构的根本区别，加上图的稀疏性，word2vec就失效了。
那么如何在图上做嵌入/表示学习呢？作者认为既然已经有成熟的word2vec了，大可将其利用起来而不需要另起炉灶。所以问题就转化为：如何将图转换为序列以供word2vec使用？解决方案是：随机游走（random walk）。

算法

随机游走是一种可重复访问已访问节点的深度优先遍历算法。
DeepWalk核心算法如下图所示。首先初始化顶点的表示矩阵 $\varPhi$ ，用V构建二叉树T用于分层softmax。算法中的核心是3-9行，外层循环指定了游走次数 $\gamma$ ，即每个节点会产生多少个游走序列。内层循环遍历了图中每一个节点 $v_i$ ：给定当前访问起始节点，不断从当前节点的邻居中随机选择一个访问，直到访问序列长度达到t，生成当前节点的游走序列 $W_{v_i}$ ，然后用SkipGram（前文中的Skip-gram）更新其向量表示 $\varPhi$ （ $\omega$ 是语言模型中的窗口大小）。

SkipGram算法如下图所示。外层循环是序列中的每个词，内层循环是其窗口大小为 $\omega$ 的词序列，运用似然函数J对当前词的表示向量 $\varPhi$ 进行学习率为 $\alpha$ 梯度下降更新。

流程概览

以上介绍了DeepWalk的算法，下面从流程角度再过一遍。
如下图所示，由节点 $v_4$ 开始的随机游走序列为 $v_4$ - $v_3$ - $v_1$ - $v_5$ - $v_1$ …将其中的中间节点 $v_1$ 映射到初始的表示向量 $\varPhi(v_4)$ 。分层softmax将序列转为二叉树以降低复杂度加速训练，然后计算 $Pr(v_3|\varPhi(v_1))$ 和 $Pr(v_5|\varPhi(v_1))$ ，即序列路径从根 $v_1$ 开始到 $v_3$ 和 $v_5$ 结束的概率分布，从而使得节点 $v_1$ 的表示向量 $\varPhi(v_1)$ 向着最大化其上下文为 $v_3$ 和 $v_5$ 的方向更新。

其他两点补充说明：

随机游走可以获得图中节点的局部上下文信息，越近的节点游走到的概率越大，因此在图上相似节点的表示也会相似。
随机游走是局部的，可以同时在图的不同节点同时游走，并行化以减少采样时间。同时也可以适应图的局部变化，不需要每一次变化都重新计算整个网络的游走。

总结

DeepWalk是该领域非常经典的工作，可以说开辟了新纪元。它巧妙地通过随机游走将图/网络转换为序列，再使用word2vec进行表示学习。后续若干重要工作都是在DeepWalk的基础上展开的。

LINE

DeepWalk的工作逐渐引起关注，也逐渐暴露出了它的一些不足：

并没有提供明确的目标来阐明保留哪些图/网络属性。
仅适用于未加权的图/网络。

思路

为了弥补上述DeepWalk的不足，LINE被提出来，主要是建立了一套新的体系来定义节点间的关系。
如下图所示，其中边可以是无向/有向的、加权/未加权的。顶点6和7应该被紧密地放置在低维向量空间中，因为它们通过一个强连接连接在一起。顶点5和6也应该被紧密放置，因为它们有相似的邻居。

所以LINE

将节点6和7的关系定义为一阶相似度（first-order proximity）：
若 $u, v$ 之间存在直连边，则边权 $\omega_{uv}$ 为两个节点的相似度，若不存在直连边则一阶相似度为0。在上图中，6和7之间存在直连边且边权大，则两者一阶相似度高且认为它们相似；而5和6之间不存在直连边，则两者一阶相似度为0。
将节点5和6的关系定义为二阶相似度（second-order proximity）：
若 $p_u=(w_{u1},w_{u2},...,w_{u|V|})$ 表示节点 $u$ 与所有其他节点间的一阶相似度，则 $u$ 和 $v$ 的二阶相似度可以通过 $p_u$ 和 $p_v$ 的相似度表示。若 $u$ 和 $v$ 之间不存在相同的邻居节点，则二阶相似度为0。在上图中，5和6之间不存在直连边，但有共同的邻居节点{1, 2, 3, 4}，则两者二阶相似度高且认为它们相似。

算法

一阶相似度

对于每个无向边 $(i, j)$ ，定义节点 $v_i$ 和 $v_j$ 的联合概率分布为 $p_1(v_i,v_j)=\frac{1}{1+\exp(-\overrightarrow{u_i}^T\cdot\overrightarrow{u_j})}$
$\overrightarrow{u_i}$ 是节点 $v_i$ 的低维向量表示。
定义经验分布为 $\hat{p_1}=\frac{w_{ij}}{W},W=\displaystyle\sum_{(i,j)\in{E}}w_{ij}$
优化目标为最小化 $O_1=d(\hat{p_1}(\cdot,\cdot),p_1(\cdot,\cdot))$
其中 $d(\cdot,\cdot)$ 是两个分布的距离。
采用KL散度衡量当前与经验概率分布差异，并忽略常数项后目标函数为 $O_1=-\displaystyle\sum_{(i,j)\in{E}}w_{ij}\log{p_1(v_i,v_j)}$
一阶相似度仅适用于无向图。

二阶相似度

对于每个节点维护两个表示向量，一个是该节点本身的向量，一个是该节点作为其他节点上下文的向量。

对于有向边 $(i, j)$ ，定义给定节点 $v_i$ 条件下，产生上下文节点 $v_j$ 的概率为 $p_2(v_j|v_i)=\frac{\exp(\overrightarrow{u_j}^T\cdot\overrightarrow{u_i})}{\displaystyle\sum_{k=1}^{|V|}\exp(\overrightarrow{u_k}^T\cdot\overrightarrow{u_i})}$ 其中|V|为上下文节点的个数。
定义经验分布为 $\hat{p_2}(v_j|v_i)=\frac{w_{ij}}{d_i},d_i=\displaystyle\sum_{k\in{N(i)}}w_{ik}$ 其中 $w_{ij}$ 是边 $(i, j)$ 的边权， $d_i$ 是节点 $v_i$ 的出度。
优化目标为最小化 $O_2=\sum_{i\in{V}}\lambda_id(\hat{p_2}(\cdot|v_i),p_2(\cdot|v_i))$ 其中 $\lambda_i$ 为控制节点重要性的因子，可以通过节点的度数或者PageRank等方法估计得到。
采用KL散度衡量当前与经验概率分布差异，并设 $\lambda_i=d_i$ 且忽略常数项后目标函数为 $O_2=-\displaystyle\sum_{(i,j)\in{E}}w_{ij}\log{p_2(v_i|v_j)}$

优化

本工作中运用到了两种优化方法，负采样（Negative Sampling）和边采样（Edge Sampling）。负采样提高了二阶相似度遍历所有节点的计算速度，在此不做详细介绍。
我们的目标函数在log之前还有一个权重系数 $w_{ij}$ ，在使用梯度下降方法优化参数时， $w_{ij}$ 会直接乘在梯度上。如果图中的边权方差很大，则很难选择一个合适的学习率。若使用较大的学习率那么对于较大的边权可能会引起梯度爆炸，较小的学习率对于较小的边权则会导致梯度消失。
对于上述问题采用边采样：从原始的带权边中进行采样，每条边被采样的概率正比于原始图中边的权重，这样把 $w_{ij}$ 从优化转移到了采样的过程中，既解决了学习率的问题，又没有带来过多的存储开销。

总结

LINE可以轻松扩展到具有数百万个节点和数十亿条边的图/网络。 它精心设计了目标函数，这些目标函数保留了一阶和二阶邻近度，并可用于加权图和有向图（二阶）。
LINE在实际训练时，分别训练保留一阶近似和二阶近似的模型，然后将这两种方法训练的每个节点的嵌入连接起来。
LINE提出了一种边采样的优化方法，解决了加权边随机梯度下降的局限性，且不影响效率。

node2vec

如果说DeepWalk倾向于深度优先遍历DFS，那么LINE就倾向于广度优先遍历BFS，那么是否有一种方法，可以将两者结合起来呢？

思路

在下图中，我们观察到 $u$ 和 $s_1$ 、 $s_2$ 、 $s_3$ 、 $s_4$ 属于同社区紧密相连的节点，而 $u$ 和 $s_6$ 是两个不同区域中的节点，有相同的结构角色（都是区域中心点）。因此，必须有一个灵活的算法来同时学习以下两个原则的节点表示形式：

结构等价性（structural equivalence）：具有相似的结构角色的节点具有相似的嵌入。
为了使向量表示的结果能够表达图/网络的结构等价，需要让随机游走的过程更倾向于广度优先搜索（BFS），因为BFS更喜欢游走到跟当前节点有直接连接的节点上，因为基于角色的结构等价性可以通过观察每个节点的直接邻域来推断，所以产生了与结构等价性密切对应的嵌入。（看的更近而全反而能明白结构等价）
同质性（homophily）：将来自同一图/网络区域的节点紧密地嵌入在一起。
为了使向量表示的结果能够表达图/网络的结构性，需要让随机游走的过程更倾向于深度优先搜索（DFS），因为DFS会更倾向于游走探索到更大的网络和更远的节点上。抽样节点更准确地反映了邻居的宏观情况，这在基于同质性的区域推断中是必不可少的。（看的更远而泛反而能明白同质）

算法

为了实现上述两个原则的表示方式，node2vec在算法中通过调整节点间的跳转概率来调整在BFS和DFS间的倾向性。
如下图所示，当从节点 $t$ 跳转到节点 $v$ 后，下一步从节点 $v$ 出发该如何跳转？

设定从节点 $v$ 跳转到下一个节点 $x$ 的概率为
$\pi_{vx}=\alpha_{pq}(t,x)\cdot\omega_{vx}$
其中 $\omega_{vx}$ 是边 $v x$ 的权重， $\alpha_{pq}(t,x)$ 的定义如下：
$\alpha_{pq}(t,x)=\begin{cases}\frac{1}{p}&\text{if }d_{tx}=0\\1 &\text{if }d_{tx}=1\\\frac{1}{q} &\text{if }d_{tx}=2\end{cases}$
其中， $d_{tx}$ 指的是节点 $t$ 到节点 $x$ 的距离，参数 $p$ 和 $q$ 共同控制着随机游走的倾向性。
1 参数 $p$ 被称为返回参数（return parameter）， $p$ 越小，随机游走回节点 $t$ 的可能性越大，node2vec就更注重表达网络的结构等价性，即广度优先搜索BFS。
2 参数 $q$ 被称为进出参数（in-out parameter）， $q$ 越小，则随机游走到远方节点的可能性越大，node2vec更注重表达网络的同质性，即深度优先搜索DFS。

总结

相比于LINE侧重于制定规则，node2vec其实才是DeepWalk最直接的改进版。它通过调整随机游走权重的方法，使图嵌入/表示学习的结果在图/网络的结构等价性和同质性中进行权衡。

结语

本文介绍了图嵌入/网络表示学习领域比较重要的三个工作，重点在于它们的思路、算法以及其中关联。

DeepWalk建议使用统一的随机游走进行搜索。这种策略的明显局限性在于，它使我们无法控制所探索的区域，以及只适用于未加权图/网络。
LINE主要提出了广度优先策略，对节点进行采样并仅在一阶和二阶邻居上独立优化似然性。这种探索的效果更容易表征，但是它难以表示高阶邻居，在进一步探索节点时没有灵活性。
node2vec的搜索策略通过参数p和q探索网络邻域，在广度优先搜索和深度优先搜索之间进行权衡。
后来也有研究者通过数学分析，将以上网络表示学习等价为矩阵分解，即奇异值分解（SVD）。可以简单（但不严谨）地理解为将完整的图嵌入（矩阵）分解成了具体的节点嵌入（向量）*边权（矩阵），这个矩阵分解的理论也为后来的GNN打下了基础。

参考文献：

[1]B. Perozzi, R. Al-Rfou, and S. Skiena, “DeepWalk: online learning of social representations,” in Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining - KDD ’14, New York, New York, USA, 2014, pp. 701–710, doi: 10.1145/2623330.2623732.
[2]J. Tang, M. Qu, M. Wang, M. Zhang, J. Yan, and Q. Mei, “LINE: Large-scale Information Network Embedding,” in Proceedings of the 24th International Conference on World Wide Web - WWW ’15, Florence, Italy, 2015, pp. 1067–1077, doi: 10.1145/2736277.2741093.
[3]A. Grover and J. Leskovec, “node2vec: Scalable Feature Learning for Networks,” in Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining - KDD ’16, San Francisco, California, USA, 2016, pp. 855–864, doi: 10.1145/2939672.2939754.

【Graph Embedding】DeepWalk：算法原理，实现和应用
【Graph Embedding】LINE：算法原理，实现和应用
[NLP] 秒懂词向量Word2vec的本质
深度学习中不得不学的Graph Embedding方法转载 | 认知推理：从图表示学习和图神经网络的最新理论看AI的未来

图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
Spring Data Neo4j 与后端人工智能算法的数据交互 AI大模型应用实战 spring neo4j 人工智能 ai
SpringDataNeo4j与后端人工智能算法的数据交互关键词：SpringDataNeo4j、图数据库、人工智能算法、数据交互、知识图谱、图神经网络、数据集成摘要：本文深入探讨了如何利用SpringDataNeo4j框架实现后端人工智能算法与图数据库的高效数据交互。文章首先介绍了图数据库和人工智能算法的基本概念，然后详细解析了SpringDataNeo4j的核心架构和原理。接着，通过实际代码示
GNN--知识图谱（逐步贯通基础到项目实践）峙峙峙图神经网络知识图谱人工智能
原文仓库链接：知识图谱–贯通已有知识地图记录知识关系图谱和跨学科碰撞新启发知识图谱mermaid可能需要下载插件才能渲染线性代数神经网络深度学习框架硬件加速图论GNN框架交叉理解前向理解定义：前向理解：A–>B，A为B的基础铺垫知识，通过深入学习A对B有更好的理解01.LinearAlgebraforLinearLayerofNN从线性代数行列变换的角度看神经网络中的线性层线性代数矩阵乘法，可以理
TensorFlow图神经网络(GNN)入门指南 AI天才研究院 AI人工智能与大数据 tensorflow 神经网络人工智能 ai
TensorFlow图神经网络(GNN)入门指南关键词：TensorFlow、图神经网络、GNN、深度学习、图数据、节点嵌入、图卷积网络摘要：本文全面介绍如何使用TensorFlow实现图神经网络(GNN)。我们将从图数据的基本概念开始，深入探讨GNN的核心原理，包括图卷积网络(GCN)、图注意力网络(GAT)等流行架构，并通过TensorFlow代码示例展示如何构建和训练GNN模型。文章还将涵盖
基于图神经网络的ALS候选药物预测模型设计与实现神经网络15044 MATLAB专栏神经网络深度学习神经网络人工智能深度学习机器学习
基于图神经网络的ALS候选药物预测模型设计与实现一、任务背景与意义肌萎缩侧索硬化症（ALS）是一种致命的神经退行性疾病，目前尚无有效治愈方法。传统药物发现流程耗时长、成本高，而人工智能技术为加速药物发现提供了新途径。本文设计并实现了一个基于图神经网络（GNN）的ALS候选药物预测模型，通过整合分子图结构信息和生物活性数据，实现对潜在治疗ALS化合物的高效筛选。二、系统架构设计
NeighborGeo：基于邻居的IP地理定位（一）路由跳变 IP geolocation tcp/ip 网络协议网络
NeighborGeo：基于neighbors的IP地理定位X.Wang,D.Zhao,X.Liu,Z.Zhang,T.Zhao,NeighborGeo:IPgeolocationbasedonneighbors,Comput.Netw.257(2025)110896,AbstractIP地址定位在网络安全、电子商务、社交媒体等领域至关重要。当前主流的图神经网络方法通过将IP定位任务重构为属性图中
百度7天GNN学习-图与图学习中静静喜欢大白 pgl
目录1链接预测分析图学习的主要任务链接预测（Linkprediction）1.相似度分数2.性能指标(Performancemetrics)完整代码输出2节点标记预测分析完整代码输出3图嵌入图嵌入（GraphEmbedding）1.节点嵌入(NodeEmbedding)2.边嵌入(EdgeEmbedding)3.图嵌入(GraphEmbedding)完整代码输出小结小结参考1链接预测分析图学习的
GNN多任务预测模型实现（二）：将EXCEL数据转换为图数据走的远一些神经网络知识分享知识备份人工智能深度学习
目录一.引言二.加载和检查数据三.提取特征和标签四.标准化特征五.构建节点索引六.构建边及其特征七.总结八.结语一.引言在图神经网络（GraphNeuralNetworks,GNNs）的多任务学习场景中，数据预处理是至关重要的一步。尤其是当我们的数据存储在表格格式（如Excel文件）中时，如何有效地将其转换为图数据格式，是搭建GNN模型的基础。二.加载和检查数据第一步是加载数据并检查其格式。我们通
顶会新方向！14篇图神经网络（GNN）最新顶会论文汇总！（含2024） AI科研技术派神经网络人工智能深度学习
图神经网络（GNN）是深度学习领域中备受关注的前沿课题，它在处理图结构数据方面展现出了强大的潜力，随着研究的不断深入，越来越多的优秀论文在顶级学术会议上涌现。今天就给大家整理了14篇顶会中发表的图神经网络优质论文，一起看看这方面的最新研究成果吧！AAAI20241、Fine-tuningGraphNeuralNetworksbyPreservingGraphGenerativePatterns通过
AI人工智能领域知识图谱在深度学习中的应用拓展
AI人工智能领域知识图谱在深度学习中的应用拓展关键词：知识图谱、深度学习、神经网络、图嵌入、知识表示学习、推理机制、应用场景摘要：本文深入探讨了知识图谱与深度学习的融合应用，系统性地分析了知识图谱在深度学习中的关键技术路径和应用场景。文章首先介绍了知识图谱的基本概念和表示方法，然后详细阐述了知识图谱与深度学习结合的多种技术路线，包括图神经网络、知识嵌入和推理机制等。接着通过具体案例展示了知识图谱增
搜索领域知识图谱的知识推理算法研究搜索引擎技术知识图谱算法人工智能 ai
搜索领域知识图谱的知识推理算法研究关键词：知识图谱、知识推理、搜索算法、图神经网络、路径推理、规则推理、表示学习摘要：本文深入探讨搜索领域中知识图谱的知识推理算法。我们将从知识图谱的基本概念出发，分析不同类型的知识推理算法原理，包括基于规则的推理、基于表示的推理和基于路径的推理。通过实际案例和代码实现，展示这些算法如何提升搜索效果，最后讨论该领域的未来发展趋势和挑战。背景介绍目的和范围本文旨在系统
【机器学习实战】Datawhale夏令营2：深度学习回顾城主_全栈开发机器学习机器学习深度学习人工智能
#DataWhale夏令营#ai夏令营文章目录1.深度学习的定义1.1深度学习＆图神经网络1.2机器学习和深度学习的关系2.深度学习的训练流程2.1数学基础2.1.1梯度下降法基本原理数学表达步骤学习率α梯度下降的变体2.1.2神经网络与矩阵网络结构表示前向传播激活函数反向传播批处理卷积操作参数更新优化算法正则化初始化2.2激活函数Sigmoid函数:Tanh函数:ReLU函数(Rectified
动态图神经网络在社交网络演化分析中的应用 AI大模型应用实战神经网络网络 php ai
动态图神经网络在社交网络演化分析中的应用关键词：动态图神经网络、社交网络演化分析、图深度学习、时间序列分析、网络动力学摘要：本文深入探讨了动态图神经网络在社交网络演化分析中的应用。首先介绍了相关背景知识，包括目的范围、预期读者等。接着详细阐述了核心概念，如动态图神经网络的原理和架构，并通过示意图和流程图进行直观展示。对核心算法原理进行了深入讲解，结合Python代码给出具体操作步骤。同时，介绍了相
AAAI2022国际顶会Workshop将会讨论些什么？ AINLPer 国际会议自然语言处理深度学习自然语言处理人工智能机器学习神经网络
来源:AINLPer微信公众号（每日论文干货分享！！）编辑:ShuYini校稿:ShuYini时间:2021-12-091、引言目前关于AAAI2022的论文List还没有贴出来，但是目前的WorkShop的日程已经出来了，今天整理了一下给大家分享。本次AAAI2022研讨会计划于2022年2月28日至3月1日，共有39个。其中在技术研究领域涉及：强化学习、图神经网络、交互式机器学习、模型
图神经网络(GNN)模型的基本原理 xiaocai_6666 神经网络人工智能深度学习
一、概述在人工智能领域，数据的多样性促使研究人员不断探索新的模型与算法。传统的神经网络在处理像图像、文本这类具有固定结构的数据时表现出色，但面对具有不规则拓扑结构的图数据，如社交网络、化学分子结构、知识图谱等，却显得力不从心。图神经网络（GraphNeuralNetworks,GNN）是一种直接在图结构数据上运行的神经网络，用于处理节点、边或整个图的特征信息。其核心思想是通过聚合邻域节点的
《A Gentle Introduction to Graph Neural Networks》欧先生^_^ 人工智能
这篇《AGentleIntroductiontoGraphNeuralNetworks》是一篇非常经典且对新手友好的图神经网络入门文章。我将为你深入浅出地解读它的核心思想、关键概念和重要性。这篇论文（更像是一篇博客文章或教程）的主要目的不是提出新的模型，而是系统性地、直观地解释GNN到底是什么，为什么需要它，以及它是如何工作的。我会将解读分为以下几个部分：核心动机：为什么我们需要GNN？核心思想：
图注意力卷积神经网络GAT在无线通信网络拓扑推理中的应用 zzc921 无线通信网络拓扑推理 cnn 人工智能神经网络无线通信网络拓扑推理 WCNA GCN GAT
如果已经编写好了GCN的程序，改写GAT的程序是很方便的，torch_geometric.nn下既有一般图神经网络GCNConv包,也有图注意力神经网络GATConv包程序：#作者：zhouzhichao#创建时间：25年6月10日#内容：比较GAT和GCN在无线通信网络拓扑推理中的效果importwarningswarnings.simplefilter(action='ignore',cate
AI推荐系统演进史：从协同过滤到图神经网络与强化学习的融合万米商云人工智能神经网络深度学习
每一次滑动手机屏幕，电商平台向你推荐心仪商品的背后，是超过百亿量级的浮点运算。从早期的“猜你喜欢”到如今的“比你更懂你”，商品推荐引擎已悄然完成从简单规则到深度智能的技术跃迁。一、协同过滤：推荐系统的基石与演进协同过滤（CollaborativeFiltering）作为推荐系统的“古典方法”，其核心思想朴素却有力：相似的人喜欢相似的东西。早期的矩阵分解技术（如2009年的SVD算法）将用户-物品交
深度解析六大AI爬虫工具：crawl4ai、FireCrawl、Scrapegraph-ai、Jina、SearXNG、Tavily技术对比与实战指南
一、引言在AI大模型时代，数据获取与处理是构建智能应用的核心环节。传统爬虫面临技术门槛高、反爬应对复杂、动态内容处理困难等挑战，而AI驱动的爬虫工具通过融合大语言模型（LLM）、图神经网络、自动化解析等技术，正在重塑数据抓取范式。本文将深度测评6款主流AI爬虫工具，从技术原理、核心功能、实战场景到性能对比，为开发者提供一站式选型指南。二、六大AI爬虫工具深度解析1.FireCrawl：LLM就绪数
基于图神经网络的自然语言处理：融合LangGraph与大型概念模型的情感分析实践人工智能深度学习llm神经网络
在企业数字化转型进程中，非结构化文本数据的处理与分析已成为核心技术挑战。传统自然语言处理方法在处理客户反馈、社交媒体内容和内部文档等复杂数据集时，往往难以有效捕获文本间的深层语义关联和结构化关系。大型概念模型（LargeConceptModels,LCMs）与图神经网络的融合为这一挑战提供了创新解决方案，通过构建基于LangGraph的混合符号-语义处理管道，实现了更精准的情感分析、实体识别和主题
论文研读 | 解耦动态时空图神经网络交通预测时空大数据小组深度学习交通物流时序数据库
DecoupledDynamicSpatial-TemporalGraphNeuralNetworkforTrafficForecasting本文是由中科院大学2022年发表于VLDB会议的一篇文章，作者创新地提出了一种解耦时空框架——DSTF，提升了模型在交通流预测任务中的性能，并在两个真实数据集上进行了验证。作者通过将先验知识融合进模型结构中，从而提升模型性能的思路值得借鉴，以下对论文进行分享
【时空图神经网络 & 交通】相关模型2：STSGCN | 时空同步图卷积网络 | 空间相关性，时间相关性，空间-时间异质性追光者♂ 百题千解计划(项目实战案例）STSGCN 空间-时间同步图卷积模块 STSGCM 深度学习人工智能 Traffic 空间-时间异质性
注：仅学习使用~前情提要：【时空图神经网络&交通】相关模型1：STGCN|完全卷积结构，高效的图卷积近似，瓶颈策略|时间门控卷积层：GLU（GatedLinearUnit），一种特殊的非线性门控单元目录STSGCN-2020年1.1背景1.2模型1.2.1问题背景：现有模型存在的问题1.2.2模型1.3问答Q1：STSGCM补充：构造局部时空图的方式（LocalizedSpatial-Tempor
一文解析13大神经网络算法模型架构攻城狮7号 AI前沿技术要闻深度学习神经网络人工智能机器学习
目录一、引言：神经网络的演进脉络二、基础架构：深度学习的基石2.1人工神经网络（ANN）2.2深度神经网络（DNN）三、专项任务架构：领域定制化突破3.1卷积神经网络（CNN）3.2循环神经网络（RNN）3.3图神经网络（GNN）四、生成模型：从数据到创造4.1生成对抗网络（GAN）4.2变分自编码器（VAE）4.3扩散模型（DiffusionModels）五、现代架构：大模型的核心引擎5.1Tr
基于知识图谱的智能推荐系统实现 AGI大模型与大数据研究院 AI大模型应用开发实战知识图谱人工智能 ai
基于知识图谱的智能推荐系统实现：从"猜你喜欢"到"懂你所想"的进化之旅关键词：知识图谱、智能推荐系统、实体关系、冷启动、可解释性、图神经网络、路径排序算法摘要：你是否好奇过，为什么电商平台总能精准推荐你想买的商品？为什么视频软件总能猜到你喜欢的剧情？传统推荐系统依赖用户行为数据，但面对新用户/新商品时会"抓瞎"，且无法解释"为什么推荐这个"。本文将带你走进"基于知识图谱的智能推荐系统"，用超市导购
探讨推荐系统中的上下文关联性的建模和建模方法——从信息处理的角度 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介在很多推荐系统中，如电影推荐、购物推荐等，根据用户的行为记录、设备信息、上下文环境等进行推荐是很重要的。在复杂多样的推荐场景下，如何同时考虑用户对不同时间段的兴趣以及上下文环境之间的关联性？如何捕获到用户当前的多维信息，而不仅仅局限于单一的主题或品牌？此次论文通过结合时间因素、图神经网络（GraphNeuralNetwork）及上下文关联性，提出一种基于上下文环
十大机器学习算法：理论与实战 Android洋芋人工智能机器学习算法深度学习实战 Kubernetes部署 AI模型优化图神经网络决策树分析
简介机器学习技术持续演进，算法应用场景不断扩展。在众多算法中，有十种算法因其广泛的适用性和强大的表现力被公认为机器学习领域的核心力量。本文将从零开始，系统讲解这些算法的数学原理、应用场景和企业级开发实战，帮助初学者和工程师快速掌握这些算法，并能够将其应用于实际项目中。关键词：机器学习算法、集成学习、图神经网络、逻辑回归、决策树、支持向量机、KNN、k-means、PCA、强化学习一、集成学习算法（
基于连接感知的实时困倦分类图神经网络是Dream呀计算机视觉神经网络分类神经网络数据挖掘
疲劳驾驶是导致交通事故的主要原因之一。脑电图(EEG)是一种直接从大脑活动中检测睡意的方法，已广泛用于实时检测驾驶员的睡意。最近的研究表明，使用基于脑电图数据构建的大脑连接图来预测困倦状态的巨大潜力。然而，传统的脑连接网络与下游预测任务无关。本文提出了一种使用自注意机制的连接感知图神经网络(CAGNN)，该网络可以通过端到端训练生成与任务相关的连接网络。研究方法研究方法基于实时监测驾驶员的脑电活动
【人工智能】图神经网络（GNN）的推理方法 meisongqing 人工智能神经网络
图神经网络（GNN）的推理方法是指利用训练好的模型对图结构数据（如节点、边或整个图）进行预测或决策的过程。其核心在于如何通过图的拓扑结构和节点/边特征，传播和聚合信息以实现目标任务的推理。以下是GNN的主要推理方法分类及其关键技术：1.按推理任务分类(1)节点级推理（Node-LevelInference）任务：预测单个节点的属性（如节点分类、回归）。方法：消息传递（MessagePassing）
图神经网络实战（3）——基于DeepWalk创建节点表示盼小辉丶图神经网络从入门到项目实战神经网络人工智能深度学习
图神经网络实战（3）——基于DeepWalk创建节点表示0.前言1.Word2Vec1.1CBOW与skip-gram1.2构建skip-gram模型1.3skip-gram模型1.4实现Word2Vec模型2.DeepWalk和随机行走3.实现DeepWalk小结系列链接0.前言DeepWalk是机器学习(machinelearning,ML)技术在图数据中的成功应用之一，其引入了嵌入等重要概念
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23