Cziun

【论文阅读】GRAPH ATTENTION NETWORKS

GRAPH ATTENTION NETWORKS（图注意力网络）

摘要
1 引言
2 GAT结构
- 2.1 图注意力层（GRAPH ATTENTIONAL LAYER）
- - 2.1.1 输入输出
  - 2.1.2 特征提取与注意力机制
- 2.1.3 多端注意力机制（multi-head attention）
- 2.2 与相关工作的比较
3 模型评价
- 3.1 数据集
- 3.2 最先进的方法
- 3.3 实验设置
- 3.4 结果
4 结论

摘要

本文提出了一种新的基于图结构数据的神经网络结构——图注意力网络(GATs)，不同于先前一些基于谱域的图神经网络，通过使用masked self-attentional layers 解决了图卷积网络（GCN）方面的一些缺点。通过堆叠层可以获得邻域节点的特征值，这样我们可以（隐式地）为邻域中的不同节点指定不同的权重，而不需要任何形式的复杂的矩阵运算（如转置），也不需要了解图本身的结构。本文同时解决了GCN的几个关键挑战，并使模型同时适用于Inductive和Transductive问题。我们的GAT模型已经在四个已建立的Inductive和Transductive基准上取得或匹配了最先进的结果：Cora、Citeseer和Pubmed引文网络数据集，以及蛋白质相互作用数据集（其中测试图在训练期间是看不见的）。

如何理解 inductive learning 与 transductive learning?

1 引言

由于注意力机制在RNN与CNN中都取得了不错的效果，基于此作者在此篇文章提出了图注意力机制。此方法的优点在于可以处理任意大小输入的问题，并且关注最具有影响能力的输入。

在摘要中作者说明了，本文的attention计算的目的是为每个节点邻域中的节点分配不同的权重，也就是attention是用来关注那些作用比较大的节点，而忽视一些作用较小的节点。

本文提出的GAT模型具有以下三个特点：

attention机制计算效率高，为每一个节点和其每个邻域节点计算attention可以并行进行。
通过指定任意的权重给邻域节点，这个模型可以处理拥有不同度的节点，也就是说，无论一个节点连接多少个邻域节点，这个模型都能按照规则指定权重。
该模型直接适用于inductive learning problem，包括将模型推广到完全不可见图的任务。

2 GAT结构

在这个模块，作者提出了一种图注意力层，通过堆叠这个层来实现图注意力机制。通过与之前神经图处理领域的方法进行比较，阐述其优势及局限性。

2.1 图注意力层（GRAPH ATTENTIONAL LAYER）

首先要描述一个单层的图注意力层，作为一个单独的网络层被用于GAT框架中。

2.1.1 输入输出

上述网络层的输入是一组节点特征的集合：

其中， $N$ 是节点数， $F$ 是每个节点中的特征数。

网络层的输出是一组新的节点特征的集合：

其中，节点数 $N$ 不变，节点的特征数可变化为 $F^{'}$ 。

2.1.2 特征提取与注意力机制

为了将输入特征转换为高维特征（增维）以获得足够的表达能力，至少需要一个可学习的线性变换。因此，为每个节点训练一个权值矩阵 $W∈R^{F×F'}$ ，这个权值矩阵就是输入特征与输出特征的直接关系。

然后，对每个节点进行共享的注意力机制 $a$ ： $R^{F'}×R^{F'}→R$ 来计算注意力系数：

该系数说明了对于节点 $i$ 来说节点 $j$ 的重要性，而忽略图结构性的信息(这个公式模型允许图中所有节点间计算相互间的影响而不是局限于k阶邻居节点)。我们通过执行masked attention将图结构注入到机制中——我们只计算节点 $j∈N_i$ 的 $e_{ij}$ ，其中 $N_i$ 是图中节点 $i$ 的某个邻域。在我们所有的实验中，这些都将是 $i$ (包括 $i$ )的一阶邻居。为了使不同节点之间的系数容易比较，我们使用softmax函数对所有 $j$ 的选择进行正则化：

注意力机制 $a$ （式1）是一个单层前馈神经网络，由 $\vec{a}∈R^{2F'}$ 参数化，并应用LeakyReLU(负输入斜率 $α = 0.2$ )激活。完全展开后，由注意力机制计算的系数（如下图所示）可以表示为：

其中， $T$ 表示转置， $∣ ∣$ 表示连接运算。

激活函数ReLU、Leaky ReLU、PReLU和RReLU。

在得到正则化的注意力系数之后，可以通过计算与其对应的邻接节点特征的线性组合，来更新节点自身的特征作为输出（这里还需要使用一个 $\sigma$ 函数作为非线性激活函数）：

其中：

$W$ 为与输入feature相乘的权重矩阵
$\alpha$ 为之前计算的注意力系数
$\sigma$ 为非线性激活函数
考虑masked attention机制，遍历节点 $i$ 的邻居节点
公式意义：该节点的输出feature与与之相邻的所有节点有关，是他们的线性和的非线性激活。这个线性和的线性系数是前面求得的注意力系数 $\alpha$

2.1.3 多端注意力机制（multi-head attention）

为了稳定自我注意力（self-attention）的学习过程，我们发现扩展我们的机制，采用多端注意力机制是有益的。具体来说，K个独立的注意力机制执行公式（4）的变换，然后将它们的特征进行串联，得到如下的输出特征表示：

其中：

$∣ ∣$ 表示连接运算
$a^k$ 表示第 $k$ 个注意力机制，共需要考虑 $K$ 个注意力机制
$W^k$ 表示相应的输入特征的线性变换的权值矩阵
最终的输出特征 $h^{'}$ 由 $KF^{'}$ 个特征影响

如果我们在最后一层（预测层）使用Multi-head attention mechanism，连接操作就不是很适合了，相反，需要把输出进行平均化，再使用非线性函数（softmax或logistic sigmoid用于分类问题），公式如下：

例如，当 $K = 3$ 的时候结构如下图所示：

图中，节点1在邻域中具有多端注意力机制，不同的箭头样式表示独立的注意力计算，通过连接或平均化每个head获得 $\vec{h}_1'$ 。

2.2 与相关工作的比较

第2.1小节中描述的图注意力层直接解决了用神经网络处理图结构数据方法中存在的几个问题：

在计算上，它是高效的：自注意力层的操作可以在所有边上并行，输出特征的计算可以在所有节点上并行。在运算过程中不需要进行特征分解等高代价的矩阵运算。
与GCNs相比，我们的模型允许（隐式地）为同一邻域的节点分配不同的重要性，从而实现模型容量的飞跃。此外，分析学习到的注意力权重可能会带来可解释性方面的好处。
注意力机制以共享的方式应用于图中的所有边，因此它不依赖于对全局图结构或其所有节点的（特征）的预先访问（这是许多先前技术的限制），因此它具有以下优势：图不需要是无向的（如果边 $j \to i$ 不存在，我们可以简单地忽略计算 $α_{ij}$ ）;使得模型能够处理inductive任务，能够在训练中完全看不到的图形上评估模型。
无需对节点的重要性进行预先排序。

3 模型评价

实验分成两部分，transductive learning（半监督学习）和inductive learning（归纳学习）。

3.1 数据集

Transductive learning：
利用三个标准的引文网络基准数据集——Cora、Citeseer和Pubmed。在所有这些数据集中，节点对应于文档，边（无向）对应于引用。节点特征对应于文档的单词包表示的元素。每个节点都有一个类标签。我们只允许每个类使用20个节点进行训练——然而，在整个transductive learning过程中，训练算法可以访问所有节点的特征向量。在1000个测试节点上评估训练模型的预测能力，并且使用500个额外的节点进行验证。

Inductive learning：
利用蛋白质-蛋白质相互作用(PPI)数据集，该数据集由对应于不同人体组织的图表组成。数据集包含20个用于训练的图，2个用于验证，2个用于测试。关键的是，测试图在训练过程中是完全没有被观察到的。每个图的平均节点数为2372个。每个节点有50个特征，由位置基因集、基序基因集和免疫特征组成。从分子签名数据库收集到的基因本体中的每个节点集有121个标签，一个节点可以同时拥有几个标签。

3.2 最先进的方法

3.3 实验设置

3.4 结果

4 结论

参考博客

图注意力网络 GRAPH ATTENTION NETWORKS
GRAPH ATTENTION NETWORKS 学习翻译
图注意力网络(GAT) ICLR2018, Graph Attention Network论文详解
Graph Attention Networks
全面理解Graph Attention Networks

你可能感兴趣的:(图神经网络)

图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
Spring Data Neo4j 与后端人工智能算法的数据交互 AI大模型应用实战 spring neo4j 人工智能 ai
SpringDataNeo4j与后端人工智能算法的数据交互关键词：SpringDataNeo4j、图数据库、人工智能算法、数据交互、知识图谱、图神经网络、数据集成摘要：本文深入探讨了如何利用SpringDataNeo4j框架实现后端人工智能算法与图数据库的高效数据交互。文章首先介绍了图数据库和人工智能算法的基本概念，然后详细解析了SpringDataNeo4j的核心架构和原理。接着，通过实际代码示
TensorFlow图神经网络(GNN)入门指南 AI天才研究院 AI人工智能与大数据 tensorflow 神经网络人工智能 ai
TensorFlow图神经网络(GNN)入门指南关键词：TensorFlow、图神经网络、GNN、深度学习、图数据、节点嵌入、图卷积网络摘要：本文全面介绍如何使用TensorFlow实现图神经网络(GNN)。我们将从图数据的基本概念开始，深入探讨GNN的核心原理，包括图卷积网络(GCN)、图注意力网络(GAT)等流行架构，并通过TensorFlow代码示例展示如何构建和训练GNN模型。文章还将涵盖
基于图神经网络的ALS候选药物预测模型设计与实现神经网络15044 MATLAB专栏神经网络深度学习神经网络人工智能深度学习机器学习
基于图神经网络的ALS候选药物预测模型设计与实现一、任务背景与意义肌萎缩侧索硬化症（ALS）是一种致命的神经退行性疾病，目前尚无有效治愈方法。传统药物发现流程耗时长、成本高，而人工智能技术为加速药物发现提供了新途径。本文设计并实现了一个基于图神经网络（GNN）的ALS候选药物预测模型，通过整合分子图结构信息和生物活性数据，实现对潜在治疗ALS化合物的高效筛选。二、系统架构设计
NeighborGeo：基于邻居的IP地理定位（一）路由跳变 IP geolocation tcp/ip 网络协议网络
NeighborGeo：基于neighbors的IP地理定位X.Wang,D.Zhao,X.Liu,Z.Zhang,T.Zhao,NeighborGeo:IPgeolocationbasedonneighbors,Comput.Netw.257(2025)110896,AbstractIP地址定位在网络安全、电子商务、社交媒体等领域至关重要。当前主流的图神经网络方法通过将IP定位任务重构为属性图中
GNN多任务预测模型实现（二）：将EXCEL数据转换为图数据走的远一些神经网络知识分享知识备份人工智能深度学习
目录一.引言二.加载和检查数据三.提取特征和标签四.标准化特征五.构建节点索引六.构建边及其特征七.总结八.结语一.引言在图神经网络（GraphNeuralNetworks,GNNs）的多任务学习场景中，数据预处理是至关重要的一步。尤其是当我们的数据存储在表格格式（如Excel文件）中时，如何有效地将其转换为图数据格式，是搭建GNN模型的基础。二.加载和检查数据第一步是加载数据并检查其格式。我们通
顶会新方向！14篇图神经网络（GNN）最新顶会论文汇总！（含2024） AI科研技术派神经网络人工智能深度学习
图神经网络（GNN）是深度学习领域中备受关注的前沿课题，它在处理图结构数据方面展现出了强大的潜力，随着研究的不断深入，越来越多的优秀论文在顶级学术会议上涌现。今天就给大家整理了14篇顶会中发表的图神经网络优质论文，一起看看这方面的最新研究成果吧！AAAI20241、Fine-tuningGraphNeuralNetworksbyPreservingGraphGenerativePatterns通过
AI人工智能领域知识图谱在深度学习中的应用拓展
AI人工智能领域知识图谱在深度学习中的应用拓展关键词：知识图谱、深度学习、神经网络、图嵌入、知识表示学习、推理机制、应用场景摘要：本文深入探讨了知识图谱与深度学习的融合应用，系统性地分析了知识图谱在深度学习中的关键技术路径和应用场景。文章首先介绍了知识图谱的基本概念和表示方法，然后详细阐述了知识图谱与深度学习结合的多种技术路线，包括图神经网络、知识嵌入和推理机制等。接着通过具体案例展示了知识图谱增
搜索领域知识图谱的知识推理算法研究搜索引擎技术知识图谱算法人工智能 ai
搜索领域知识图谱的知识推理算法研究关键词：知识图谱、知识推理、搜索算法、图神经网络、路径推理、规则推理、表示学习摘要：本文深入探讨搜索领域中知识图谱的知识推理算法。我们将从知识图谱的基本概念出发，分析不同类型的知识推理算法原理，包括基于规则的推理、基于表示的推理和基于路径的推理。通过实际案例和代码实现，展示这些算法如何提升搜索效果，最后讨论该领域的未来发展趋势和挑战。背景介绍目的和范围本文旨在系统
【机器学习实战】Datawhale夏令营2：深度学习回顾城主_全栈开发机器学习机器学习深度学习人工智能
#DataWhale夏令营#ai夏令营文章目录1.深度学习的定义1.1深度学习＆图神经网络1.2机器学习和深度学习的关系2.深度学习的训练流程2.1数学基础2.1.1梯度下降法基本原理数学表达步骤学习率α梯度下降的变体2.1.2神经网络与矩阵网络结构表示前向传播激活函数反向传播批处理卷积操作参数更新优化算法正则化初始化2.2激活函数Sigmoid函数:Tanh函数:ReLU函数(Rectified
动态图神经网络在社交网络演化分析中的应用 AI大模型应用实战神经网络网络 php ai
动态图神经网络在社交网络演化分析中的应用关键词：动态图神经网络、社交网络演化分析、图深度学习、时间序列分析、网络动力学摘要：本文深入探讨了动态图神经网络在社交网络演化分析中的应用。首先介绍了相关背景知识，包括目的范围、预期读者等。接着详细阐述了核心概念，如动态图神经网络的原理和架构，并通过示意图和流程图进行直观展示。对核心算法原理进行了深入讲解，结合Python代码给出具体操作步骤。同时，介绍了相
AAAI2022国际顶会Workshop将会讨论些什么？ AINLPer 国际会议自然语言处理深度学习自然语言处理人工智能机器学习神经网络
来源:AINLPer微信公众号（每日论文干货分享！！）编辑:ShuYini校稿:ShuYini时间:2021-12-091、引言目前关于AAAI2022的论文List还没有贴出来，但是目前的WorkShop的日程已经出来了，今天整理了一下给大家分享。本次AAAI2022研讨会计划于2022年2月28日至3月1日，共有39个。其中在技术研究领域涉及：强化学习、图神经网络、交互式机器学习、模型
图神经网络(GNN)模型的基本原理 xiaocai_6666 神经网络人工智能深度学习
一、概述在人工智能领域，数据的多样性促使研究人员不断探索新的模型与算法。传统的神经网络在处理像图像、文本这类具有固定结构的数据时表现出色，但面对具有不规则拓扑结构的图数据，如社交网络、化学分子结构、知识图谱等，却显得力不从心。图神经网络（GraphNeuralNetworks,GNN）是一种直接在图结构数据上运行的神经网络，用于处理节点、边或整个图的特征信息。其核心思想是通过聚合邻域节点的
《A Gentle Introduction to Graph Neural Networks》欧先生^_^ 人工智能
这篇《AGentleIntroductiontoGraphNeuralNetworks》是一篇非常经典且对新手友好的图神经网络入门文章。我将为你深入浅出地解读它的核心思想、关键概念和重要性。这篇论文（更像是一篇博客文章或教程）的主要目的不是提出新的模型，而是系统性地、直观地解释GNN到底是什么，为什么需要它，以及它是如何工作的。我会将解读分为以下几个部分：核心动机：为什么我们需要GNN？核心思想：
图注意力卷积神经网络GAT在无线通信网络拓扑推理中的应用 zzc921 无线通信网络拓扑推理 cnn 人工智能神经网络无线通信网络拓扑推理 WCNA GCN GAT
如果已经编写好了GCN的程序，改写GAT的程序是很方便的，torch_geometric.nn下既有一般图神经网络GCNConv包,也有图注意力神经网络GATConv包程序：#作者：zhouzhichao#创建时间：25年6月10日#内容：比较GAT和GCN在无线通信网络拓扑推理中的效果importwarningswarnings.simplefilter(action='ignore',cate
AI推荐系统演进史：从协同过滤到图神经网络与强化学习的融合万米商云人工智能神经网络深度学习
每一次滑动手机屏幕，电商平台向你推荐心仪商品的背后，是超过百亿量级的浮点运算。从早期的“猜你喜欢”到如今的“比你更懂你”，商品推荐引擎已悄然完成从简单规则到深度智能的技术跃迁。一、协同过滤：推荐系统的基石与演进协同过滤（CollaborativeFiltering）作为推荐系统的“古典方法”，其核心思想朴素却有力：相似的人喜欢相似的东西。早期的矩阵分解技术（如2009年的SVD算法）将用户-物品交
深度解析六大AI爬虫工具：crawl4ai、FireCrawl、Scrapegraph-ai、Jina、SearXNG、Tavily技术对比与实战指南
一、引言在AI大模型时代，数据获取与处理是构建智能应用的核心环节。传统爬虫面临技术门槛高、反爬应对复杂、动态内容处理困难等挑战，而AI驱动的爬虫工具通过融合大语言模型（LLM）、图神经网络、自动化解析等技术，正在重塑数据抓取范式。本文将深度测评6款主流AI爬虫工具，从技术原理、核心功能、实战场景到性能对比，为开发者提供一站式选型指南。二、六大AI爬虫工具深度解析1.FireCrawl：LLM就绪数
基于图神经网络的自然语言处理：融合LangGraph与大型概念模型的情感分析实践人工智能深度学习llm神经网络
在企业数字化转型进程中，非结构化文本数据的处理与分析已成为核心技术挑战。传统自然语言处理方法在处理客户反馈、社交媒体内容和内部文档等复杂数据集时，往往难以有效捕获文本间的深层语义关联和结构化关系。大型概念模型（LargeConceptModels,LCMs）与图神经网络的融合为这一挑战提供了创新解决方案，通过构建基于LangGraph的混合符号-语义处理管道，实现了更精准的情感分析、实体识别和主题
论文研读 | 解耦动态时空图神经网络交通预测时空大数据小组深度学习交通物流时序数据库
DecoupledDynamicSpatial-TemporalGraphNeuralNetworkforTrafficForecasting本文是由中科院大学2022年发表于VLDB会议的一篇文章，作者创新地提出了一种解耦时空框架——DSTF，提升了模型在交通流预测任务中的性能，并在两个真实数据集上进行了验证。作者通过将先验知识融合进模型结构中，从而提升模型性能的思路值得借鉴，以下对论文进行分享
【时空图神经网络 & 交通】相关模型2：STSGCN | 时空同步图卷积网络 | 空间相关性，时间相关性，空间-时间异质性追光者♂ 百题千解计划(项目实战案例）STSGCN 空间-时间同步图卷积模块 STSGCM 深度学习人工智能 Traffic 空间-时间异质性
注：仅学习使用~前情提要：【时空图神经网络&交通】相关模型1：STGCN|完全卷积结构，高效的图卷积近似，瓶颈策略|时间门控卷积层：GLU（GatedLinearUnit），一种特殊的非线性门控单元目录STSGCN-2020年1.1背景1.2模型1.2.1问题背景：现有模型存在的问题1.2.2模型1.3问答Q1：STSGCM补充：构造局部时空图的方式（LocalizedSpatial-Tempor
一文解析13大神经网络算法模型架构攻城狮7号 AI前沿技术要闻深度学习神经网络人工智能机器学习
目录一、引言：神经网络的演进脉络二、基础架构：深度学习的基石2.1人工神经网络（ANN）2.2深度神经网络（DNN）三、专项任务架构：领域定制化突破3.1卷积神经网络（CNN）3.2循环神经网络（RNN）3.3图神经网络（GNN）四、生成模型：从数据到创造4.1生成对抗网络（GAN）4.2变分自编码器（VAE）4.3扩散模型（DiffusionModels）五、现代架构：大模型的核心引擎5.1Tr
基于知识图谱的智能推荐系统实现 AGI大模型与大数据研究院 AI大模型应用开发实战知识图谱人工智能 ai
基于知识图谱的智能推荐系统实现：从"猜你喜欢"到"懂你所想"的进化之旅关键词：知识图谱、智能推荐系统、实体关系、冷启动、可解释性、图神经网络、路径排序算法摘要：你是否好奇过，为什么电商平台总能精准推荐你想买的商品？为什么视频软件总能猜到你喜欢的剧情？传统推荐系统依赖用户行为数据，但面对新用户/新商品时会"抓瞎"，且无法解释"为什么推荐这个"。本文将带你走进"基于知识图谱的智能推荐系统"，用超市导购
探讨推荐系统中的上下文关联性的建模和建模方法——从信息处理的角度 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介在很多推荐系统中，如电影推荐、购物推荐等，根据用户的行为记录、设备信息、上下文环境等进行推荐是很重要的。在复杂多样的推荐场景下，如何同时考虑用户对不同时间段的兴趣以及上下文环境之间的关联性？如何捕获到用户当前的多维信息，而不仅仅局限于单一的主题或品牌？此次论文通过结合时间因素、图神经网络（GraphNeuralNetwork）及上下文关联性，提出一种基于上下文环
十大机器学习算法：理论与实战 Android洋芋人工智能机器学习算法深度学习实战 Kubernetes部署 AI模型优化图神经网络决策树分析
简介机器学习技术持续演进，算法应用场景不断扩展。在众多算法中，有十种算法因其广泛的适用性和强大的表现力被公认为机器学习领域的核心力量。本文将从零开始，系统讲解这些算法的数学原理、应用场景和企业级开发实战，帮助初学者和工程师快速掌握这些算法，并能够将其应用于实际项目中。关键词：机器学习算法、集成学习、图神经网络、逻辑回归、决策树、支持向量机、KNN、k-means、PCA、强化学习一、集成学习算法（
基于连接感知的实时困倦分类图神经网络是Dream呀计算机视觉神经网络分类神经网络数据挖掘
疲劳驾驶是导致交通事故的主要原因之一。脑电图(EEG)是一种直接从大脑活动中检测睡意的方法，已广泛用于实时检测驾驶员的睡意。最近的研究表明，使用基于脑电图数据构建的大脑连接图来预测困倦状态的巨大潜力。然而，传统的脑连接网络与下游预测任务无关。本文提出了一种使用自注意机制的连接感知图神经网络(CAGNN)，该网络可以通过端到端训练生成与任务相关的连接网络。研究方法研究方法基于实时监测驾驶员的脑电活动
【人工智能】图神经网络（GNN）的推理方法 meisongqing 人工智能神经网络
图神经网络（GNN）的推理方法是指利用训练好的模型对图结构数据（如节点、边或整个图）进行预测或决策的过程。其核心在于如何通过图的拓扑结构和节点/边特征，传播和聚合信息以实现目标任务的推理。以下是GNN的主要推理方法分类及其关键技术：1.按推理任务分类(1)节点级推理（Node-LevelInference）任务：预测单个节点的属性（如节点分类、回归）。方法：消息传递（MessagePassing）
图神经网络实战（3）——基于DeepWalk创建节点表示盼小辉丶图神经网络从入门到项目实战神经网络人工智能深度学习
图神经网络实战（3）——基于DeepWalk创建节点表示0.前言1.Word2Vec1.1CBOW与skip-gram1.2构建skip-gram模型1.3skip-gram模型1.4实现Word2Vec模型2.DeepWalk和随机行走3.实现DeepWalk小结系列链接0.前言DeepWalk是机器学习(machinelearning,ML)技术在图数据中的成功应用之一，其引入了嵌入等重要概念
Dijkstra算法对比图神经网络（GNN）爱吃青菜的大力水手算法神经网络人工智能自动化调度算法机器学习
什么是AI模型？AI模型（人工智能模型）是一类模仿人类智能行为的数学模型或算法。它们通过从大量数据中学习，识别模式、做出预测或决策。常见的AI模型包括机器学习模型（如决策树、神经网络、支持向量机）和深度学习模型（如卷积神经网络CNN、循环神经网络RNN）。简单来说，AI模型就像一个“智能大脑”，通过训练数据来掌握某种技能，比如分类、预测或规划。AI模型如何使用到机器人调度算法中？机器人调度是指规划
从零到前沿：2025年人工智能系统性学习路径与最新技术融合指南小李独爱秋人工智能人工智能学习
一、构建人工智能认知框架（一）基础学科筑基数学核心能力线性代数：掌握矩阵运算（张量分解在推荐系统的应用）与特征值分析（PCA降维原理）概率统计：贝叶斯网络在医疗诊断中的应用，蒙特卡洛方法在强化学习的采样策略优化理论：2025年主流的元学习（Meta-Learning）框架中的二阶优化算法发展计算机科学基础数据结构：图神经网络（GNN）中的邻接矩阵存储优化操作系统：分布式训练中的GPU资源调度策略（
论文阅读-Quantum Annealing and Graph Neural Networks for Solving TSP with QUBO 酒饮微醉- 论文阅读
Q:这篇论文试图解决什么问题？A:这篇论文探讨了如何应用量子退火（QuantumAnnealing,QA）算法和图神经网络（GraphNeuralNetworks,GNNs）解决旅行商问题（TravellingSalesmanProblem,TSP）。TSP是一个经典的组合优化问题，它要求在给定的加权图中找到一条经过所有顶点恰好一次并返回起始点的最短路径。这个问题在实际应用中非常广泛，如物流、电子
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他