让AI服务于我

Iterative Deep Graph Learning for Graph Neural Networks: Better and Robust Node Embeddings

摘要：在本文中，我们提出了一个端到端的图学习框架，即迭代深度图学习（IDGL），用于联合和迭代地学习图结构和图嵌入。IDGL的关键理论是基于更好的节点嵌入来学习更好的图结构，反之亦然（即基于更好的图结构来学习更好的节点嵌入）。我们的迭代方法在学习到的图结构足够接近于下游预测任务优化的图时动态停止。此外，我们将图学习问题作为相似度度量学习问题，并利用自适应图正则化来控制学习图的质量。最后，我们结合锚点近似技术，进一步提出了IDGL的可扩展版本，即IDGL-ANCH，它显著降低了IDGL的时间和空间复杂度，同时不影响性能。我们在九个基准测试中进行了广泛实验，结果表明我们提出的IDGL模型可以始终优于或与最先进的基线模型相匹配。此外，IDGL在处理对抗性图和处理传导性和归纳性学习方面更具有鲁棒性。

1 介绍

近年来，图神经网络（GNN）受到了越来越多的关注，尤其是在开发更有效的GNN用于节点分类[29,36,17,52]、图分类[60,43]和图生成[47,37,61]方面做出了不懈的努力。尽管GNN具有学习表达性节点嵌入的强大能力，但不幸的是，它们只能在有图结构的数据可用时使用。许多实际应用自然地采用网络结构数据（例如社交网络）。然而，这些内在的图结构并不总是下游任务的最佳选择。部分原因是原始图是从原始特征空间构建的，可能不反映特征提取和转换后的“真实”图拓扑。另一个潜在的原因是，由于数据测量或收集时难免存在误差，真实世界的图往往存在噪声或甚至不完整。此外，许多应用程序（如自然语言处理[7,57,58]）可能仅具有序列数据或甚至只有原始特征矩阵，需要从原始数据矩阵中构建额外的图。
为了解决这些限制，我们提出了一个端到端的图学习框架，即迭代深度图学习（IDGL），用于联合迭代学习图结构和GNN参数，这些参数针对下游预测进行了优化。
IDGL框架的关键是在更好的节点嵌入的基础上学习更好的图结构，同时，在更好的图构造的基础上，学习更好的节点嵌入。特别是，IDGL是一种新的迭代方法，旨在搜索一种隐式图结构，该隐式图构造扩充了初始图结构（如果不可用，我们使用kNN图），目的是优化下游预测任务的图。当学习到的图结构足够接近为下游任务优化的图时，迭代方法调整何时在每个小批量中停止。
此外，我们提出了一种使用多头自注意力和ε-邻域稀疏化构建图的图学习神经网络。此外，与[25]中直接优化邻接矩阵而不考虑下游任务的方法不同，我们通过优化联合损失来学习图度量学习函数，该联合损失结合了任务特定的预测损失和图正则化损失。最后，我们进一步提出了我们IDGL框架的可扩展版本，即IDGL-ANCH，通过结合基于锚点的逼近技术，将时间和内存复杂度从与图节点数量平方成正比降至与图节点数量线性成正比。
简而言之，我们将主要贡献总结如下：

我们提出了一种新的端到端图学习框架（IDGL），用于联合迭代学习图结构和图嵌入。当学习的图结构接近优化的图（用于预测）时，IDGL动态停止。据我们所知，我们是第一个将迭代学习引入图结构学习的。
结合基于锚点的近似技术，我们进一步提出了IDGL的可扩展版本，即IDGL-ANCH，它在计算时间和内存消耗方面都实现了相对于图节点数量的线性复杂性。
实验结果表明，我们的模型在各种下游任务上始终优于或匹配最先进的基线。更重要的是，IDGL可以对对抗性图示例更具鲁棒性，并且可以处理转导学习和归纳学习。

2 迭代的深度图学习框架

2.1 问题公式化

假设图G为 $G = (V, E)$ ，由n个节点 $v_i \in V$ 组成，具有一个初始节点特征矩阵 $\in \mathbb{R}^{d \times n}$ ，边 $({v_i, v_j}) \in E$ （二元或加权）形成一个初始的带噪声邻接矩阵 $A^{(0)} \in \mathbb{R}^{n \times n}$ ，和一个度矩阵 $D^{(0)}_{ii} = \sum_{j} A^{(0)}_{ij}$ 。给定一个带噪声的图输入 $G:({A^{(0)},X})$ 或仅有一个特征矩阵 $\in \mathbb{R}^{d \times n}$ ，我们在本文中考虑的深度图学习问题是，产生一个优化的图 $G^{\circ}:({A^{\circ},X})$ 及其相应的图节点嵌入 $Z=f_{G^{\circ},\theta}(G^{\circ}) \in \mathbb{R}^{h \times n}$ ，关于某个（半）监督下游任务。值得注意的是，我们假设图噪声只来自图的拓扑结构（邻接矩阵），而节点特征矩阵 $X$ 是无噪声的。当图的拓扑结构和节点特征矩阵都存在噪声时，这种情况更具挑战性，将作为我们未来工作的一部分。在不失一般性的情况下，本文中考虑了节点级和图级预测任务。
图拓扑对于GNN学习表达型图节点嵌入至关重要。大多数现有的GNN方法只是假设输入图拓扑是完美的。这在实践中不一定是真的，因为真实世界的图通常是有噪声的或不完整的。更重要的是，所提供的输入图可能不适合监督的下游任务，因为大多数原始图是从原始特征空间构建的，在高级特征转换后，原始特征空间可能无法反映“真实”的图拓扑。一些先前的工作[52]通过对先前学习的节点嵌入使用自注意来重新加权邻域节点嵌入的重要性来缓解这一问题，该自注意仍然假设原始图连通性信息是无噪声的。
为了处理潜在的噪声输入图，我们提出了我们新的IDGL框架，该框架将问题公式化为迭代学习问题，该问题联合学习图结构和GNN参数。我们的IDGL框架的关键原理是基于更好的节点嵌入来学习更好的图结构，同时，基于更好的图构造来学习更好地节点嵌入，如图所示。2。与大多数现有的基于原始节点特征构建图的方法不同，GNN学习的节点嵌入（针对下游任务进行优化）可以为学习更好的图结构提供有用的信息。另一方面，新学习的图结构可以是GNN学习更好的节点嵌入的更好的图输入。

特别是，IDGL是一种新的迭代方法，旨在搜索一种隐式图结构，该隐式图结构化为下游预测任务扩充初始图结构（如果不可用，我们使用kNN图）。基于我们提出的停止准则，当学习到的图结构足够接近优化图（相对于下游任务）时，迭代方法在每个小批量中动态停止。此外，可以以端到端的方式针对下游任务优化图构建过程.

2.3 图的相似性度量学习

之前的方法（例如[15]）将图学习问题建模为在图的边缘上学习联合离散概率分布，已经表现出了很好的性能。但是，由于它们假设图节点已知，通过优化边缘连接性无法处理归纳设置（即在测试期间有新节点的情况）。为了解决这个问题，我们将图结构学习问题视为相似度度量学习，该度量将与专门用于下游任务的预测模型一起进行联合训练。
图相似性度量学习 度量学习的常见选项包括余弦相似性[44，54]、径向基函数（RBF）核[59，34]和注意力机制[51，23]。一个好的相似性度量函数应该是可学习的并且具有强大的表达能力。尽管我们的框架对各种相似性度量函数是不可知的，但在不失一般性的情况下，我们设计了加权余弦相似性作为我们的度量函数，将 $s_{ij}$ 定义为以下相似度度量函数： $s^p_{ij} = \cos(\mathbf{w_p} \odot \mathbf{v_i}, \mathbf{w_p} \odot \mathbf{v_j}) \\(1)$ ，其中d表示Hadamard积，w是一个可学习的权重向量，与输入向量vi和vj具有相同的维度，并学习突出向量的不同维度。注意，两个输入向量可以是原始节点特征或计算节点嵌入。

为了稳定学习过程并增强表现力，我们将相似度度量函数扩展到多头版本（类似于[51, 52]中的观察结果）。具体而言，我们使用m个权重向量（每个向量代表一种视角）来使用上述相似度函数计算m个独立的相似度矩阵，并将它们的平均值作为最终相似度： $s_{ij} = \frac{1}{m} \sum_{p=1}^{m} s^p_{ij}$ 其中， $s_{ij}$ 表示在第p个视角下计算 $v_i$ 和 $v_j$ 之间的余弦相似度，其中每个视角考虑向量中的不同语义部分。

使用 $ε$ -邻域进行图稀疏化 通常，从度量计算得出的邻接矩阵应该是非负的，但是 $s_{ij}$ 的范围在 $[- 1, 1]$ 之间。此外，许多基础图结构比完全连接的图更稀疏，这不仅计算成本高昂，而且可能会引入噪声（即不重要的边）。因此，我们通过仅考虑每个节点的ε-邻域，从 $S$ 中提取一个对称的稀疏非负邻接矩阵 $A$ 。具体而言，我们将 $S$ 中小于非负阈值 $ε$ 的元素掩码（即设为零）。
基于锚点的可扩展度量学习 类似于公式（1）的上述相似度度量函数计算所有图节点对的相似度得分，这需要 $O(n^2)$ 的计算时间和内存消耗，从而在大型图中出现了显著的可扩展性问题。为了解决可扩展性问题，受以前基于锚点的方法[41, 55]的启发，我们设计了一种基于锚点的可扩展度量学习技术，该技术学习了一个节点-锚点亲和矩阵 $\in \mathbb{R}^{n \times s}$ （即时间和空间复杂度都需要 $O (n s)$ ，其中 $s$ 是锚点的数量）来描述节点集合 $V$ 和锚点集合 $U$ 之间的关系。请注意， $s$ 是一个超参数，可以在开发集上进行调整。
具体而言，在大型图中，我们从节点集合 $V$ 中随机抽取一组大小为 $\in U$ 的锚点集合，其中 $s$ 通常远小于 $n$ 。因此，锚点嵌入被设置为相应的节点嵌入。因此，公式（1）可以重写为以下形式： $a^p_{ik} = \cos(\mathbf{w_p} \odot \mathbf{v_i}, \mathbf{w_p} \odot \mathbf{u_k}), \quad a^p_{ik} = \frac{1}{m} \sum_{p=1}^{m} a^p_{ik} \\(2)$
其中 $a_{ik}$ 是节点 $v_i$ 和锚点 $u_k$ 之间的亲和分数。类似地，我们将 $\epsilon$ -邻域稀疏化技术应用于节点-锚点亲和分数 $a_{ik}$ ，以获得稀疏且非负的节点-锚点亲和矩阵 $R$ 。

2.4 图节点嵌入和预测

尽管初始图可能存在噪声，但通常仍携带有关真实图拓扑的丰富和有用信息。理想情况下，学习得到的图结构 $A$ 可以补充原始图拓扑 $A^{(0)}$ ，以针对下游任务构建优化的GNN图。因此，我们在温和的假设下认为，优化的图结构可能是从初始图结构“偏移”得来的，我们将学习得到的图与初始图结构组合起来。
$A^{(t)} = \lambda L^{(0)} + (1 - \lambda) \left[\eta f(A^{(t)}) + (1-\eta) f(A^{(1)})\right]\\(3)$ 其中， $L^{(0)} = D^{(0)-\frac{1}{2}} A^{(0)}D^{(0)-\frac{1}{2}}$ 是初始图的归一化邻接矩阵。 $A^{(t)}$ 和 $A^{(1)}$ 分别是第 $t$ 次迭代和第 $1$ 次迭代（使用公式（1））计算的两个邻接矩阵。邻接矩阵进一步进行行归一化，即 $f(A)_{i,j} = \frac{A_{i,j}}{\sqrt{\sum_j A_{i,j}}}$ 。
需要注意的是， $A^{(1)}$ 是从原始节点特征 $X$ 计算得出的，而 $A^{(t)}$ 是从先前更新的节点嵌入 $Z_{t-1}$ 中计算得出的，该嵌入已经针对下游预测任务进行了优化。因此，我们将最终学习到的图结构作为它们的线性组合，由一个超参数 $\eta$ 加权，以便结合两者的优点。最后，另一个超参数 $\lambda$ 用于平衡学习到的图结构和初始图结构之间的权衡。如果没有这样的初始图结构，则可以使用基于余弦相似度使用原始节点特征 $X$ 构建的 $k$ 最近邻图。

我们的图学习框架对于各种GNN架构（接受节点特征矩阵和邻接矩阵作为输入来计算节点嵌入）和预测任务是不可知的。在本文中，我们采用了一个两层的GCN[29]，其中第一层（表示为GNN1）将原始节点特征 $X$ 映射到中间嵌入空间，第二层（表示为GNN2）进一步将中间节点嵌入 $Z$ 映射到输出空间。
式（4）中， $\operatorname{ReLU}(P(\mathbf{X}, \mathbf{A}, \mathbf{W}_1))，Y = \sigma(P(\mathbf{Z}, \mathbf{A}, \mathbf{W}2))，L_{\text{pred}} = \mathcal{L}(Y, y) \\(4)$ ，其中 $\sigma$ 和 $\mathcal{L}$ 分别为任务相关的输出函数和损失函数。例如，对于分类任务， $\sigma$ 是一个softmax函数，用于预测一组类别的概率分布， $\mathcal{L}$ 是一个交叉熵函数，用于计算预测损失。 $P(\cdot)$ 是一个消息传递函数，在GCN中， $\mathbf{A}) = \mathbf{A} F \mathbf{W}$ ，其中 $F$ 是一个特征/嵌入矩阵， $\mathbf{A}$ 是通过使用公式（3）获得的归一化邻接矩阵。

Node-anchor消息传递:
需要注意的是，一个节点-锚点亲和力矩阵 $R$ 可以作为二分图 $B$ 的加权邻接矩阵，只允许节点和锚点之间的直接连接。如果我们将节点和锚点之间的直接转移视为由 $R$ 描述的一步转移，建立在平稳马尔可夫随机游走理论[42]的基础上，我们实际上可以通过计算两步转移概率来从 $R$ 中恢复节点图 $G$ 和锚点图 $Q$ 。设 $\in \mathbb{R}^{n \times n}$ 是节点图 $G$ 的行标准化邻接矩阵， $A_{ij} = p^{(2)}(v_j|v_i)$ 表示从节点 $v_i$ 到 $v_j$ 的两步转移概率，则可以从 $R$ 中恢复 $A$ 。

$\Delta^{-1} R \Lambda^{-1} R^T\\(5)$

其中 Λ ∈ R^s×s (Λ_kk = Σ_i=1ⁿ R_ik) 和 Δ ∈ R^n×n (Δ_ii = Σ_k=1^s R_ik) 都是对角矩阵。类似地，我们可以恢复锚图 Q 的行归一化邻接矩阵 B ∈ R^s×s：
$B = Λ^{-1}R^TΔ^{-1}R\\ (6)$
有兴趣的自己看看吧，矫正公式太浪费时间，其实讲的是以前消息传递是基于A去传递的，现在变成了节点到锚点，然后锚点再到节点这样一个过程，然后把上面提到的基于A计算的公式替换成了基于节点-锚点-节点的计算公式

2.5 图的正则化

虽然将学习到的图Aptq与初始图Ap0q结合是接近优化图的有效方法，但学习到的图Aptq的质量对于提高最终图rAptq的质量起着重要作用。在实践中，控制生成的学习图Aptq的平滑性、连通性和稀疏性非常重要，这能够忠实地反映出与初始节点属性X和下游任务相关的图拓扑结构。

假设将特征矩阵X的每一列视为图信号。对于图信号，广泛采用的假设是相邻节点之间的值变化平滑。给定一个带权重对称邻接矩阵A的无向图，通常通过Dirichlet能量进行度量，如下所示：

其中，tr(·)表示矩阵的迹，L=D-A是图拉普拉斯矩阵，D是度矩阵，定义为 $D=diag(∑_jA_{ij})$ 。通过最小化Dirichlet能量，可以强制要求相邻节点具有相似的特征，从而实现在与A相关联的图上的图信号平滑。
然而，仅最小化平滑损失将导致平凡解A=0。此外，希望能够控制生成的图的稀疏性。按照[25]的方法，我们对学习到的图施加额外的约束，如下所示：

其中， $A||_F$ 表示Frobenius范数， $f (A)$ 是对图A的惩罚函数。这些约束将鼓励学习到的图具有更强的稀疏性。这些内容可以在我上一篇关于图结构学习的内容中找到。我们将总体图正则化损失定义为上述损失的总和，即 $L_G = αΩ(A,X) + f(A)$ ，其中 $α$ 、 $β$ 和 $γ$ 均为非负超参数，这有助于控制学习图的平滑性、连通性和稀疏性。

锚点图正则化 如公式（6）所示，我们可以在 $O(ns^2)$ 时间复杂度内获得锚点图 $Q$ 的行归一化邻接矩阵 $B$ 。为了控制学习到的节点-锚点亲和矩阵 $R$ 的质量（这可以隐式地控制节点邻接矩阵 $A$ 的质量），我们将上述图正则化技术应用于锚点图。值得注意的是，我们提出的图正则化损失仅适用于非负对称邻接矩阵[26]。因此，我们选择将图正则化应用于其未归一化版本 $B$ ，而不是常常不对称的 $B$ ，其中 $L_G = αΩ(\hat B,X^U)+ f(\hat B)$ ，其中 $X^U$ 表示从节点嵌入 $X$ 中抽样的锚点嵌入集合。

2.6 混合损失的联合学习

与直接基于图正则化损失[26]或任务相关预测损失[15]优化邻接矩阵的以往工作相比，我们提出了一种联合迭代学习图结构和GNN参数的方法，通过最小化混合损失函数 $L = L_{pred} + L_G$ 来实现，其中 $L_{pred}$ 和 $L_G$ 分别为任务预测损失和图正则化损失。IDGL框架的完整算法在算法1中给出。可以看到，我们的模型使用更新的节点嵌入（公式（1））反复优化邻接矩阵，并使用更新的邻接矩阵（公式（3）和（4））优化节点嵌入，直到连续迭代之间邻接矩阵之间的差异小于某个阈值。需要注意的是，相比于全局使用固定的迭代次数，我们的动态停止准则更加有利，特别是对于小批量训练。在每次迭代中，计算既考虑任务相关预测损失又考虑图正则化损失的混合损失。在所有迭代之后，将整体损失通过所有先前的迭代进行反向传播，以更新模型参数。值得注意的是，算法1同样适用于IDGL-ANCH。IDGL和IDGL-ANCH之间的主要区别在于我们如何计算邻接（或亲和）矩阵，以及如何执行消息传递和图正则化。

3 实验

在本节中，我们进行了广泛的实验，以验证IDGL和IDGL-ANCH在各种设置中的有效性。我们提出的模型的实施可在Code.
数据集和基线 我们实验中使用的基准数据集包括四个引文网络数据集（即Cora、Citeseer、Pubmed和ogbn-arxiv）[48,21]，其中图拓扑结构是可用的，三个非图数据集（即Wine、Breast Cancer（Cancer）和Digits）[11]，其中没有图拓扑结构，以及两个文本基准（即20Newsgroups数据（20News）和电影评论数据（MRD））[32,46]，我们将文档视为一个包含每个单词的节点的图。前七个数据集都是在传递性设置下的节点分类任务，我们遵循以前的工作的实验设置[29,15,21]。后两个数据集是在归纳性设置下的图级预测任务。有关详细的数据统计，请参见附录C.1。我们的主要基准线是LDS [15]，但它不能处理归纳学习问题，因此我们只报告其在传递性数据集上的结果。此外，对于引文网络数据集，我们包括其他GNN变体（即GCN [29]、GAT [52]、GraphSAGE [18]、APPNP [30]、H-GCN [20]和GDC [31]）作为基准。对于没有图拓扑结构的非图和文本基准，我们构建了各种 $GNN_{kNN}$ 基线（即 $GCN_{kNN}$ 、 $GAT_{kNN}$ 和 $GraphSAGE_{kNN}$ ），其中在应用GNN模型之前，在数据集上构建了一个kNN图。对于文本基准，我们包括一个BiLSTM [19]基准。报告的结果是在具有不同随机种子的5个运行中平均的。

实验结果 表1显示了传递性实验的结果。首先，IDGL在5个基准测试中的4个中表现优于所有基线。此外，相比于IDGL，IDGL-ANCH更具可扩展性，可以达到相当甚至更好的结果。在图结构可用的情况下，与最先进的GNN和图学习模型相比，我们的模型即使基于基本的GCN，也可以实现显著更好或具有竞争力的结果。当图拓扑结构不可用时（因此GNN不能直接应用），与图学习基准相比，IDGL在所有数据集上都能够始终实现更好的结果。与我们的主要图学习基线LDS相比，我们的模型不仅性能显著更好，而且更具可扩展性。归纳实验的结果如表2所示。与LDS无法处理归纳设置不同，20News和MRD上的良好表现证明了IDGL在归纳学习上的能力。

消融实验 表3显示了我们模型中不同模块的消融研究结果。通过关闭迭代学习组件（即仅迭代一次），我们可以看到IDGL和IDGL-ANCH在所有数据集上的性能持续显著下降，表明其有效性。此外，我们可以看到在图正则化损失的情况下联合训练模型的好处。

模型分析 为了评估IDGL对对抗性图的鲁棒性，我们构造了具有随机边缘删除或添加的图。具体来说，对于原始图中的每对节点，我们随机移除（如果存在边）或添加（如果没有这样的边）一条边，概率为25%、50%或75%。如图3所示，与GCN和LDS相比，IDGL在两种情况下都取得了更好或可比的结果。虽然GCN和LDS在边缘添加场景中都完全失败，但IDGL的表现相当不错。我们推测这是因为通过在初始图中加入误导性的加性随机噪声，边缘添加场景比边缘删除场景更具挑战性。并且方程。（3）被公式化为跳跃连接的形式，通过降低λ的值（即，在发展集上调整），我们强制模型减少对初始噪声图的依赖。

在图4a（以及附录B.1）中，我们展示了在测试阶段迭代学习过程中学到的邻接矩阵和准确率的演变。我们计算相邻迭代之间邻接矩阵的差异为 $\delta^{(t)}_A=||A^{(t)}-A^{(t-1)}||^2_F / ||A^{(t)}||^2_F$ ，通常在0到1之间。我们可以看到，邻接矩阵和准确率都很快地收敛。这从经验上验证了我们在附录A.2中对IDGL收敛性质的分析。请注意，这种收敛性质并不是由于GNN的过度平滑效应[56，33]，因为我们在实验中只使用了两层GCN作为IDGL的底层GNN模块。

我们比较了IDGL和IDGL-ANCH与其他基线的训练效率。如表4所示，IDGL始终比LDS快，但总体上它们是可比的。请注意，IDGL的可训练参数数量与LDS相当。例如，在Cora数据上，IDGL的可训练参数数量为28,836，而LDS为23,040。而我们看到IDGL-ANCH相比于IDGL有大幅度的加速。请注意，由于内存限制，我们无法在Pubmed上运行IDGL。理论复杂度分析提供在附录A.3中。

我们还对停止策略进行了实证研究（图4b和附录B.2），展示了IDGL学习的图形结构（附录B.3），并进行了超参数分析（附录B.4）。模型设置的详细信息在附录C.2中提供。

4 相关工作

从不同的角度，在不同领域中广泛研究了图结构学习的问题。在图形信号处理的领域中，研究人员探索了从数据[10、12、53、27、3、1]中学习图形的各种方法，并在图表上具有某些结构约束（例如，稀疏性）。在聚类分析的文献[4，22]中也研究了这个问题，他们的目的是同时构成聚类任务并学习对象之间的相似性关系。这些作品都集中在无监督的学习设置上，而无需考虑任何有监督的下游任务，并且无法处理归纳学习问题。其他相关的作品包括概率图形模型[9，66，62]和图生成[38，49]中的结构推断，其目标与我们的目标不同。在GNN的领域[29、16、18、35、63]中，有一系列关于开发强大的GNN [50]的研究，通过利用基于注意的方法[5]，贝叶斯方法，贝叶斯方法[13）[13，64]，基于图扩散的方法[31]以及图形上的各种假设（例如，低等级和稀疏性）[14，24，65]。这些方法通常假定初始图形结构可用。最近，研究人员探索了自动构建对象图[45、8、34、15、40]或单词[39、6、7]的方法。但是，这些方法只是在不明确控制学到的图形质量的情况下优化了朝向下游任务的图形。最近，[15]提出了通过利用双光线优化技术联合学习图形和GNN的参数的LDS模型。但是，根据设计，他们的方法无法处理归纳设置。我们的工作还与类似变压器的方法[51]有关，该方法通过利用多头注意机制来学习对象之间的关系。但是，这些方法不集中在图形学习问题上，也没有设计用于使用初始图形结构。

5 结论

我们提出了一种新的IDGL框架，用于联合迭代学习为下游任务优化的图结构和嵌入。实验结果证明了所提出的模型的有效性和效率。在未来，我们计划探索有效的技术来处理图拓扑和节点特征都有噪声的更具挑战性的场景。

更广泛的影响

我们研究的基本目标是开发一种联合学习图结构和嵌入的方法，该方法针对（半）监督的下游任务进行优化。我们的技术可以广泛应用于各种应用，包括社交网络分析、自然语言处理（如问答和文本生成）、药物发现和社区检测。从概念上讲，任何旨在联合学习图结构和嵌入以便在下游任务中表现良好的应用程序。这些潜在的应用包括计算机视觉、自然语言处理和网络分析。例如，我们的研究可以用来帮助更好地捕捉自然语言处理中单词标记之间的语义关系（标记序列之外）。使用我们的方法作为工具有很多好处，例如将图神经网络应用于非图结构化数据，而无需手动构建图，以及学习对噪声输入图更具鲁棒性的节点/图嵌入。这些可能被大量潜在应用所利用的好处可能会产生广泛的社会影响：

使用我们的研究可以改善和加快从有噪声/不完整的图（如社交网络）甚至非图结构数据（如文本和图像）中学习有意义的图的过程。
使用我们的研究可以提高图神经网络对噪声/不完整图结构数据的鲁棒性，为下游任务学习良好的节点/图嵌入。
我们鼓励研究人员在更具体的现实世界应用中探索类似的方法。我们还建议进行研究，以了解在安全/安保关键应用中使用图神经网络的对抗性鲁棒性。

References

[1] X. Bai, L. Zhu, C. Liang, J. Li, X. Nie, and X. Chang. Multi-view feature selection via
nonnegative structured graph learning. Neurocomputing, 2020.
[2] M. Belkin and P. Niyogi. Laplacian eigenmaps and spectral techniques for embedding and
clustering. In Advances in neural information processing systems, pages 585–591, 2002.
[3] P. Berger, G. Hannak, and G. Matz. Efficient graph learning from noisy and incomplete data.
IEEE Transactions on Signal and Information Processing over Networks, 6:105–119, 2020.
[4] A. Bojchevski, Y. Matkovic, and S. Günnemann. Robust spectral clustering for noisy data:
Modeling sparse corruptions improves latent embeddings. In Proceedings of the 23rd ACM
SIGKDD International Conference on Knowledge Discovery and Data Mining, pages 737–746,
2017.
[5] H. Chen, L. Wang, S. Wang, D. Luo, W. Huang, and Z. Li. Label aware graph convolutional
network–not all edges deserve your attention. arXiv preprint arXiv:1907.04707, 2019.
[6] Y. Chen, L. Wu, and M. J. Zaki. Graphflow: Exploiting conversation flow with graph neural
networks for conversational machine comprehension. arXiv preprint arXiv:1908.00059, 2019.
[7] Y. Chen, L. Wu, and M. J. Zaki. Reinforcement learning based graph-to-sequence model for
natural question generation. arXiv preprint arXiv:1908.04942, 2019.
[8] E. Choi, Z. Xu, Y. Li, M. W. Dusenberry, G. Flores, Y. Xue, and A. M. Dai. Graph convolutional
transformer: Learning the graphical structure of electronic health records. arXiv preprint
arXiv:1906.04716, 2019.
[9] J. Cussens. Bayesian network learning with cutting planes. arXiv preprint arXiv:1202.3713,
2012.
[10] X. Dong, D. Thanou, P. Frossard, and P. Vandergheynst. Learning laplacian matrix in smooth
graph signal representations. IEEE Transactions on Signal Processing, 64(23):6160–6173,
2016.
[11] D. Dua and C. Graff. UCI machine learning repository, 2017.
[12] H. E. Egilmez, E. Pavez, and A. Ortega. Graph learning from data under laplacian and structural
constraints. IEEE Journal of Selected Topics in Signal Processing, 11(6):825–841, 2017.
[13] P. Elinas, E. V. Bonilla, and L. Tiao. Variational inference for graph convolutional networks in
the absence of graph data and adversarial settings. arXiv, pages arXiv–1906, 2019.
[14] N. Entezari, S. A. Al-Sayouri, A. Darvishzadeh, and E. E. Papalexakis. All you need is low
(rank) defending against adversarial attacks on graphs. In Proceedings of the 13th International
Conference on Web Search and Data Mining, pages 169–177, 2020.
[15] L. Franceschi, M. Niepert, M. Pontil, and X. He. Learning discrete structures for graph neural
networks. arXiv preprint arXiv:1903.11960, 2019.
[16] J. Gilmer, S. S. Schoenholz, P. F. Riley, O. Vinyals, and G. E. Dahl. Neural message passing
for quantum chemistry. In Proceedings of the 34th International Conference on Machine
Learning-Volume 70, pages 1263–1272. JMLR. org, 2017.
[17] W. Hamilton, Z. Ying, and J. Leskovec. Inductive representation learning on large graphs. In
Advances in Neural Information Processing Systems, 2017.
[18] W. Hamilton, Z. Ying, and J. Leskovec. Inductive representation learning on large graphs. In
Advances in Neural Information Processing Systems, pages 1024–1034, 2017.
[19] S. Hochreiter and J. Schmidhuber. Long short-term memory. Neural computation, 9(8):1735–
1780, 1997.
[20] F. Hu, Y. Zhu, S. Wu, L. Wang, and T. Tan. Semi-supervised node classification via hierarchical
graph convolutional networks. arXiv preprint arXiv:1902.06667, 2019.
[21] W. Hu, M. Fey, M. Zitnik, Y. Dong, H. Ren, B. Liu, M. Catasta, and J. Leskovec. Open graph
benchmark: Datasets for machine learning on graphs. arXiv preprint arXiv:2005.00687, 2020.
[22] S. Huang, Z. Kang, I. W. Tsang, and Z. Xu. Auto-weighted multi-view clustering via kernelized
graph learning. Pattern Recognition, 88:174–184, 2019.
[23] B. Jiang, Z. Zhang, D. Lin, J. Tang, and B. Luo. Semi-supervised learning with graph learning-
convolutional networks. In Proceedings of the IEEE Conference on Computer Vision and
Pattern Recognition, pages 11313–11320, 2019.
[24] W. Jin, Y. Ma, X. Liu, X. Tang, S. Wang, and J. Tang. Graph structure learning for robust graph
neural networks. arXiv preprint arXiv:2005.10203, 2020.
[25] V. Kalofolias. How to learn a graph from smooth signals. In Artificial Intelligence and Statistics,
pages 920–929, 2016.
[26] V. Kalofolias and N. Perraudin. Large scale graph learning from smooth signals. arXiv preprint
arXiv:1710.05654, 2017.
[27] Z. Kang, H. Pan, S. C. Hoi, and Z. Xu. Robust graph learning from noisy data. IEEE transactions
on cybernetics, 2019.
[28] D. P. Kingma and J. Ba. Adam: A method for stochastic optimization. arXiv preprint
arXiv:1412.6980, 2014.
[29] T. N. Kipf and M. Welling. Semi-supervised classification with graph convolutional networks.
arXiv preprint arXiv:1609.02907, 2016.
[30] J. Klicpera, A. Bojchevski, and S. Günnemann. Predict then propagate: Graph neural networks
meet personalized pagerank. arXiv preprint arXiv:1810.05997, 2018.
[31] J. Klicpera, S. Weißenberger, and S. Günnemann. Diffusion improves graph learning. In
Advances in Neural Information Processing Systems, pages 13333–13345, 2019.
[32] K. Lang. Newsweeder: Learning to filter netnews. In Machine Learning Proceedings 1995,
pages 331–339. Elsevier, 1995.
[33] Q. Li, Z. Han, and X.-M. Wu. Deeper insights into graph convolutional networks for semi-
supervised learning. In Thirty-Second AAAI Conference on Artificial Intelligence, 2018.
[34] R. Li, S. Wang, F. Zhu, and J. Huang. Adaptive graph convolutional neural networks. In
Thirty-Second AAAI Conference on Artificial Intelligence, 2018.
[35] Y. Li, D. Tarlow, M. Brockschmidt, and R. Zemel. Gated graph sequence neural networks.
arXiv preprint arXiv:1511.05493, 2015.
[36] Y. Li, D. Tarlow, M. Brockschmidt, and R. Zemel. Gated graph sequence neural networks.
International Conference on Learning Representations, 2016.
[37] Y. Li, O. Vinyals, C. Dyer, R. Pascanu, and P. Battaglia. Learning deep generative models of
graphs. arXiv preprint arXiv:1803.03324, 2018.
[38] R. Liao, Y. Li, Y. Song, S. Wang, W. Hamilton, D. K. Duvenaud, R. Urtasun, and R. Zemel.
Efficient graph generation with graph recurrent attention networks. In Advances in Neural
Information Processing Systems, pages 4257–4267, 2019.
[39] P. Liu, S. Chang, X. Huang, J. Tang, and J. C. K. Cheung. Contextualized non-local neural
networks for sequence learning. arXiv preprint arXiv:1811.08600, 2018.
[40] S. Liu, Y. Chen, X. Xie, J. K. Siow, and Y. Liu. Automatic code summarization via multi-
dimensional semantic fusing in gnn. arXiv preprint arXiv:2006.05405, 2020.
[41] W. Liu, J. He, and S.-F. Chang. Large graph construction for scalable semi-supervised learning.
In ICML, 2010.
[42] L. Lovász. Random walks on graphs: A survey. Department of Computer Science, Yale
University, 1994.
[43] Y. Ma, S. Wang, C. C. Aggarwal, and J. Tang. Graph convolutional networks with eigenpooling.
arXiv preprint arXiv:1904.13107, 2019.
[44] H. V. Nguyen and L. Bai. Cosine similarity metric learning for face verification. In Asian
conference on computer vision, pages 709–720. Springer, 2010.
[45] W. Norcliffe-Brown, S. Vafeias, and S. Parisot. Learning conditioned graph structures for
interpretable visual question answering. In Advances in Neural Information Processing Systems,
pages 8344–8353, 2018.
[46] B. Pang and L. Lee. A sentimental education: Sentiment analysis using subjectivity summariza-
tion based on minimum cuts. In Proceedings of the 42nd annual meeting on Association for
Computational Linguistics, page 271. Association for Computational Linguistics, 2004.
[47] B. Samanta, A. De, N. Ganguly, and M. Gomez-Rodriguez. Designing random graph mod-
els using variational autoencoders with applications to chemical design. arXiv preprint
arXiv:1802.05283, 2018.
[48] P. Sen, G. Namata, M. Bilgic, L. Getoor, B. Galligher, and T. Eliassi-Rad. Collective classifica-
tion in network data. AI magazine, 29(3):93–93, 2008.
[49] C. Shi, M. Xu, Z. Zhu, W. Zhang, M. Zhang, and J. Tang. Graphaf: a flow-based autoregressive
model for molecular graph generation. arXiv preprint arXiv:2001.09382, 2020.
[50] L. Sun, Y. Dou, C. Yang, J. Wang, P. S. Yu, and B. Li. Adversarial attack and defense on graph
data: A survey. arXiv preprint arXiv:1812.10528, 2018.
[51] A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. N. Gomez, Ł. Kaiser, and
I. Polosukhin. Attention is all you need. In Advances in neural information processing systems,
pages 5998–6008, 2017.
[52] P. Veliˇckovi ́c, G. Cucurull, A. Casanova, A. Romero, P. Liò, and Y. Bengio. Graph attention
networks. arXiv preprint arXiv:1710.10903, 2017.
[53] Y. Wang, Z. Zhao, and Z. Feng. Graspel: Graph spectral learning at scale. arXiv preprint
arXiv:1911.10373, 2019.
[54] N. Wojke and A. Bewley. Deep cosine metric learning for person re-identification. In 2018
IEEE winter conference on applications of computer vision (WACV), pages 748–756. IEEE,
2018.
[55] L. Wu, I. E.-H. Yen, Z. Zhang, K. Xu, L. Zhao, X. Peng, Y. Xia, and C. Aggarwal. Scalable global
alignment graph kernel using random features: From node embedding to graph embedding. In
Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery &
Data Mining, pages 1418–1428, 2019.
[56] K. Xu, C. Li, Y. Tian, T. Sonobe, K.-i. Kawarabayashi, and S. Jegelka. Representation learning
on graphs with jumping knowledge networks. arXiv preprint arXiv:1806.03536, 2018.
[57] K. Xu, L. Wu, Z. Wang, and V. Sheinin. Graph2seq: Graph to sequence learning with attention-
based neural networks. arXiv preprint arXiv:1804.00823, 2018.
[58] K. Xu, L. Wu, Z. Wang, M. Yu, L. Chen, and V. Sheinin. Exploiting rich syntactic information
for semantic parsing with graph-to-sequence model. arXiv preprint arXiv:1808.07624, 2018.
[59] D.-Y. Yeung and H. Chang. A kernel approach for semisupervised metric learning. IEEE
Transactions on Neural Networks, 18(1):141–149, 2007.
[60] Z. Ying, J. You, C. Morris, X. Ren, W. Hamilton, and J. Leskovec. Hierarchical graph repre-
sentation learning with differentiable pooling. In Advances in Neural Information Processing
Systems, pages 4800–4810, 2018.
[61] J. You, R. Ying, X. Ren, W. L. Hamilton, and J. Leskovec. Graphrnn: Generating realistic
graphs with deep auto-regressive models. arXiv preprint arXiv:1802.08773, 2018.
[62] Y. Yu, J. Chen, T. Gao, and M. Yu. Dag-gnn: Dag structure learning with graph neural networks.
arXiv preprint arXiv:1904.10098, 2019.
[63] S. Yun, M. Jeong, R. Kim, J. Kang, and H. J. Kim. Graph transformer networks. In Advances
in Neural Information Processing Systems, pages 11960–11970, 2019.
[64] Y. Zhang, S. Pal, M. Coates, and D. Ustebay. Bayesian graph convolutional neural networks for
semi-supervised classification. In Proceedings of the AAAI Conference on Artificial Intelligence,
volume 33, pages 5829–5836, 2019.
[65] C. Zheng, B. Zong, W. Cheng, D. Song, J. Ni, W. Yu, H. Chen, and W. Wang. Robust graph
representation learning via neural sparsification. In ICML, 2020.
[66] X. Zheng, B. Aragam, P. K. Ravikumar, and E. P. Xing. Dags with no tears: Continuous
optimization for structure learning. In Advances in Neural Information Processing Systems,
pages 9472–9483, 2018

你可能感兴趣的:(深度学习,机器学习,人工智能,GNN)

国产信创AI IDE：开启智能编程新时代 InsCode AI IDE
国产信创AIIDE：开启智能编程新时代随着信息技术的迅猛发展，软件开发工具也在不断演进。近年来，人工智能（AI）技术的应用为编程工具带来了革命性的变化。其中，国产信创AIIDE——InsCodeAIIDE，作为一款由CSDN、GitCode和华为云CodeArtsIDE联合开发的新一代集成开发环境（IDE），以其智能化、高效化的特点，正在引领智能编程的新时代。最新接入DeepSeek-V3模型，点
【产品小白】什么是AI产品经理百事不可口y 产品经理的一步一步人工智能产品经理学习产品运营内容运营用户运营
一、AI产品经理的定义与角色定位AI产品经理是人工智能技术与商业应用之间的核心桥梁，负责将复杂的AI技术转化为满足市场需求的产品。需同时具备技术理解力、商业洞察力和用户思维，既要参与算法选型与数据建模，又要定义产品功能与市场策略，是贯穿产品全生命周期的关键角色。与传统互联网产品经理相比，AI产品经理的独特之处在于：技术深度参与：需理解机器学习、自然语言处理（NLP）、计算机视觉等技术原理，并参与数
人工智能（AI）系统化学习路线 xiaoyu❅ python 人工智能学习
一、为什么需要系统化学习AI？人工智能技术正在重塑各行各业，但许多初学者容易陷入误区：❌盲目跟风：直接学习TensorFlow/PyTorch，忽视数学与算法基础。❌纸上谈兵：只看理论不写代码，无法解决实际问题。❌方向模糊：对CV/NLP/RL等细分领域缺乏认知，难以针对性提升。正确的学习姿势：“金字塔式”分层学习（理论→算法→框架→应用→工程化），逐步构建完整的AI知识体系。二、人工智能学习路线
深度学习-130-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(一) 皮皮冰燃深度学习深度学习人工智能 RAG
文章目录1AnythingLLM的本地知识库1.1本地知识库应用场景1.2效果对比及思考1.3本地体现在哪些方面1.3.1知识在本地1.3.2分割后的文档在本地1.3.3大模型部署运行在本地2问错问题带来的问题2.1常见的问题2.2原因分析3为什么LLM不使用我的文件？3.1LLM不是万能的【omnipotent】3.2LLM不会自省【introspect】3.3AnythingLLM是如何工作的
3DMAX点云算法：实现毫米级BIM模型偏差检测（附完整代码）夏末之花人工智能
摘要本文基于激光雷达点云数据与BIM模型的高精度对齐技术，提出一种融合动态体素化与多模态特征匹配的偏差检测方法。通过点云预处理、语义分割、模型配准及差异分析，最终实现建筑构件毫米级偏差的可视化检测。文中提供关键代码实现，涵盖点云处理、特征提取与深度学习模型搭建。一、核心算法流程点云预处理与特征增强去噪与下采样：采用统计滤波与体素网格下采样，去除离群点并降低数据量。语义分割：基于PointNet++
数据增强：扩充数据集提升模型泛化能力 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1.数据增强的重要性在机器学习领域，模型的泛化能力至关重要。一个泛化能力强的模型能够在未见数据上表现良好，而过拟合的模型则会在训练数据上表现出色，但在新数据上表现糟糕。数据增强是一种有效提升模型泛化能力的技术，它通过对现有数据进行各种变换，人为地扩充数据集，从而增加训练数据的数量和多样性。1.2.数据增强的应用场景数据增强广泛应用于各种机器学习任务中，包括：图像识别:对图像进行旋转
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
Docker打包深度学习项目 FLY_LTL docker 深度学习容器
文章目录Docker打包深度学习项目1.Docker和NVIDIAContainerToolkit的安装1.Docker2.NVIDIAContainerToolkit3.添加国内镜像源2.使用Dockerfile打包并保存镜像1.Dockerfile2.通过Dockerfile生成镜像3.保存镜像和加载4.运行Docker并测试参考Docker打包深度学习项目本文来源于个人实践总结，供各位同学参
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
机器学习之KMeans算法知舟不叙机器学习算法 kmeans
文章目录引言1.KMeans算法简介2.KMeans算法的数学原理3.KMeans算法的步骤3.1初始化簇中心3.2分配数据点3.3更新簇中心3.4停止条件4.KMeans算法的优缺点4.1优点4.2缺点5.KMeans算法的应用场景5.1图像分割5.2市场细分5.3文档聚类5.4异常检测6.Python实现KMeans算法7.总结引言KMeans算法是机器学习中最经典的无监督学习算法之一，广泛应
机器学习流程—数据预处理清洗不二人生机器学习机器学习人工智能数据预处理
文章目录机器学习流程—数据预处理清洗定义问题数据预处理数据加载与展示重复数据处理数据类型空值处理无关特征删除数据分布删除异常值生成标签和特征数据分割机器学习流程—数据预处理清洗数据处理是将数据从给定形式转换为更可用和更理想的形式的任务，即使其更有意义、信息更丰富。使用机器学习算法、数学建模和统计知识，整个过程可以自动化。这个完整过程的输出可以是任何所需的形式，如图形、视频、图表、表格、图像等等，具
MMScan数据集：首个最大的多模态3D场景数据集，包含层次化的语言标注数据集
2024-10-24，由上海人工智能实验室联合多所高校创建了MMScan，这是迄今为止最大的多模态3D场景数据集，包含了层次化的语言标注。数据集的建立，不仅推动了3D场景理解的研究进展，还为训练和评估多模态3D感知模型提供了宝贵的资源。一、研究背景：随着大型语言模型（LLMs）的兴起和与其他数据模态的融合，多模态3D感知因其与物理世界的连接而受到越来越多的关注，并取得了快速进展。然而，现有的数据集
【AI大模型】RAG如何让生成AI更智能？最新方法与优劣深度解析健忘的派大星人工智能语言模型 ai AI大模型 agi RAG 程序员
前言近年来，人工智能技术突飞猛进，尤其是生成式AI，简直像是开了挂一样，各种惊艳的表现让人直呼“未来已来”。根据IDC的研究，生成式AI的市场规模在2022年已经达到了107亿美元，而到2026年，这个数字预计会飙升至326亿美元！不过，尽管生成式AI很强大，但它也并非完美无缺——比如生成内容的质量、准确性和可靠性，依然有提升的空间。这时候，检索增强生成（RAG）技术登场了！RAG的核心思路很简单
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
A Survey of Large Language Models大模型综述论文章节总结 WhyteHighmore 论文语言模型人工智能自然语言处理论文笔记
ASurveyofLLM人大译ASurveyofLargeLanguageModels这篇论文全面回顾了大型语言模型(LLM)的最新进展，重点关注其发展背景、关键发现和主流技术。文章主要围绕LLM的四个主要方面展开：1引言自从1950年图灵测试被提出以来，人类一直在探索机器掌握语言智能的方法。语言本质上是一种受语法规则支配的复杂、精细的人类表达系统，这使得开发能够理解和掌握语言的强大人工智能(AI
AI：对比ChatGPT这类聊天机器人，人形机器人对人类有哪些不一样的影响？ InnoLink_1024 AGI 人工智能机器学习 chatgpt 人工智能机器人
人形机器人与像ChatGPT这样的聊天机器人相比，虽然都属于人工智能技术的应用，但由于其具备的物理形态和与环境的互动能力，它们对人类的影响会有很大的不同。下面从多个角度进行对比，阐述它们各自对人类的不同影响：1.物理交互与虚拟交互人形机器人：具有物理形态，能够在物理世界中与人类进行直接交互。例如，搬运物品、进行日常家务、提供身体上的帮助（如扶持老人、帮助走路等），以及进行非语言的沟通（如手势、面部
Python 模拟鼠标轨迹算法 a485240 鼠标轨迹计算机外设
一.鼠标轨迹模拟简介传统的鼠标轨迹模拟依赖于简单的数学模型，如直线或曲线路径。然而，这种方法难以捕捉到人类操作的复杂性和多样性。AI大模型的出现，使得能够通过深度学习技术，学习并模拟更自然的鼠标移动行为。二.鼠标轨迹算法实现AI大模型通过学习大量的人类鼠标操作数据，能够识别和模拟出自然且具有个体差异的鼠标轨迹。以下是实现这一技术的关键步骤：数据收集：收集不同玩家在各种游戏环境中的鼠标操作数据，包括
Apache Storm：实时数据处理的闪电战 Aaron_945 Java apache storm 大数据
文章目录ApacheStorm原理拓扑结构数据流处理容错机制官网链接基础使用安装与配置编写拓扑提交与运行高级使用状态管理窗口操作多语言支持优点高吞吐量低延迟可扩展性容错性总结ApacheStorm是一个开源的分布式实时计算系统，它允许你以极高的吞吐量处理无界数据流。Storm被广泛用于实时分析、在线机器学习、连续计算等多种场景。本文将深入探讨ApacheStorm的原理、基础使用、高级特性及其优点
DeepSeek从入门到精通「清华团队」 YuKeeHgg DeepSeek 人工智能 ai
由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后及其团队撰写文档的核心内容围绕DeepSeek的技术特点、应用场景、使用方法以及如何通过提示语设计提升AI使用效率等方面展开，帮助用户从入门到精通DeepSeek的使用。「文末附下载方式」第一部分：DeepSeek基础概念1.1DeepSeek简介定义：专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。核心产品：开源
人工智能的未来：从基础到前沿的探索与展望小二爱编程· 人工智能 ai AI编程 AI写作 AI作画
1.人工智能简介内容概述：人工智能（AI）是指模拟和执行人类智能任务的技术。随着计算能力和数据量的增加，AI在各个领域取得了显著进展，从自动化的基本任务到解决复杂的实际问题，人工智能正渗透到我们生活的各个方面。2.人工智能的种类与发展内容概述：AI的种类可以按智能的复杂度分为三大类：弱人工智能（NarrowAI）：目前大多数应用都属于弱AI，如语音助手、自动驾驶等。它们专注于特定任务，并且无法扩展
SciER：首个大规模科学文档中的实体和关系抽取数据集数据集
2024-10-28，为科学文档中的实体和关系抽取领域带来了突破，提供了一个包含106篇完整科学出版物、超过24,000个实体和12,000个关系的大规模数据集，这对于构建科学知识图谱和促进科学信息抽取技术的发展具有重要意义。数据集地址：SciER|科学信息提取数据集|人工智能数据集一、研究背景：在科学文档中，实体（如数据集、方法、任务）和它们之间的关系对于理解科学发现和推动研究进展至关重要。然而
元戎启行最新战略RoadAGI：所有移动智能体都将被AI驱动量子位
2025年3月18日（北京时间），元戎启行作为国内人工智能企业代表，出席由NVIDIA主办的GTC大会。会上，公司CEO周光发表了技术主题演讲，展示了公司的最新战略布局RoadAGI，并发布道路通用人工智能平台——AISpark（以下简称”Spark平台”）。RoadAGI是元戎启行实现物理世界通用人工智能的关键一步，旨在让包括智能驾驶汽车在内的移动智能体，都具有在道路上自主行驶、与物理世界深度交
什么是机器视觉3D引导大模型视觉人机器视觉机器视觉3D 3d 数码相机机器人人工智能大数据
机器视觉3D引导大模型是结合深度学习、多模态数据融合与三维感知技术的智能化解决方案，旨在提升工业自动化、医疗、物流等领域的操作精度与效率。以下从技术架构、行业应用、挑战与未来趋势等方面综合分析：一、技术架构与核心原理多模态数据融合与深度学习3D视觉引导大模型通常整合RGB图像、点云数据、深度信息等多模态输入，通过深度学习算法（如卷积神经网络、Transformer）进行特征提取与融合。例如，油田机
【财经信息差】2024年12月27日最新财经资讯一览每日财经热点一网打尽代码简单说 AI观财经:财经信息差 AI观财经财经信息差今日财经资讯财经热点今日资讯
大家好，欢迎来到财经信息差！每天，我们将带你直击全球财经动态，精选最新的市场变化、政策动向与产业趋势，让你在最短的时间内，轻松掌握最关键的财经资讯。随着人工智能技术的迅猛发展，我们将用AI的视角为你解析财经热点、企业动向及全球经济变化，让复杂的信息变得简单易懂，帮助你做出更明智的投资决策。财经领域股票市场美股三大指数集体低开，大型科技股多数下跌，纳斯达克金龙指数跌1.07%。小鹏汽车跌3.32%，
探索AI知识库的无限潜力：定义、应用与未来展望知识库知识库管理知识库软件
一、AI知识库的定义AI知识库，作为人工智能技术与传统知识库概念的融合，是指利用人工智能算法和技术构建、管理和维护的信息存储系统。它不仅包含了大量的结构化、半结构化和非结构化数据，还具备智能检索、推理分析、自我学习和优化等高级功能。AI知识库通过模拟人类的认知过程，实现了对知识的有效组织和高效利用，为各种应用场景提供了强大的支持。二、AI知识库的应用1.客户服务与支持在电子商务领域，AI知识库的应
低代码平台未来发展趋势有哪些？低代码
低代码平台的未来发展趋势呈现出多维度的创新与深化，以下结合JNPF快速开发平台的特性，为您分析其未来的发展方向：1.智能化与AI深度融合低代码平台将与人工智能技术深度融合，实现开发流程的智能化升级。例如，JNPF平台有望通过自然语言处理技术，让开发者仅需用自然语言描述需求，平台即可自动生成初步的应用架构和代码逻辑。此外，AI技术还将用于智能推荐、代码自动生成、流程自动化等功能，进一步提升开发效率。
探索“AI知识库”的未来：重塑信息获取与教育的新篇章知识库知识库管理
在数字化时代，信息的爆炸性增长既为人类带来了前所未有的知识盛宴，也带来了信息筛选与理解的巨大挑战。在此背景下，“AI知识库”作为人工智能技术与知识管理深度融合的产物，正逐步成为解决这一难题的关键。本文旨在探讨“AI知识库”的核心价值、技术进展、应用领域以及对未来教育与社会信息获取方式的深远影响，并在此基础上展望其发展前景。一、AI知识库的定义与核心价值定义：AI知识库，简而言之，是利用人工智能技术
人工智能之数学基础:基变换和坐标变换的区别每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能机器学习算法基变换坐标变换线性变换
本文重点基变换和坐标变换是线性代数中的两个重要概念，它们描述了向量在不同基底或坐标系下的表示和转换关系。矩阵矩阵不仅可以作为线性变换的描述，而且可以作为一组基地描述。而作为变换的矩阵，不但可以把线性空间中的一个点给变换到另一个点去，而且也能够把线性空间中的一个坐标系（基）表换到另一个坐标系（基）去，这就是基变换和坐标变换。定义与本质基变换：定义：基变换是指向量在不同基底下表示的关系的数学描述。它涉
深度测评:2025年这五款AI直播工具风卷来袭，首款堪称直播界变革者! V__17671155793 智能电视
深度测评:2025年这五款AI直播工具风卷来袭，首款堪称直播界变革者!随着人工智能（AI）技术的飞速发展，直播行业正经历着前所未有的变革。2025年，被誉为“AI直播元年”，这一年见证了众多创新AI直播工具的涌现，它们不仅提升了直播的智能化水平，更在效率、互动性和观赏性上实现了质的飞跃。以下，我们将盘点2025年经典实用的十款AI直播工具，尤其聚焦于第一款，带您领略AI如何重塑直播行业。一、智享A
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round