饮冰l

论文笔记：WWW 2020 Heterogeneous Graph Transformer

1. 前言

论文链接：https://arxiv.org/abs/2003.01332
github：https://github.com/acbull/pyHGT

近年来，图神经网络(GNNs)在结构化数据建模方面取得了巨大的成功。但是，大多数GNN为同构图设计，同构图中所有的节点和边都属于相同的类型，这使得它们无法表示异构结构。本文中提出了一种异构图转换器(HGT)体系结构来建模网络规模的异构图。为了对异质性进行建模，本文设计了节点和边类型相关的参数来表征每个边缘上的异质性注意，使HGT能够对不同类型的节点和边缘保持专门的表示。

为了处理动态异构图，本文在HGT中引入了相对时间编码技术，能够捕获任意持续时间下的动态结构依赖关系。
为了处理web规模的图数据，本文设计了异构的小批量图采样算法hgsampling来进行高效和可扩展的训练。

在拥有1.79亿个节点和20亿个边的开放学术图上进行的大量实验表明，在各种下游任务上，提出的HGT模型始终比所有最先进的GNN基线性能高出9%-21%。

2. 异质图

本文中进行实验的主要对象为 Open Academic Graph (OAG)

其中包含了五类节点，分别为：论文、作者、机构、场所(期刊、会议或预印本)和字段，以及它们之间的不同类型的关系。

在过去的十年中，已经有一些研究工作致力于探索挖掘异质图。经典的范例之一是定义和使用元路径来建模异构结构，例如PathSim和metapath2vec。近年来，鉴于graph neural networks (GNNs)的成功，有几次尝试采用GNNs对异构网络进行学习。但是这些工作面临着几个问题:

首先，大部分涉及到对每种异构图类型的元路径的设计，需要特定的领域知识（人工手动定义）;
其次，它们要么简单假设不同类型的节点/边共享相同的特征和表示空间，要么单独对节点类型或边类型保持不同的非共享权值，不足以捕获异构图的属性;
第三，大部分忽略了每个(异质)图的动态特性;最后，它们内在的设计和实现使它们无法建模大规模的异构图。

以OAG为例:首先，OAG中的节点和边缘可以具有不同的特征分布，如论文具有文本特征，机构可能具有附属学者的特征，合作作者与引文链接之间存在明显差异;其次，OAG一直在不断发展，例如，

1）出版物的数量每12年翻一番
2）KDD会议在20世纪90年代更多地与数据库相关，而近年来更多地与机器学习相关;
3）最后，OAG包含数亿个节点和数以亿计的关系，使得现有的异构GNN方法无法进行扩展处理。

鉴于这些局限性和挑战，首先明确基于图神经网络来挖掘异质图特征的几个要点：

异构图神经网络的目标是维护依赖于节点和边缘类型的表示，捕获网络动态，避免自定义元路径，并可扩展到网络规模的图。在此工作中，我们提出了异构图转换器(HGT)架构来处理这些问题。为了处理图的异构性，引入了节点依赖注意机制和边依赖注意机制。相较于其他方法选择参数化每种类型的边缘，本文选择通过对每条边进行分解，定义了HGT中的异质相互注意机制 $e = (s, t)$ ，此种方式是基于其原路径关系的元组关系，也就是说，<节点类型的 $s$ ，在 $t$ 类型节点之间的边的种类 $e$ > 的节点类型。
图1展示了异质学术图的元关系。具体来说，我们使用这些元组关系来参数化权重矩阵，以便计算每条边上的注意力。因此，允许不同类型的节点和边维护它们的特定表示空间。与此同时，不同类型的连接节点仍然可以交互、传递和聚合消息，而不受其分布差距的限制。由于其体系结构的本质，HGT可以通过跨层的消息传递来合并来自不同类型的高阶邻居的信息，这可以被视为“软”元路径。
也就是说，即使HGT只使用它的单跳边缘作为输入，而无需人工设计元路径，所提出的注意力机制也可以自动地、隐式地学习和提取对不同下游任务重要的“元路径”。以元组的关系模式来替代元路径形成“软”元路径
为了处理图动态，本文提出了相对时间编码(RTE)策略来增强HGT。该方法没有将输入图分割成不同的时间戳，而是将所有发生在不同时间的边作为一个整体来维护，并设计RTE策略来建模具有任意持续时间长度的结构化时间依赖关系，甚至是不可见的和未来的时间戳。RTE通过端到端训练，使HGT能够自动学习异构图的时间依赖性和演化。
为了处理大规模的图数据，本文设计了第一个异构子图采样算法 HGSampling—for minibatch GNN training。其主要思想是对不同类型节点比例相似的异构子图进行采样，因为直接使用现有的(同构的)GNN采样方法，如GraphSage、FastGCN和LADIES，会导致节点和边类型的高度不平衡。此外，还该异质图采样方法还保持采样子图密集，以尽量减少信息损失。使用HGSampling，所有的GNN模型，包括本文提出的HGT，都可以在任意大小的异构图上进行训练和推断。

本文演示了提出的异构图转换器在网络规模的开放学术图上的有效性和效率，该开放学术图包含1.79亿个节点和20亿个边，时间跨度从1900年到2019年，这是迄今为止在异构图上执行的规模最大、跨越时间最长的表示学习。此外还研究了特定领域的图：计算机科学和医学学术图。实验结果表明，HGT可以显著改善各种下游任务在最先进的GNNs和专用的异构模型9-21%。

3. 相关工作

3.1 元路径

为了更好地模拟真实世界的异构网络，本文假设在不同类型的节点之间可能存在多种类型的关系。例如，在OAG中，考虑作者顺序，作者与论文节点之间存在不同类型的关系，如“第一作者”、“第二作者”等。

3.2 动态异质图

为了模拟真实世界(异构)图的动态本质，当节点 $s$ 在 $T$ 时刻连接到节点 $t$ 时，赋予边 $e = (s, t)$ 一个时间戳 $T$ ，。如果 $s$ 第一次出现， $T$ 也被分配给 $s$ 。随着时间的推移建立连接，那么 $s$ 可以与多个时间戳相关联。

换句话说，假设一条边的时间戳是不变的，边的时间戳表示它被创建的时间。例如，当一篇论文在时间 $T$ 在一个会议上发表时， $T$ 将被分配到论文和会议节点之间的边。相反，可以为节点相应地分配不同的时间戳。例如，会议节点“WWW”可以在任何一年分配。WWW @1994意味着我们正在考虑的是第一版WWW，它更关注互联网协议和Web基础设施，而WWW @2020意味着即将到来的WWW，它将其研究主题扩展到社会分析、无处不在的计算、搜索和IR、隐私和社会等。

异构图挖掘的研究已经有了重要的进展，如节点分类、聚类、排序和表示学习[3,17 - 19]，而动态视角关于HGs的研究还没有得到广泛的探索和研究。

3.3 一般化的GNN架构

$H^l[t]$ 代表GNN 中第 $l$ 层节点 $t$ 的节点表示， $s$ 代表与节点 $t$ 相关的节点集合， $E （ s, t ）$ 代表节点之间的边的关系

其中最重要的GNN操作是 $Extract(\cdot)$ 和 $Aggregate(\cdot)$ ，分别代表邻居信息提取器和信息聚合器。其中信息聚合器简单的可以采用一些均值，加和或最大值操作，还可以设计更复杂的池和规范化函数

3.4 异质GNNs

最近，一些研究试图扩展GNNs来建模异构图。

关系图卷积网络(RGCN)建模知识图。RGCN为每条边类型保留不同的线性投影权值。
异构图神经网络(HetGNN)，它对不同的节点类型采用不同的神经网络(RNNs)来集成多模态特征。
HAN 通过对不同元路径定义的边保持不同的权值来扩展图注意力网络。它们还使用高级语义注意来区分和聚合来自不同元路径的信息。

虽然这些方法在经验上优于传统的GCN和GAT模型，但它们并没有充分利用异构图的特性。它们都单独使用节点类型或边类型来确定GNN权值矩阵。然而，不同类型的节点或边计数可能会有很大差异。对于那些没有充分出现的关系，很难了解准确的关系特定权重。

为了解决这个问题，我们建议考虑参数共享，以便更好地泛化。给定一个边 $e = (s, t)$ 与元关系 $⟨ τ (s), ϕ (e), τ (t) ⟩$ ，如果我们使用三个交互矩阵模型相对应的三个元素 $τ (s), ϕ (e)$ 和 $τ (t)$ 的元关系,然后大部分的权重可以共享。

例如，在“第一作者”和“第二作者”关系中，他们的源节点和目标节点类型分别都是要写论文的作者。换句话说，从一个关系中学习到的关于作者和论文的知识可以迅速转移和适应另一个关系。因此，我们将此思想与强大的变压器式注意力架构相结合，提出了异构图形转换器。

总结本文创新点如下：

(1)避免单独使用节点类型或边类型来确定GNN权值矩阵,本文提出使用元关系 $⟨ τ (s), ϕ (e), τ (t) ⟩$ 分解的相互作用和转换矩阵,使HGT高度捕捉共同和不同的特定模式使用相同或更少参数的关系。
(2)与目前大多数基于自定义元路径的工作不同，本文依靠神经结构的本质来整合高阶异构邻居信息，从而自动学习隐式元路径的重要性。
(3)以往的研究大多没有考虑(异构)图的动态特性，而本文提出了相对时间编码技术，利用有限的计算资源来整合时间信息。
(4)现有的异构GNN都不是针对大图设计和实验的，因此本文提出了大图训练设计的异构小批量图采样算法，可以在10亿尺度的开放学术图上进行实验。

4. HGT

异构图转换器(HGT)。其思想是利用异构图的元关系来参数化权重矩阵（避免利用单独的节点类型或者边类型来确定GNN权值矩阵），用于异构的相互关注、消息传递和传播步骤。并为了进一步整合网络动态，在模型中引入了一个相对的时间编码机制。

4.1 Overall HGT Architecture

图2展示了异构图转换器的总体架构。给定一个采样异构子图。高度提取所有链接的节点对，目标节点 $t$ 是由源节点 $s$ 通过边 $e$ 所连接的对象。HGT的目标是从源节点聚合信息得到更符合实际的目标节点表示 $t$ 。这种过程可以分解为三个组件:

异构相互关注（Heterogeneous Mutual Attention） - -针对于源节点和目标节点的注意力表示
异构的消息传递（Heterogeneous Message Passing）- - 针对于源节点
有针对性的聚合（Target-Specific Aggregation） - - 上述两个模块的有针对性聚合

将第 $l$ 层的输出表示为 $H^{(l)}$ ，它也是第 $l$ 层的输入。通过叠加 $L$ 层，我们可以得到整个图的节点表示 $H^{(L)}$ ，可以用于端到端训练或馈入下游任务。

4.2 Heterogeneous Mutual Attention

第一步是计算在源节点和目的节点之间的相互注意力，可以用如下的形式来表示：

其中包含了三个主要的操作函数，分别是 $A t t e n t i o n$ 来估计每个源节点的重要性、 $M e s s a g e$ 仅通过源节点 $s$ 来提取信息、 $A g g r e g a t e$ 根据注意力权重来聚合邻居信息。对于普通图注意力方法 GAT 来说，其中的三个模块可以表示为：

上述方法不能直接用于异质网络中的原因在于，GAT在同质图中默认节点 $s$ 和 $t$ 的特征分布相同，因此采用权重共享的策略，但是在异质图中，每个点的可能代表不同的含义，这导致点的特征分布在不同空间中，因此为了解决传统同质图 GAT 方法的局限性，本文提出了 Heterogeneous Mutual Attention。给出一个目标节点 $t$ ，他的所有邻居为 $\in N(t)$ ，他们可能用于不同的特征分布(属于不同类的节点)，我们希望可以基于元关系 $<\mathcal{T(s),\phi(e),T(t)}>$ 来计算它们的相互注意力。

作者收到 NLP 领域中 Transformer 结构的启发，将目标节点 $t$ 映射成为查询向量（Query vector），将源节点认为是 Key向量，将它们的点积结果当作是注意力。关键的区别是，普通的Transformer对所有单词使用一组投影，而在异质图中，每个元关系应该有一组不同的投影权重。为了使参数共享最大化，同时保持不同关系的具体特征，文中提出将交互算子的权矩阵参数化为源节点投影、边缘投影和目标节点投影。具体来说，通过以下方法计算每条边的 $e = (s, t)$ 的 h-head attention(图2 (1)):

首先，对于第 $i$ 个注意头 $ATT -head^i(s,e,t)$ ，采用线性投影 $K-Linear^i_{\mathcal{T}(s)}: \mathbb{R}^d→\mathbb{R}^{\frac{d}{h}}$ ，其中 $h$ 为注意头的个数、 $\frac{d}{h}$ 是每个头的矢量维数。每种类型的节点都有一个唯一的线性投影来最大限度地模拟分布差异。类似地，使用线性投影 $Q-Linear^i_{\mathcal{T}_{(t)}}$ 将目标节点 $t$ 投影到第 $i$ 个查询向量中。

并且由于每条元路径的信息的差异性，因此引入一个独特的基于边的矩阵 $W_{\phi(e)}^{ATT} \in \mathbb{R}^{\frac{d}{h}\times\frac{d}{h}}$

此外，由于并非所有的关系对目标节点的贡献都是相等的，我们添加一个先验张量 $\mu \in \mathbb{R}^{| \mathcal{A} |\times|\mathcal{R} |\times| \mathcal{A}|}$ 来表示每个元关系三元组的一般意义，作为对注意力的自适应缩放。最后，将 $h$ 个注意力头连接在一起，得到每个节点对的注意力向量。然后,为每个目标节点,我们从邻居 $N (t)$ 收集所有注意力向量，计算softmax正则化,使其满足 $\sum_{∀s∈N (t)} Attention_{HGT}(s、e、t) = 1_{h×1}$ 。

4.3 Heterogeneous Message Passing

在计算相互关注的同时，我们将信息从源节点传递给目标节点(见图2(2))。与注意过程类似，希望将边的元关系合并到消息传递过程中，以缓解不同类型节点和边缘的分布差异。对于一对节点 $e = (s, t)$ ，通过:

来获得第 $i$ 层的信息头 $MSG-head^i(s,e,t)$ 。
首先对于不同类型的节点先进性特征空间的转换 $M-Linear_{\mathcal{T}(s)}^i:\mathbb{R}^d \rightarrow\mathbb{R}^{\frac{d}{h}}$ 。之后接一个元路径信息的影响权重 $W_{\phi({e})}^{MSG} \in \mathbb{R}^{\frac{d}{h}\times\frac{d}{h}}$ 。最后是一个拼接操作，拼接所有注意力头。

4.4 Target-Specific Aggregation

计算出异构的多头注意力和消息后，我们需要将它们从源节点聚合到目标节点(参见图2(3))。（3）中的softmax 使每个目标节点 $t$ 的注意向量之和为1，因此我们可以简单地使用注意向量作为权值，对来自源节点的对应消息进行平均，得到更新后的向量 $\widetilde{H}^{(l)}[t]$ 为:

这将从它的不同特性分布的所有邻居(源节点)聚集信息到目标节点 $t$ 。最后一步是将目标节点 $t$ 的向量映射回其类型特定分布。为此对更新后的向量 $\widetilde{H}^{(l)}[t]$ 进行线性投影 $Linear_{\mathcal{T}(t)}$ ，并加上残差链接，最后的表达形式为:

通过这种方式，目标节点 $t$ 的第 $l$ 层HGT层的输出为 $H^{(l)}[t]$ 。由于现实世界的“小世界”特性图,叠加HGT块 $l$ 层( $l$ 是一个小值)可以使每个节点相邻的大部分节点均具有不同的类型和关系。即HGT为每个节点生成高度上下文化的表示 $H^{(L)}$ ，可将其输入任何模型，进行下游异构网络任务，如节点分类、链路预测等。

整个模型架构高度依赖使用元关系 $⟨ τ (s), ϕ (e), τ (t) ⟩$ ——参数化矩阵的权重。这可以解释为模型容量和效率之间的权衡。与普通 Transformer 相比，我们的模型区分了不同关系的算子，从而更能处理异构图的分布差异。与现有的模型相比，保留了HGT的三联体参数化可以更好地利用异构图模式实现参数共享。

一方面，较少出现的关系可以从这种参数共享中获益，以实现快速的自适应和泛化。
另一方面，不同关系的操作符仍然可以通过使用小得多的参数集来保持其特定的特征。

4.5 Relative Temporal Encoding

到目前为止，本文提出了HGT-a图神经网络来建模异构图。接下来介绍了相对时间编码(RTE)技术，用于HGT处理图的动态。传统的合并时间信息的方法是为每个时隙构造一个单独的图。然而，这样的过程可能会在不同的时间槽中丢失大量的结构依赖关系。同时， $t$ 时刻节点的表示可能依赖于发生在其他时隙的边。因此，对动态图建模的一种正确方法是保持所有发生在不同时间的边，并允许具有不同时间戳的节点和边相互交互。基于此，我们提出了相对时间编码(RTE)机制来建模异构图的动态依赖关系。RTE的灵感来自Transformer的位置编码方法，该方法已被证明能够成功地捕获长文本中单词的顺序依赖关系。具体来说，给定一个源节点 $s$ 和一个目标节点 $t$ ，以及它们对应的时间戳 $T (s)$ 和 $T (t)$ ，我们将相对时间间隙 $∆ T (t, s) = T (t) - T (s)$ 作为索引，得到相对时间编码 $R T E (∆ T (t, s))$ 。训练数据集不会覆盖所有可能的时间间隔，因此RTE应该能够一般化到未见时间和时间间隔。因此采用一组固定的正弦函数作为基，带有可调线性投影 T-Linear : $\mathbb{R}^d\rightarrow \mathbb{R}^d$ 为RTE:

最后，在源节点 $s$ 的表示中加入相对于目标节点 $t$ 的时间编码，如下所示:

这样，时间增广表示 $\hat{H}^{(l−1)}$ 将获取源节点 $s$ 和目标节点 $t$ 的相对时间信息，RTE过程如图3所示。

5. WEB-SCALE HGT TRAINING

5.1 HGSampling

全批的 GNN 训练需要计算每一层的所有节点表示，这使得它不能用于web规模的图。为了解决这个问题，直接对异构图使用同构图类型数据的采样方法，容易得到对于不同节点类型非常不平衡的子图，因为每种类型的度分布和节点总数可能会有很大差异。为了解决这个问题，本文提出了一种高效的异构小批图采样算法- HGSampling，使HGT和传统的 GNN 都能处理web规模的异构图。HGSampling能够

1)保持每种类型的节点和边的数量相近
2)保持采样子图的密集性最小化信息损失，降低样本方差。

算法1概述了HGSampling算法。它的基本思想是为每个节点类型 $\mathcal{T}$ 保留一个单独的节点预算 $B[\mathcal{T}]$ [已知节点 $t$ 已经采样，用算法2将其所有的直接邻居加到相应的预算中，并在第8行中对这些邻居加上 $t$ 的归一化度，用于计算采样概率。这种归一化相当于将每个采样节点的随机游走概率累加到其邻域，避免采样被高度节点所控制。直观地看，该值越高，则候选节点与当前采样节点的关联程度越高，因此应该给予被采样的概率越高。

更新预算后，在算法1第9行中计算抽样概率，其中计算每个预算中每个节点s的累计归一化度的平方。利用这种抽样概率可以降低抽样方差。然后，在第12-15行中，使用计算出的概率对 $n$ 个类型的节点进行抽样，将它们添加到输出节点集，更新其邻域到预算，并将其从预算中移除。重复这个过程 $L$ 次，得到一个从初始节点开始的深度为 $L$ 的采样子图。最后，重构了采样节点间的邻接矩阵。通过使用上述算法，采样后的子图每个类型的节点数量相近(基于单独的节点预算)，且足够密集，可以降低采样方差(基于归一化程度和重要性采样)，适合在web规模的异构图上训练 GNN。

5.2 Inductive Timestamp Assignment

到目前为止，我们假设每个节点 $t$ 都被分配了一个时间戳 $T (t)$ 。然而，在真实的异构图中，许多节点并不与固定的时间相关联。因此，我们需要给它分配不同的时间戳。我们将这些节点表示为普通节点。例如，WWW会议是在1974年和2019年举行的，这两年的WWW节点有着截然不同的研究主题。因此，我们需要决定将哪个时间戳附加到WWW节点上。

在异构图中也存在具有显式时间戳的事件节点。例如，paper节点应该与它的发布行为相关联，从而与它的发布日期相关联。提出了一种基于关联事件节点的归纳时间戳分配算法来分配普通节点的时间戳。算法如算法2第6行所示。其思想是计划节点从事件节点继承时间戳。检查候选源节点是否为事件节点。如果是，就像在特定年份发表的论文一样，保留它的时间戳来捕获时间依赖性。如果没有，比如一个可以与任何时间戳关联的会议，我们将关联节点的时间戳(例如其论文的发表年份)归纳分配给这个普通节点。这样，可以在子图采样过程中自适应地分配时间戳。

数据集介绍略

6. 实验

基于STM32设计的智能喂养系统(ESP8266+微信小程序)175 DS小龙哥智能家居与物联网项目实战 stm32 微信小程序嵌入式硬件智能喂养系统投喂系统
基于STM32设计的牛羊喂养系统(微信小程序)(175)文章目录一、前言1.1项目介绍【1】项目功能介绍【2】项目硬件模块组成【3】ESP8266工作模式配置【4】上位机开发【5】项目模块划分1.2项目功能需求1.3项目开发背景1.4开发工具的选择1.5系统框架图1.6系统原理图1.7硬件实物图二、硬件选型2.1STM32开发板2.3PCB板2.4蜂鸣器模块2.5USB下载线2.6水位传感器(2个
css滑块开关的使用,CSS3制作滑块按钮
滑块按钮-渣图.gif查看demo结构先整理一下，这个按钮的层。分层.gif样式body{background:#eee;}/*--用绝对定位让整个按钮在页面垂直居中--*/.toggle-wrapper{position:absolute;;left:50%;top:50%;overflow:hidden;margin-left:-60px;／*--按钮向左移动一半的宽度--*／margin-t
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
python模拟行星运动_动态模拟运行太阳系的行星运转
在地理学科中，都要学习认识太阳系的知识，对于天体的运动，没有动态演示的话，学生们只能凭空想象，无法观看到九大行星之间到底是如何运转的。几何画板作为人教版指定教育软件，被老师们广泛用于教学中，不仅仅可以用来演示几何图形，还可以应用在地理学科中演示天体运动情况，下面就给大家介绍利用几何画板制作的动态模拟运行太阳系的九大行星课件。几何画板动态模拟运行太阳系的九大行星课件样图：几何画板课件模板——动态模拟
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
零基础数据结构与算法—— 第三章：高级数据结构-总结 qqxhb 零基础数据结构与算法小学生编程算法数据结构算法树堆哈希表图
3.1树（上）3.1树（下）3.2堆（Heap）3.3哈希表（HashTable）3.4图（Graph）3.5高级树结构3.6本章小结在本章中，我们深入学习了几种重要的高级数据结构，这些数据结构在解决复杂问题时具有强大的能力。让我们回顾一下本章的主要内容：1.堆（Heap）堆是一种特殊的完全二叉树，具有堆序性质。我们学习了：最大堆和最小堆的概念和性质堆的基本操作（插入、删除堆顶、获取堆顶、构建堆）
Android 自定义View 绘制一条颜色渐变，粗细渐变的线 nc_kai 笔记 Android 安卓
自定义View绘制一条颜色渐变，粗细渐变的线效果图如下：自定义View代码importandroid.annotation.SuppressLintimportandroid.content.Contextimportandroid.graphics.*importandroid.util.AttributeSetimportandroid.util.Logimportandroid.view.V
Linux exec函数族完全指南
在Linux系统编程中，exec函数族用于在一个进程中替换当前运行的程序为另一个新的程序。它与fork()配合使用，是实现多进程编程、启动子进程执行外部命令的核心机制。目录一、exec函数族概述二、exec函数族成员三、函数原型详解1.execl()示例：2.execlp()示例：3.execv()示例：4.execvp()示例：5.execle()示例：四、exec执行流程图解（知识树状图）五、
《支持向量机（SVM）在医疗领域的变革性应用》 CodeJourney. 支持向量机算法机器学习
在医疗科技日新月异的今天，先进的数据分析与机器学习技术正逐渐成为提升诊疗水平、助力医学研究的关键力量。支持向量机（SVM），凭借其独特的优势，在医疗这片复杂且对精准度要求极高的领域崭露头角，带来诸多令人瞩目的应用成果。一、疾病诊断：癌症早期筛查的“火眼金睛”癌症，作为全球健康的“头号杀手”，早期诊断对提升患者生存率意义非凡。在乳腺癌筛查领域，SVM发挥着重要作用。医疗科研人员收集大量乳腺组织的影像
机器学习20-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习20-线性网络思考针对线性网络的基础问题，使用基础示例进行解释1-核心知识点1-线性模型家族的线性回归和逻辑回归分别是什么，线性模型家族还有没有其他的模型线性模型家族是一系列基于线性假设的统计模型，它们假设因变量和自变量之间存在线性关系。线性模型家族中的两个最常见模型是线性回归和逻辑回归。线性回归（LinearRegression）:线性回归是一种用于预测连续因变量的模型。它假设因变量yy
机器学习18-强化学习RLHF 坐吃山猪机器学习机器学习人工智能
机器学习18-强化学习RLHF1-什么是RLHFRLHF（ReinforcementLearningfromHumanFeedback）即基于人类反馈的强化学习算法，以下是详细介绍：基本原理RLHF是一种结合了强化学习和人类反馈的机器学习方法。传统的强化学习通常依赖于预定义的奖励函数来指导智能体的学习，而RLHF则通过引入人类的反馈来替代或补充传统的奖励函数。在训练过程中，人类会对智能体的行为或输
机器学习19-Transformer和AlexNet思考坐吃山猪机器学习机器学习 transformer 人工智能
Transformer和AlexNet思考关于Transformer和AlexNet发展的一些思考1-核心知识点Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？AlexNet的主要核心思路是什么，为什么表现那么好？现在有什么比AlexNet更优秀的算法2-思路整理1-Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？Word2Vec的作用Word2
从零开始学Linux：系统架构全解析程序员弘羽 Linux系统编程 linux
目录一、什么是Linux？简介核心特点：二、Linux的基本组成结构1.内核（Kernel）示例：查看当前内核版本2.Shell命令解释器示例：查看当前使用的Shell3.文件系统结构（FilesystemHierarchyStandard,FHS）常见目录及其用途：示例：查看目录结构4.用户与权限管理用户类型：权限分类：示例：查看文件权限三、Linux启动流程概述启动流程简图（知识树状流程图）：
机器学习21-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习21-线性网络思考针对线性网络的发展问题，进行补充学习1-核心知识点1-传统机器学习针对线性分类算法求解的方式有哪些？请详细列举不同的算法对应的损失函数和计算思路在传统机器学习中，线性分类算法是一种非常重要的方法，用于将数据划分为不同的类别。以下是几种常见的线性分类算法，包括它们的损失函数和计算思路：1.感知机（Perceptron）损失函数感知机的损失函数是基于误分类点的，其目标是最小化
搜索之BFS Luther coder 宽度优先 c++
目录一.BFS简介二.BFS主要应用和实现三.典型例题（1）P1443马的遍历-洛谷（2）P8693[蓝桥杯2019国AC]大胖子走迷宫-洛谷四.总结一.BFS简介BFS(图论)：广度优先搜索,是一种用于遍历或搜索树或图的算法。所谓广度优先，就是说按照圈层搜索。二.BFS主要应用和实现在搜索算法中，该BFS常常指利用队列实现广度优先搜索，从而寻找最短距离。与图论中的BFS算法有一定相似之处，但并不
【Linux命令大全】Linux安全模块(LSM)终极指南：SELinux与AppArmor实战
【Linux命令大全】Linux安全模块(LSM)终极指南：SELinux与AppArmor实战安全警报：90%的Linux系统未正确配置强制访问控制！掌握这些技术可防御95%的提权攻击！本文包含100+策略案例，25张权限流程图，企业级安全方案全公开！前言：为什么LSM是系统安全的最后防线？在日益复杂的攻击环境下，我们面临的核心安全挑战：零日漏洞的应急防护容器逃逸攻击防御横向移动限制合规审计要求
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
vue3 - element-plus实现将table表格改为单选效果，将el-table表格实现单选，多选表格变为单选形式（Table多选框改成单选框，表格添加单选框，支持复杂表格嵌套数据多层勾选）十一猫咪爱养鱼前端组件与功能(开箱即用)vue常见问题解决 vue3 element plus table表格多选改为单选功能 el-table复选框改为单选修改ui为圆形单选radio Table表格多选框修改单选
效果图在vue3+elementplus项目开发，实现el-table表格由原来的多选框改为单选框，element-plustable表格控件实现单选功能，支持多级嵌套表格及复杂数据，详细实现Table表格复选框实现单选效果，并且可以动态勾选或取消选中，列表复选框支持单选，可根据情况随意自定义修改复选框的UI样式（改为圆圈）！提供详细示例代码，新手小白复制稍微改改就能用了。完整源码具体说明及核心代
Python深度学习：3步实现AI人脸识别，效果堪比专业软件！小筱在线 python 人工智能 python 深度学习
引言：AI人脸识别的时代已经到来在当今数字化时代，人脸识别技术已经从科幻电影走进了我们的日常生活。从手机解锁到机场安检，从银行身份验证到智能门禁系统，这项技术正以前所未有的速度改变着我们的生活方式。而令人振奋的是，借助Python和深度学习技术，普通人也能构建出专业级的人脸识别系统。本文将带领您通过三个关键步骤，使用Python深度学习技术实现一个准确率高达99%的人脸识别系统。这个系统不仅原理简
文末含资料链接！YOLOv11性能飞跃：深度融合iRMB注意力机制，实战教程助你突破检测极限！博导ai君深度学习教学-附源码 YOLO
文章目录1.介绍：揭秘iRMB——轻量化与高性能的完美融合1.1摘要：洞察iRMB的设计哲学与卓越表现1.2简单描述：深入剖析iRMB的构造与工作原理核心灵感：CNN与Transformer的珠联璧合iRMB的核心结构：短距离与长距离的协同设计理念：实用、统一、有效、高效1.3模块结构：iRMB的内部构造图（概念描述）2.代码解析：逐行揭秘iRMB的魔法2.1`LayerNorm2d`：为2D数据
2021.10.4 比赛题整理伍叁壹_ 比赛整理题解 c++
2021.10.42021CSPJ初二初一冲刺七链接集合总结炸了炸了。。T3半天做了个寂寞。对算法不熟悉。T1：简单思维题；T2：KMPnxt数组的运用；T3：二分+图，代码实现可用并查集；T4：四维树形dp。T1题意设a0←1a_0\gets1a0←1，an←ai+aja_n\getsa_i+a_jan←ai+aj（i，j在[0,n−1)[0,n-1)[0,n−1)范围内随机）。求对于给定的nn
Spring AI 第二讲之 Chat Model API 第五节HuggingFace Chat
HuggingFaceInferenceEndpoints允许您在云中部署和提供机器学习模型，并通过API对其进行访问。开始使用有关HuggingFaceInferenceEndpoints的更多详细信息，请访问此处。前提条件添加spring-ai-huggingface依赖关系：org.springframework.aispring-ai-huggingface获取HuggingFaceAPI
城乡规划转型GIS开发：数字化浪潮下的职业突新中地GIS开发老师 GIS 地信地理信息科学大学生 webgis 城乡规划 GIS开发
“国土空间规划一张图”“数字孪生城市”“实景三维中国”——近年来，国家政策与科技风口将地理信息技术（GIS）推向热潮。反观城乡规划行业：传统规划设计院缩编降薪，地产行业震荡，考编竞争白热化。当“画图民工”遭遇职业瓶颈，一群城乡规划人正悄悄将目光投向GIS开发赛道。在新中地就有这样一群人，通过城规转型GIS开发成功就业。那么，城规为何能丝滑转型GIS开发？小白怎么转？有哪些注意事项？今天给大家好好聊
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
Java+Python智能化Ai云盘[Day2]
OK啊，为了完成学校老师布置的UML作业主播也是开始拿自己的项目开始当成期末大作业来交了。顺道的我也把自己的项目整个的梳理了一通，如果大家最近有UML的大作业要交也可以自取，到时候我把文章word版本直接发到百度网盘上去。里面我只有类图、用例图、活动图、顺序图、状态图。这次也算是一个提前复习了一下项目了把，整个的文档文字都是拿ai去写的，图的话也是我先看了一遍代码，然后给ai说了一遍也算是自己理通
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n