斯曦巍峨

图自监督学习综述：Graph Self-Supervised Learning A Survey

Introduction

为什么需要自监督学习？

图上的深度学习近些年十分流行，但是现有的工作大部分都是监督或半监督学习（需要人工标注标签）。基于监督学习和半监督学习的方法存在一些缺陷：

人工标注耗时耗力；
泛化性能可能较差，尤其是训练数据稀缺的时候；
鲁棒性较差，可能受到标签相关的对抗性攻击。

而自监督学习（self-supervised learning, SSL）对人工标注数据的依赖较低，因此可以很好的解决上述问题。

什么是自监督学习？

SSL利用前置任务（pretext task）从无监督数据中挖掘自身的监督信息，通过精心设计的前置任务可以学得更具表达能力的表示（representation），从而在各种下游任务上获得更好的性能、泛化能力和鲁棒性。

DL其它领域自监督学习

SSL在CV和NLP领域已经取得了巨大的成功，但是由于图数据的非欧性，将用于CV/NLP的前置设计迁移到图上来是比较困难的，例如

应用于网格结构的前置任务不能直接应用到图上；
图上的节点通过拓扑结构联系在一起，而CV和NLP中的样本经常是不相关的。

图自监督学习的历史

图SSL的历史至少可以追溯到关于无监督图嵌入（Embedding）的早期研究，这些方法通过最大化截断随机游动（(truncated random walk）中上下文节点之间的一致性来学习节点表示。

截断随机游走实际上就是长度固定的随机游走。

2019年来，大量针对图SSL的前置任务设计被提出：对比学习（contrastive learning）、图属性挖掘（graph property mining）。

Definition and Notation

图自监督学习相关的术语

Manual Labels和Pseudo Labels：人工标签顾名思义指人工标注的标签，而伪标签指机器自动从数据中获取的标签。在SSL中，可以设计特定的方法来生成伪标签，从而增强表示学习。

Downstream Tasks和Pretext Tasks：下游任务是指应用SSL获取的表示进行图分析的任务，例如Node Classification和Graph Classification。前置任务是预先设计好的供模型解决的任务，例如图重建。通过Pretext Task可以从未标记的数据中学习更普遍的表示，使得下游任务的性能更佳。

Supervised Learning、Unsupervised Learning和Self-Supervised Learning：监督学习指训练模型的数据带人工标注的标签，无监督学习指不使用人工标签进行学习（聚类），自监督学习指监督信息由数据自身生成。

图相关的符号

Plain Graph：朴素图表示为 $\mathcal{G}=(\mathcal{V}, \mathcal{E})$ ，其中 $\mathcal{V}$ 表示顶点集， $\mathcal{E}$ 表示边集，图的拓扑结构表示为邻接矩阵 $\mathbf{A}$ 。

Attributed Graph：属性图指图中的节点或边包含自己的特征，图中所有节点的特征组成矩阵 $\mathbf{X}_{\text{node}} \in \mathbb{R}^{n \times d_{\text{node}}}$ ，图中所有边的特征矩阵矩阵 $\mathbf{X}_{\text{edge}} \in \mathbb{R}^{m \times d_{\text{edge}}}$ 。

$H$ ：节点的表示矩阵，将结点特征送入编码器获取到的。

$h_{\mathcal{G}}$ ：图级别的特征，在节点特征上应用Readout函数获取的。

Framework and Categorization

图自监督学习的统一框架和数学形式

用encoder-decoder框架来形式化图自监督学习：

编码器：用 $f_{\theta}$ 表示，用来为图中每个节点学得一个低维表示 $\mathbf{h}_{\mathbf{i}} \in \mathbf{H}$ 。 $f_{\theta}$ 可以为GNNs或者其它类型的神经网络。
解码器：前置任务解码器用 $p_{\phi}$ 表示，它以 $\mathbf{H}$ 作为前置任务的输入。 $p_{\phi}$ 的架构取决于下游任务。

基于以上内容，图自监督学习可以形式化为：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \mathcal{L}_{s s l}\left(f_{\theta}, p_{\phi}, \mathcal{D}\right),$
其中 $\mathcal{D}$ 表示图数据分布， $\mathcal{L}_{s s l}$ 表示SSL的优化目标上定义的损失函数。训练好的图编码器 $f_{\theta^{*}}$ 可以生成用于各种下游任务的初始化表示。下游任务用 $q_{\psi}$ 表示，图监督学习的下游任务的形式为：
$\theta^{* *}, \psi^{*}=\underset{\theta^{*}, \psi}{\arg \min } \mathcal{L}_{s u p}\left(f_{\theta^{*}}, q_{\psi}, \mathcal{G}, y\right)$
其中 $y$ 表示数据的标签， $\mathcal{L}_{s u p}$ 表示监督学习任务的损失函数。

图自监督学习的分类

图SSL的4中类别：

基于生成的方法

基于生成的（generation-based）方法的前置任务为图数据重建，包括有节点/边特征或图邻接关系的重建。
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \mathcal{L}_{s s l}\left(p_{\phi}\left(f_{\theta}(\tilde{\mathcal{G}})\right), \mathcal{G}\right)$
其中 $f_{\theta}(\cdot)$ 和 $p_{\phi}(\cdot)$ 分别表示图编码器和前置任务解码器， $\tilde{\mathcal{G}}$ 表示具有扰动节点/边特征或邻接矩阵的图数据。大多数基于生成的方法通常定义 $\mathcal{L}_{s s l}$ 来测量重建图和原始图间的差异。典型代表是图自编码器GAE，它通过重建邻接矩阵来学习嵌入。

基于辅助属性的方法

基于辅助属性（auxiliary Property-based）的方法是利用图的辅助属性来作为监督信号。基于辅助属性的方法可以细分为两类：

基于回归（regression）的
基于分类（classification）的

基于辅助属性的方法的数学形式为：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \mathcal{L}_{s s l}\left(p_{\phi}\left(f_{\theta}(\mathcal{G})\right), c\right)$
其中 $c$ 表示特定的辅助属性。

对于基于回归的方法， $c$ 可以是局部或全局的图属性，例如节点度、图 $\mathcal{G}$ 内簇（cluster）的距离。 $\mathcal{L}_{s s l}$ 可以是均方误差（MSE）.

对于基于分类的方法， $c$ 可以是伪标签、例如图分区或簇索引。 $\mathcal{L}_{s s l}$ 可以是交叉熵（CE）.

基于对比的方法

互信息：信息论中用以评价两个随机变量之间的依赖程度的一个度量。

基于对比（contrast-based）的方法通常基于互信息（MI）最大化的概念，其中同一对象（如节点、子图、图）的增强实例之间的MI被最大化。
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \mathcal{L}_{s s l}\left(p_{\phi}\left(f_{\theta}\left(\tilde{\mathcal{G}}^{(1)}\right), f_{\theta}\left(\tilde{\mathcal{G}}^{(2)}\right)\right)\right)$
其中 $\tilde{\mathcal{G}}^{(1)}$ 和 $\tilde{\mathcal{G}}^{(2)}$ 是 $\mathcal{G}$ 的两个不同增强实例，前置解码器 $p_{\phi}$ 是估计两个实例之间一致性的判别器（discriminator）。 $\mathcal{L}_{s s l}$ 表示对比损失，对比损失旨在最大化与正样本的MI，并与最小化负样本的MI。

混合方法

混合（hybrid）方法利用了前面提到的三种方法，它由多个前置解码器或训练目标组成。

自监督训练方案的分类

根据图编码器、自监督前置任务和下游任务的关系，将训练方案分为三种。

预训练+微调

预训练微调（Pre-training and Fine-tuning, PF）模式指编码器 $f_{\theta}$ 首先通过预训练数据集上的前置任务进行预训练得到 $f_{\theta_{\text {init }}}$ 。然后，在特定下游任务的监督下，使用下游解码器 $q_{\psi}$ 和微调数据集上对预训练编码器 $f_{\theta_{\text {init }}}$ 进行微调。
$\begin{gathered} \theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \mathcal{L}_{s s l}\left(f_{\theta}, p_{\phi}, \mathcal{D}\right), \\ \theta^{* *}, \psi^{*}=\underset{\theta^{*}, \psi}{\arg \min } \mathcal{L}_{s u p}\left(\theta^{*}, q_{\psi}, \mathcal{G}, y\right) . \end{gathered}$

联合学习

在联合学习（Joint Learning, JL）中，编码器是与前置和下游任务共同训练的，其损失函数由自监督和下游任务损失共同组成。
$\theta^{*}, \phi^{*}, \psi^{*}=\underset{\theta, \phi, \psi}{\arg \min }\left[\alpha \mathcal{L}_{s s l}\left(f_{\theta}, p_{\phi}, \mathcal{D}\right)+\mathcal{L}_{s u p}\left(f_{\theta}, q_{\psi}, \mathcal{G}, y\right)\right]$

无监督表征学习

无监督表征学习（Unsupervised Representation Learning, URL）的第一个阶段与PF相似，主要是区别是：

第二个阶段编码器的参数 $\theta^{*}$ 会固定住，而不会随着模型在下游任务上训练的过程中发生变化；
训练的两个阶段使用相同的数据集。

$\begin{aligned} \theta^{*}, \phi^{*} &=\underset{\theta, \phi}{\arg \min } \mathcal{L}_{s s l}\left(f_{\theta}, p_{\phi}, \mathcal{D}\right), \\ \psi^{*} &=\underset{\psi}{\arg \min } \mathcal{L}_{s u p}\left(f_{\theta^{*}}, q_{\psi}, \mathcal{G}, y\right) . \end{aligned}$

下游任务分类

下游任务可以划分为：

Node-level tasks
Link-level tasks
Graph-level tasks

自监督学习的有效性是通过下游任务的性能来进行评估的。

Generation-based Methods

图生成任务旨在重建输入数据，并使用输入数据作为监督信号。根据重建的对象，该类方法可以划分为两类：

特征生成（feature generation）：重建图的特征信息；
结构生成（structure generation）：重建图的拓扑结构信息。

特征生成

特征生成方法通过从扰动图或原始图中恢复特征信息来学习，其可形式化为：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \mathcal{L}_{m s e}\left(p_{\phi}\left(f_{\theta}(\tilde{\mathcal{G}})\right), \hat{\mathbf{X}}\right),$
其中 $p_{\phi}(\cdot)$ 表示特征回归的解码器， $\mathcal{L}_{m s e}$ 是均方误差损失， $\hat{\mathbf{X}}$ 是各种特征矩阵的通用表示，例如节点特征矩阵、边特征矩阵。

掩码特征回归

掩码特征回归（masked feature regression strategy）指将特定节点/边的特征掩去（用0或特定标记），然后模型尝试根据未被掩去的信息来恢复掩去的特征。

Graph Completion

Attribute Mask

Attribute Mask旨在重建经过PCA处理的稠密（dense）特征矩阵（ $(\hat{\mathbf{X}}=P C A(\mathbf{X}))$ ），而不是原始的高维稀疏特征（重建起来比较困难）。Attribute Mask不仅重建节点属性，还重建边属性，即 $\hat{\mathbf{X}}=\left[\mathbf{X}, \mathbf{X}_{\text {edge }}\right]$ 。

其它方法

从噪声特征生成特征：MAGE使用GNN来从带噪声的输入特征中恢复原始（raw）特征。

从干净的特征重建特征：GALA训练了一个拉普拉斯平滑锐化图自动编码器模型，目标是根据干净的输入图重建原始特征矩阵。

结构生成

结构生成方法通过恢复结构信息来学习，大多数情况都是在重建邻接矩阵，基于此结构生成方法可以形式化为：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \mathcal{L}_{s s l}\left(p_{\phi}\left(f_{\theta}(\tilde{\mathcal{G}})\right), \mathbf{A}\right)$
其中 $p_{\phi}(\cdot)$ 是用于结构重建的解码器。

GAE

图自编码器GAE使用基于GCN的编码器从原始图中生成节点嵌入 $\mathbf{H}$ ，然后解码器通过带sigmoid激活的内积函数来重建邻接矩阵 $\mathbf{A}$ （指两两计算两点之间存在边的概率）。由于邻接矩阵通常是二进制和稀疏的，因此使用了BCELoss。

GAE之后有很多基于此的衍生工作，例如VGAE、SIG-VAE、ARGA/ARVGA、SuperGAT。

Denoising Link Reconstruction

不重建完整图，Denoising Link Reconstruction仅重建掩去的边。其具体做法是随机丢弃一些边来获取一个扰动图 $\tilde{\mathcal{G}}$ ，然后，该模型应用BCL loss来训练模型，以恢复丢弃的连接（边）。

Auxiliary Property-based Methods

辅助属性分类

辅助属性分类模型自动创建离散伪标签，然后用分类器作为前置任务，使用交叉熵来训练模型，其数学形式为：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \mathcal{L}_{c e}\left(p_{\phi}\left(f_{\theta}(\mathcal{G})\right), c\right)$
其中 $p_{\phi}$ 是分类器，它输出一个 $k$ 维的概率向量（ $k$ 表示类别数）， $\in \mathcal{C}=\left\{c_{1}, \cdots, c_{k}\right\}$ 是对应的伪标签。

根据伪标签的生成方式，辅助属性分类方法可以分为两类：clustering-based和pair relation-based。

基于聚类的方法

根据节点的属性或结构特征将节点划分为不同的簇来生成伪标签，该类方法的学习目标为：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \frac{1}{|\mathcal{V}|} \sum_{v_{i} \in \mathcal{V}} \mathcal{L}_{c e}\left(p_{\phi}\left(\left[f_{\theta}(\mathcal{G})\right]_{v_{i}}\right), \Omega\left(v_{i}\right)\right)$
其中 $[\cdot]_{v_{i}}$ 表示抓取节点 $v_i$ 的表示的函数， $\Omega: \mathcal{V} \rightarrow \mathcal{C}$ 是一个从节点到伪标签的映射函数（即生成伪标签的聚类/分区算法）。

Node Clustering：使用节点特征聚类算法来对图节点聚类，每个簇中的所有结点对应同一种伪标签，不同类不同。

非基于节点特征的聚簇方法：

Graph Partitioning：根据结点的结构特征进行聚簇；
Clustering Preserving：先利用图聚簇算法聚簇，然后利用基于注意力的聚合器（aggregator）来生成每个簇的表示，最后计算每个结点对应各个簇的相似性作为软（soft）伪标签。
CAGNN：先运行基于特征的聚类来生成伪标签，然后通过最小化簇间边来细化聚类。（属性聚簇+结构聚簇）

基于配对关系的方法

生成节点对间关系的伪标签，该类方法的学习目标为：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \frac{1}{|\mathcal{P}|} \sum_{v_{i}, v_{j} \in \mathcal{P}} \mathcal{L}_{c e}\left(p_{\phi}\left(\left[f_{\theta}(\mathcal{G})\right]_{v_{i}, v_{j}}\right), \Omega\left(v_{i}, v_{j}\right)\right)$
其中 $\Omega: \mathcal{V} \times \mathcal{V} \rightarrow \mathcal{C}$ 是节点对到伪标签的映射函数， $\mathcal{P} \subseteq \mathcal{V} \times \mathcal{V}$ 表示特定前置任务定义的节点对集， $[\cdot]_{v_{i}, v_{j}}$ 表示节点对的特征的拼接（concatenation）。

$S^2GRL$ ：将结点对间的最短距离作为伪标签，即 $\Omega\left(v_{i},v_{j}\right)=\operatorname{dist}\left(v_{i}, v_{j}\right)$ ；

Pairwise Distance：与前者类似，只不过给距离设了一个上界，即 $\Omega\left(v_{i}, v_{j}\right)=\max \left(\operatorname{dist}\left(v_{i}, v_{j}\right), 4\right)$ 。

Centrality Score Ranking ：前置任务为预测一对节点间中心性（centrality）得分的相对顺序，具体做法为每个节点对 $\left(v_{i}, v_{j}\right)$ 计算4种类型的中心性分数 $s_i, s_j$ （eigencentrality , betweenness, closeness, and subgraph centrality），然后通过比较 $s_i$ 和 $s_j$ 的值来生成伪标签，即 $\Omega\left(v_{i}, v_{j}\right)=\mathbb{I}\left(s_{i}>s_{j}\right)$ ，其中 $\mathbb{I}(\cdot)$ 是 identity function。

辅助属性回归

辅助属性回归以跟图的数值属性相关的回归任务作为前置任务，其可以形式化为：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \mathcal{L}_{m s e}\left(p_{\phi}\left(f_{\theta}(\mathcal{G})\right), c\right),$
其中 $\mathcal{L}_{m s e}$ 表示回归损失函数， $\in \mathbb{R}$ 表示一个连续属性值。

NodeProperty：与节点数值属性有关的前置任务，节点属性可以选择degree、local node importance、local clustering coefficient。以节点度为例，目标函数可写为：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \frac{1}{|\mathcal{V}|} \sum_{v_{i} \in \mathcal{V}} \mathcal{L}_{m s e}\left(p_{\phi}\left(\left[f_{\theta}(\mathcal{G})\right)\right]_{v_{i}}, \Omega\left(v_{i}\right)\right)$
其中 $\Omega\left(v_{i}\right)=\sum_{j=1}^{n} \mathbf{A}_{i j}$ 是计算节点 $v_i$ 度的映射函数。

PairwiseAttrSim：根据两个节点间的嵌入来预测它们的特征相似性，即：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \frac{1}{|\mathcal{P}|} \sum_{v_{i}, v_{j} \in \mathcal{P}} \mathcal{L}_{m s e}\left(p_{\phi}\left(\left[f_{\theta}(\mathcal{G})\right]_{v_{i}, v_{j}}\right), \Omega\left(v_{i}, v_{j}\right)\right)$
其中映射函数 $\Omega\left(v_{i}, v_{j}\right)=\operatorname{cosine}\left(\mathbf{x}_{i}, \mathbf{x}_{j}\right)$ 指节点对间原始特征间的余弦距离。

Contrast-based Methods

图增强

CV领域对比学习的成功表明数据增强有利于模型探索更丰富的潜在语义信息。

数据增强的形式化定义：给定图 $\mathcal{G}$ ，第 $i$ 个图增强实例可以定义为 $\tilde{\mathcal{G}}^{(i)} = t_i(\mathcal{G})$ ，其中 $t_i \thicksim \tau$ 是一个选定的图增强方式， $\tau$ 是一组可用的增强。

属性增强

对节点属性进行增强，给定图 $\mathcal{G} = \{ \mathbf{A}, \mathbf{X} \}$ ，增强图可以表示为：
$\tilde{\mathcal{G}}^{(i)}=\left(\mathbf{A}, \tilde{\mathbf{X}}^{(i)}\right)=\left(\mathbf{A}, t_{i}(\mathbf{X})\right)$
其中 $\tilde{\mathbf{X}}^{(i)}$ 表示增强的节点特征。

节点特征掩码（Node Feature Masking, NFM）

NFM指随机掩去给定图上的部分节点的特征，可以完全掩去特征向量或掩去特征向量的若干通道，其可形式化定义为：
$t_{i}(\mathbf{X})=\mathbf{M} \circ \mathbf{X}$
其中 $\mathbf{M}$ 是掩码矩阵。

GCA：通过节点中心性（centrality）来衡量重要程度，对于重要程度底的节点分配更高的mask频率。

节点特征打乱（Node Feature Shuffle, NFS）

NFS通过对节点特征矩阵进行部分按行的扰动来交换图中某些节点的特征向量，其用数学可以表示为：
$t_{i}(\mathbf{X})=[\mathbf{X}]_{\tilde{\mathcal{V}}}$
其中 $[\cdot]_{v_i}$ 表示从特征矩阵中取 $v_i$ 的特征向量的函数， $\tilde{\mathcal{V}}$ 表示部分打乱后的节点集。

拓扑增强

拓扑增强主要是在图的邻接矩阵上下功夫，其可以形式化为：
$\tilde{\mathcal{G}}^{(i)}=\left(\tilde{\mathbf{A}}^{(i)}, \mathbf{X}\right)=\left(t_{i}(\mathbf{A}), \mathbf{X}\right)$
边修改（Edge Modification, EM）

EM是最常用的拓扑增强方法之一，其主要是通过随机删除和插入部分边来扰动图邻接矩阵，即：
$t_{i}(\mathbf{A})=\mathbf{M}_{1} \circ \mathbf{A}+\mathbf{M}_{2} \circ(1-\mathbf{A})$
其中 $\mathbf{M}_{1}$ 和 $\mathbf{M}_{2}$ 是边丢弃和插入矩阵。

图扩散（Graph Diffusion, GD）

GD是另一种结构增强，它将节点和它们间接连接的邻居（k-hop邻居）连接起来，从而将全局拓扑信息注入到给定的图中，其中每个hop的邻居都有相应的权重：
$t_{i}(\mathbf{A})=\sum_{k=0}^{\infty} \Theta_{k} \mathbf{T}^{k}$
其中 $\Theta$ 表示权重， $\mathbf{T}$ 表示转移矩阵。

论文中有更加详细的说明。

混合增强

混合增强顾名思义就是同时包含属性增强和混合增强，即：
$\tilde{\mathcal{G}}^{(i)}=\left(\tilde{\mathbf{A}}^{(i)}, \tilde{\mathbf{X}}^{(i)}\right)=\left(t_{i}(\mathbf{A}, \mathbf{X})\right)$
Subgraph sampling (SS) 是一个混合增强的典型例子，它采样部分节点及其对应的联系作为图实例（获取到子图）：
$t_{i}(\mathbf{A}, \mathbf{X})=[(\mathbf{A}, \mathbf{X})]_{\mathcal{V}^{\prime} \in \mathcal{V}},$
常用的采样策略包括：

uniform sampling
random walk-based sampling
top-k importance-based sampling

图对比学习

对比学习旨在最大化语义信息相似的实例之间的MI，图对比学习方法可以分为两类：same-scale和cross-scale。

同尺度对比学习

same-scale对比学习可以进一步划分为graph-level、node-level。

node-level same-scale contrast

早期工作的idea基础：具有相似上下文信息的节点应共享相似表示。
$\theta^{*}=\underset{\theta}{\arg \min } \frac{1}{|\mathcal{V}|} \sum_{v_{i} \in \mathcal{V}} \mathcal{L}_{c o n}\left(p\left(\left[f_{\theta}(\mathbf{A}, \mathbf{X})\right]_{v_{i}},\left[f_{\theta}(\mathbf{A}, \mathbf{X})\right]_{v_{c}}\right)\right)$
其中 $v_c$ 表示节点 $v_i$ 的上下文节点。

DeepWalk，它通过随机游走（random walk）在无属性图上来获取选定节点的上下文信息（随机游走获取到的节点序列），它最大化同一次随机游走中的其它节点的共现概率来进行学习。（与NLP中的跳词模型Skip-Gram相似）

如今的节点级同尺度对比方法通过各种图像增强来探索更丰富的语义信息，而不仅局限于子图采样。
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \mathcal{L}_{c o n}\left(p_{\phi}\left(f_{\theta}\left(\tilde{\mathbf{A}}^{(1)}, \tilde{\mathbf{X}}^{(1)}\right), f_{\theta}\left(\tilde{\mathbf{A}}^{(2)}, \tilde{\mathbf{X}}^{(2)}\right)\right)\right)$
其中 $\tilde{\mathbf{A}}^{(1)}$ 和 $\tilde{\mathbf{A}}^{(2)}$ 是两个增强图邻接矩阵， $\tilde{\mathbf{X}}^{(1)}$ 和 $\tilde{\mathbf{X}}^{(2)}$ 是两个增强的特征矩阵。

这类方法主要处理有属性图，典型工作包括GRACE，它采用两种图增强策略，节点特征掩码和丢弃边，以此生成两个对比视图，然后在两个视图之间拉近相同节点的表示，同时将其余节点表示拉离。

Graph-Level Same-Scale Contrast

图级同尺度对比学习主要是在图级的嵌入表示上进行对比，其数学形式为：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \mathcal{L}_{\operatorname{con}}\left(p_{\phi}\left(\tilde{\mathbf{g}}^{(1)}, \tilde{\mathbf{g}}^{(2)}\right)\right),$
其中 $\tilde{\mathbf{g}}^{(i)}=\mathcal{R}\left(f_{\theta}\left(\tilde{\mathbf{A}}^{(i)}, \tilde{\mathbf{X}}^{(i)}\right)\right)$ 表示增强图 $\tilde{\mathcal{G}}^{(i)}$ 的表征， $\mathcal{R}(\cdot)$ 是Readout函数。

图级同尺度对比学习是通过拉近两个视图的图表示从而学习的，例如GraphGL。

跨尺度对比学习

跨尺度对比学习在不同的图拓扑层级（例如，节点与图）之间进行对比。

该类方法可以进一步划分为patch-global和context-global对比。

Patch-Global Cross-Scale Contrast

节点和图级别对比学习的方法可以统一被形式化为：
$\begin{aligned} &\theta^{*}, \phi^{*}= \underset{\theta, \phi}{\arg \min } \frac{1}{|\mathcal{V}|} \sum_{v_{i} \in \mathcal{V}} \mathcal{L}_{\text {con }}\left(p_{\phi}\left(\left[f_{\theta}(\mathbf{A}, \mathbf{X})\right]_{v_{i}}, \mathcal{R}\left(f_{\theta}(\mathbf{A}, \mathbf{X})\right)\right)\right) \end{aligned}$
其中 $\mathcal{R}$ 表示Readout函数。

DGI是第一个提出将节点级嵌入与图级表示进行对比的方法，其目的是从不同的尺度最大化这两种表示之间的MI，以帮助图编码器学习局部和全局语义信息。

异构图上HDGI，时空图STDGI。

上述类似工作都没有使用图增强技术，带增强的Pach-Global Cross-Scale Contrast可以形式化为：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \frac{1}{|\mathcal{V}|} \sum_{v_{i} \in \mathcal{V}} \mathcal{L}_{\text {con }}\left(p_{\phi}\left(\tilde{\mathbf{h}}_{i}^{(1)}, \tilde{\mathbf{g}}^{(2)}\right)\right)$
其中 $\tilde{\mathbf{h}}_{i}^{(1)}=\left[f_{\theta}\left(\tilde{\mathbf{A}}^{(1)}, \tilde{\mathbf{X}}^{(1)}\right)\right]_{v_{i}}$ 是增强视图1中的节点表示， $\tilde{\mathbf{g}}^{(2)}=\mathcal{R}\left(f_{\theta}\left(\tilde{\mathbf{A}}^{(2)}, \tilde{\mathbf{X}}^{(2)}\right)\right)$ 是增强视图2中的图表示。

MVGRL是首次通过graph diffusion和subgraph sampling生成两个视图，然后通过最大化一个视图中的节点嵌入和另一个视图中的图级表示间的MI来丰富局部和全局监督信息。

Context-Global Cross-Scale Contrast

Context-global cross-scale contrast的形式化定义如下：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \frac{1}{|\mathcal{S}|} \sum_{s \in \mathcal{S}} \mathcal{L}_{\operatorname{con}}\left(p_{\phi}\left(\tilde{\mathbf{h}}_{s}, \tilde{\mathbf{g}}\right)\right)$
其中 $\mathcal{S}$ 表示图 $\tilde{\mathcal{G}}$ 通过图采样得到的一组上下文子图， $\tilde{\mathbf{h}}_{s}$ 表示增强上下文子图 $s$ 的表示， $\tilde{\mathbf{g}}$ 表示通过 $\mathcal{S}$ 中所有子图得到的图级表示。
$\tilde{\mathbf{h}}_{s}=\mathcal{R}\left(\left[f_{\theta}(\tilde{\mathbf{A}}, \tilde{\mathbf{X}})\right]_{v_{i} \in s}\right) \\ \tilde{\mathbf{g}}=\mathcal{R}\left(f_{\theta}(\tilde{\mathbf{A}}, \tilde{\mathbf{X}})\right)$
此外，也有方法在原始图上来获取图级表示，即：
$\tilde{\mathbf{g}}=\mathcal{R}\left(f_{\theta}(\mathbf{A}, \mathbf{X})\right)$
BiGI是二部图（bipartite graph）上的应用于边相关任务的自监督方法，它首先聚合两种类型的节点嵌入来获取图级表示，然后再从原始图中进行采样，计算目标边的局部上下文表示，BiGI通过最大化这种局部上下文和图级表示间的MI进行学习。

互信息估计

MI估计是大多数基于对比学习的方法的核心，MI估计通过拉近与正样本间的距离和拉远与负样本间的距离来分配不同样本在空间中的位置。给定样本对 $x_i, x_j)$ 的表示 $h_i,h_j)$ ，两个样本间的互信息可以形式化为：
$\begin{aligned} \mathcal{M I}\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right) &=K L\left(P\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right)|| P\left(\mathbf{h}_{i}\right) P\left(\mathbf{h}_{j}\right)\right) \\ &=\mathbb{E}_{P\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right)}\left[\log \frac{P\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right)}{P\left(\mathbf{h}_{i}\right) P\left(\mathbf{h}_{j}\right)}\right] \end{aligned}$
其中 $KL(\cdot)$ 表示KL散度，其目标是训练编码器区分样本对是来自联合概率分布还是来自边缘概率分布（负样本）。

KL散度可以衡量同一个随机变量两个分布之间的差异，其值越小，说明分布越接近

MI lower bound estimators

Jensen-Shannon Estimator

Jensen-Shannon散度（JSD）相对于KL散度来说在图对比学习中更常见，JSD对MI提供了一个下界（lower bound）和更有效的估计，基于JSD的对比损失形式为：
$\begin{aligned} &\mathcal{L}_{\text {con }}\left(p_{\phi}\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right)\right)=-\mathcal{M} \mathcal{I}_{J S D}\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right) \\ &=\mathbb{E}_{\mathcal{P} \times \tilde{\mathcal{P}}}\left[\log \left(1-p_{\phi}\left(\mathbf{h}_{i}, \mathbf{h}_{j}^{\prime}\right)\right)\right]-\mathbb{E}_{\mathcal{P}}\left[\log \left(p_{\phi}\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right)\right)\right] \end{aligned}$
上述公式中 $\mathbf{h}_{i}, \mathbf{h}_{j}$ 是从相同的分布 $\mathcal{P}$ 中采样的， $\mathbf{h}_{j}^{\prime}$ 是从不同分布$ \tilde{\mathcal{P}}$中采样的。

对比损失是负MI。

Noise-Contrast Estimator

与 JSD 类似，noise-contrastive estimator也提供了一个MI的下界：
$\begin{aligned} &\mathcal{L}_{\operatorname{con}}\left(p_{\phi}\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right)\right)=-\mathcal{M} \mathcal{I}_{N C E}\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right) \\ &=-\mathbb{E}_{\mathcal{P} \times \widetilde{\mathcal{P}}^{N}}\left[\log \frac{e^{p_{\phi}\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right)}}{e^{p_{\phi}\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right)}+\sum_{n \in N} e^{p_{\phi}\left(\mathbf{h}_{i}, \mathbf{h}_{n}^{\prime}\right)}}\right] \end{aligned}$
其中 $p_{\phi}(\cdot)$ 可以为点积。

有点类似Word2Vec中的带负采样的跳词模型，一对正样本和 $N$ 个负样本对。

Non-bound Estimators

Non-bound指这种类型的估计器不代表MI的下界，最小化这种估计器损失无法保证MI最大化。

Triplet Loss
$\mathcal{L}_{\text {con }}\left(p\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right)\right)=\mathbb{E}_{\mathcal{P} \times \tilde{\mathcal{P}}}\left[\max \left[p_{\phi}\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right)-p_{\phi}\left(\mathbf{h}_{i}, \mathbf{h}_{j}^{\prime}\right)+\epsilon, 0\right]\right] \\ p\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right)=1 / 1+e^{\left(-\mathbf{h}_{i}^{T} \mathbf{h}_{j}\right)}$

BYOL Loss

BYOL loss不依赖于负样本，给定 $\mathbf{h}_{i}, \mathbf{h}_{j} \sim \mathcal{P}$ ，损失函数定义为：
$\mathcal{L}_{\text {con }}\left(p\left(\mathbf{h}_{i}, \mathbf{h}_{j}\right)\right)=\mathbb{E}_{\mathcal{P} \times \mathcal{P}}\left[2-2 \cdot \frac{\left[p_{\psi}\left(\mathbf{h}_{i}\right)\right]^{T} \mathbf{h}_{j}}{\left\|p_{\psi}\left(\mathbf{h}_{i}\right)\right\|\left\|\mathbf{h}_{j}\right\|}\right]$
其中 $p_{\psi}$ 表示Siamese网络中的online predictor。

Barlow Twins Loss

Barlow Twins Loss与BYOL类似，它不依赖于负样本，但是实现起来更简单，给定两种不同视图下的从同一个分布 $\mathcal{P}$ 中采样的batch样本输入 $\mathbf{H}^{(1)}$ 和 $\mathbf{H}^{(2)}$ ，其损失函数定义如下：
$\begin{aligned} \mathcal{L}_{\text {con }}\left(\mathbf{H}^{(1)}, \mathbf{H}^{(2)}\right)=& \mathbb{E}_{\mathcal{B} \sim \mathcal{P}|\mathcal{B}|}\left[\sum_{a}\left(1-\frac{\sum_{i \in \mathcal{B}} \mathbf{H}_{i a}^{(1)} \mathbf{H}_{i a}^{(2)}}{\left\|\mathbf{H}_{i a}^{(1)}\right\|\left\|\mathbf{H}_{i a}^{(2)}\right\|}\right)^{2}\right.\\ &\left.+\lambda \sum_{a} \sum_{b \neq a}\left(\frac{\sum_{i \in \mathcal{B}} \mathbf{H}_{i a}^{(1)} \mathbf{H}_{i b}^{(2)}}{\left\|\mathbf{H}_{i a}^{(1)}\right\|\left\|\mathbf{H}_{i b}^{(2)}\right\|}\right)^{2}\right] \end{aligned}$
其中 $a$ 和 $b$ 表示表示向量的维度索引， $i$ 表示样本索引。

Barlow Twins希望两种增强下的相同维度特征尽可能相似，而不同维度特征尽可能差距较大。

Hybrid Methods

混合方法采用多个前置任务，以更好地利用各种监督信号的优势。混合方法以多任务学习方式将各种前置任务整合在一起，其中目标函数是两个或多个自我监督目标的加权和。混合图SSL的数学形式为：
$\theta^{*}, \phi^{*}=\underset{\theta, \phi}{\arg \min } \sum_{i=1}^{N} \alpha_{i} \mathcal{L}_{s s l_{i}}\left(f_{\theta}, p_{\phi_{i}}, \mathcal{D}_{i}\right),$
其中 $N$ 表示前置任务的数量， $\alpha_{i}, \mathcal{L}_{s s l_{i}}, p_{\phi_{1}},\mathcal{D}_{i}$ 分别表示trade-off weight, loss function, pretext decoder, data distribution of the $i$ -th pretext task.

混合方式：

整合多个基于生成的任务；
将生成式和对比前置学习任务整合到一起；
整合多个基于对比的任务；
整合多个辅助属性任务。

Practical Applications

推荐系统（Recommender Systems）

异常检测（Anomaly Detection）

化学（Chemistry）

Challenges and Future Directions

理论基础（Theoretical Foundation）：图SSL仍然缺乏证明其有效性的理论基础。

可解释性和鲁棒性（Interpretability and Robustness）：图SSL的应用可能是风险敏感和隐私相关的（例如欺诈检测），一个可解释且健壮的SSL框架对于适应此类学习场景具有重要意义。

复杂图上的前置任务（Pretext Tasks for Complex Types of Graphs）：目前的大多数工作集中于属性图的SSL，只有少数工作集中于复杂的图类型，例如异配或时空图。对于复杂图，主要的挑战是如何设计前置任务来捕获这些复杂图的独特数据特征。

图对比学习上的增强（Augmentation for Graph Contrastive Learning）：由于图结构数据的性质（例如，复杂和非欧性），图上的数据数据增强方案没有得到很好的探索。

多个前置任务的学习（Learning with Multiple Pretext T asks）：现有方法中很少有多个前置任务组合的。

更广阔的应用范围（Broader Scope of Applications）：图SSL在广泛的应用中有着广阔的前景，尤其是那些高度依赖领域知识来注释数据的应用。然而，目前大多数实际应用仅集中在几个领域。

未来的研究方向主要是从这些挑战入手。

你可能感兴趣的:(Graph,Learning,学习,人工智能,机器学习)

机器学习：让计算机学会思考的艺术平凡而伟大. 机器学习机器学习人工智能
目录什么是机器学习？机器学习的基本步骤常见的机器学习算法机器学习的实际应用如何入门机器学习？结语在当今数字化时代，机器学习（MachineLearning,ML）已经成为一个炙手可热的话题。从推荐系统到自动驾驶汽车，再到语音助手，机器学习的应用无处不在。然而，对于许多人来说，机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言，带你走进机器学习的世界，了解它的基本原理和应用。什么是机器学习？
机器学习中的 K-均值聚类算法及其优缺点平凡而伟大. 机器学习机器学习算法均值算法
K-均值聚类是一种常用的无监督学习算法，用于将数据集中的样本分成K个簇。其基本原理是将所有样本点划分到K个簇使得簇内样本点之间的距离尽可能接近，而不同簇之间的距离尽可能远。算法流程如下：随机选择K个样本点作为初始的聚类中心。将每个样本点分配到与其最近的聚类中心所在的簇。更新每个簇的聚类中心为该簇所有样本点的平均值。重复第2步和第3步，直到聚类中心不再变化或者达到最大迭代次数。优点：简单且易于实现。
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
pyspark学习rdd处理数据方法——学习记录亭午学习
python黑马程序员"""文件，按JSON字符串存储1.城市按销售额排名2.全部城市有哪些商品类别在售卖3.上海市有哪些商品类别在售卖"""frompysparkimportSparkConf,SparkContextimportosimportjsonos.environ['PYSPARK_PYTHON']=r"D:\anaconda\envs\py10\python.exe"#创建Spark
回归任务中的评价指标MAE，MSE，RMSE，R-Squared 旺旺棒棒冰统计学习方法机器学习回归评价指标 r2 mse
转自博客。仅供自己学习使用，如有侵权，请联系删除分类任务的评价指标有准确率，P值，R值，F1值，而回归任务的评价指标就是MSE，RMSE，MAE、R-SquaredMSE均方误差MSE是真实值与预测值的差值的平方和然后求平均。通过平方的形式便于求导，所以常被用作线性回归的损失函数。MSE=1m∑i=1m(yi−y^i)2MSE=\frac{1}{m}\sum_{i=1}^{m}\left(y_{i
使用AIOps进行更好的事件管理茵赛飞3D CAD数据转换软件 pagerduty devops 人工智能运维
DevOps为科技界带来了更加协作和高效的工作流程。随着AIOps的集成，自动化更进一步，使用人工智能为团队提供更快的根本原因分析和算法降噪。主要从采用AIOps中受益的主要领域之一是事件管理。AIOps可以帮助DevOps团队自动化工作流程，以实现更智能、更高效的事件管理，从而腾出时间让IT运营团队成员专注于创新以改善用户体验。在本文中，我们将了解AIOps如何从检测和识别到响应改进事件管理，以
AI大模型编程能力对比：Deepseek&Claude&Gemini 黑夜路人（heiyeluren） AI人工智能人工智能 ai AIGC 语言模型
在当今快速发展的技术领域，人工智能（AI）模型在编程和数据处理方面的应用越来越广泛。不同的AI模型因其独特的设计理念和技术优势，适用于不同的编程任务和场景。本文将对三种主流的AI模型——DeepSeekv3、GeminiFlash2.0和Claude3.5Sonnet的编程能力进行详细对比，帮助读者根据具体需求选择最合适的工具。同时对DeepSeekv3、GeminiFlash2.0和Claude
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
图像质量评价学习笔记02：IQA模型性能评价指标（PLCC、SROCC、KROCC、RMSE）可靠的豆包蟹同志图像质量评估IQA 图像处理计算机视觉人工智能算法
性能好的图像质量评价（IQA）算法，其质量评测分数会与主观质量分数高度一致，IQA有许多评价指标，为了衡量方法测试结果与主观评价之间的一致性，视频质量专家组VQEG（VideoQualityExpertsGroup，目前国际上对视频质量进行标准化及性能测试的权威组织）提出了四个可以验证客观评价结果和主观评价结果之间的紧密程度的四个指标：PLCC、SROCC、KROCC和RMSE，也是目前最常用的I
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
计算机基础：编码01，无符号数编码水饺编程 MFC学习笔记 Win32学习笔记 mfc c++visual studio windows
专栏导航本节文章分别属于《Win32学习笔记》和《MFC学习笔记》两个专栏，故划分为两个专栏导航。读者可以自行选择前往哪个专栏。（一）WIn32专栏导航上一篇：计算机基础：二进制基础13，十六进制与二进制的相互转换回到目录下一篇：计算机基础：编码02，有符号数编码，原码（二）MFC专栏导航上一篇：计算机基础：二进制基础13，十六进制与二进制的相互转换回到目录下一篇：计算机基础：编码02，有符号数编
机器学习knnlearn1 XW-ABAP 机器学习机器学习人工智能
importmatplotlib.pyplotaspltimportnumpyasnpimportoperator#定义一个函数用于创建数据集defcreateDataSet():#定义特征矩阵，每个元素是一个二维坐标点，代表不同策略数据点的坐标group=np.array([[20,3],[15,5],[18,1],[5,17],[2,15],[3,20]])#定义每个数据点对应的标签，用于区分
基于 MySQL 和 Spring Boot 的在线论坛管理系统设计与实现城南|阿洋-计算机从小白到大神 mysql spring boot 数据库
markdownCopy✌全网粉丝20W+,csdn特邀作者、博客专家、CSDN[新星计划]导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、pyhton、机器学习技术领域和毕业项目实战✌哈喽兄弟们，好久不见哦～最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的，想一想既然放在电脑里面也吃灰，那么还不如分享出去，没准还可以帮助到
TicTacToe Module W_X_99515681 python 开发语言
Homework2Releasev5.016/02/2025CONTENTS1TicTacToe12Contents32.1TicTacToeModule............................................32.2ReinforcementLearningPlayer.....................................62.3Require
先验地图--slam学习笔记超级璐璐人工智能机器学习
先验信息(PriorInformation)先验信息指的是在收集新数据之前已有的知识或假设。这种信息可以来自之前的实验、历史数据、理论模型或专家意见。地图信息：在无人驾驶中，车辆通常会预先加载高精度地图数据，这些地图数据提供了道路布局、车道线位置、交叉口结构等信息。这些信息就是先验信息。车辆动力学模型：车辆的动力学模型，包括车辆的物理特性（如质量、轮胎摩擦系数等），这些模型可以帮助预测车辆的行为。
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
机器学习--DBSCAN聚类算法详解 2201_75491841 机器学习算法聚类人工智能
目录引言1.什么是DBSCAN聚类？2.DBSCAN聚类算法的原理3.DBSCAN算法的核心概念3.1邻域（Neighborhood）3.2核心点（CorePoint）3.3直接密度可达（DirectlyDensity-Reachable）3.4密度可达（Density-Reachable）3.5密度相连（Density-Connected）4.DBSCAN算法的步骤5.DBSCAN算法的优缺点5
46-886 Machine Learning Fundamentals W_X_99515681 机器学习人工智能
46-886MachineLearningFundamentalsHW1Homework1Due:Sunday,March23,11:59pm•UploadyourassignmenttoCanvas(onlyonepersonperteamneedstosubmit)•Includeawriteupcontainingyouranswerstothequestionsbelow(andyourt
【机器学习】机器学习工程实战-第3章数据收集和准备腊肉芥末果机器学习工程实战机器学习人工智能
上一章：第2章项目开始前文章目录3.1关于数据的问题3.1.1数据是否可获得3.1.2数据是否相当大3.1.3数据是否可用3.1.4数据是否可理解3.1.5数据是否可靠3.2数据的常见问题3.2.1高成本3.2.2质量差3.2.3噪声（noise）3.2.4偏差（bias）3.2.5预测能力低（lowpredictivepower）3.2.6过时的样本3.2.7离群值3.2.8数据泄露/目标泄漏3
机器学习实战第一章机器学习基础 LuoY、 Machine Learning 机器学习算法人工智能
第一章机器学习1.1何谓机器学习1.2关键术语1.3机器学习的主要任务1.4如何选择合适的算法1.5开发机器学习应用程序的步骤1.6Python语言的优势1.1何谓机器学习 1、简单地说，机器学习就是把无序的数据转换成有用的信息； 2、机器学习能让我们自数据集中受启发，我们会利用计算机来彰显数据背后的真实含义； 3、机器学习横跨计算机科学、工程技术和统计学等多个学科，需要多学科的
数据挖掘实战-基于机器学习的垃圾邮件检测模型艾派森数据挖掘实战合集数据挖掘机器学习人工智能 python
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
集成学习（随机森林） herry57 数学建模大数据随机森林集成学习
目录一、集成学习概念二、Bagging集成原理三、随机森林四、例子（商品分类）一、集成学习概念集成学习通过建⽴⼏个模型来解决单⼀预测问题。它的⼯作原理是⽣成多个分类器/模型，各⾃独⽴地学习和作出预测。这些预测最后结合成组合预测，因此优于任何⼀个单分类的做出预测。只要单分类器的表现不太差，集成学习的结果总是要好于单分类器的二、Bagging集成原理分类圆形和长方形三、随机森林在机器学习中，随机森林是
【机器学习】朴素贝叶斯入门：从零到垃圾邮件过滤实战吴师兄大模型 0基础实现机器学习入门到精通机器学习人工智能朴素贝叶斯深度学习 pytorch sklearn 开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【机器学习】机器学习工程实战-第2章项目开始前腊肉芥末果机器学习工程实战机器学习人工智能
上一章：第1章概述文章目录2.1机器学习项目的优先级排序2.1.1机器学习的影响2.1.2机器学习的成本2.2估计机器学习项目的复杂度2.2.1未知因素2.2.2简化问题2.2.3非线性进展2.3确定机器学习项目的目标2.3.1模型能做什么2.3.2成功模型的属性2.4构建机器学习团队2.4.1两种文化2.4.2机器学习团队的成员2.5机器学习项目为何失败2.5.1缺乏有经验的人才2.5.2缺乏领
Xilinx系ZYNQ学习笔记（二）ZYNQ入门及点亮LED灯贾saisai FPGA学习学习笔记 fpga开发
系列文章目录文章目录系列文章目录前言简单介绍简称xc7z020型号FPGAZYNQ实操通用IO点亮LED灯硬件逻辑基础前言简单入门一下ZYNQ是何种架构，如何编程，至于深入了解应该要分开深入学习Linux和FPGA简单介绍其基本架构都是在同一个硅片上集成FPGA和CPU，并通过高速、高带宽的互联架构连接起来。ARM的顺序控制、丰富外设，开源驱动、FPGA的并行运算、高速接口、灵活定制、数字之王的特
ZYNQ学习笔记_GPIO之输入输出凌星星星星星 ZYNQ学习笔记 gpio mio fpga 嵌入式单片机
ZYNQ学习笔记_GPIO之输入输出GPIO介绍MIO介绍EMIO介绍控制GPIO接口的寄存器原理_输入输出部分GPIO介绍GPIO的英文全称为General-purposeinput/output，即一种通用外设，可以通过MIO（MultiuseI/O）模块对器件的引脚做观测（input）和控制（output）。ZYNQ的PS端上的GPIO也可以通过EMIO（ExtraMIO）模块对PL端的IP
《基于自适应正负样本对比学习的特征提取框架》-核心公式提炼简洁版 2022年neural networks 阳光明媚大男孩学习深度学习人工智能论文笔记
论文源地址以下是从文档中提取的关于“基于对比学习的特征提取框架（CL-FEFA）”中正负样本对比学习实现的技术细节，包括详细的数学公式、特征提取过程以及特征表示方式的说明。1.正负样本的定义与构造在CL-FEFA框架中，正负样本的定义是动态且自适应的，基于特征提取的结果，而不是预先固定的。这种自适应性是CL-FEFA区别于传统对比学习（如SimCLR、SupCon）的一个关键点。定义方式：指示矩阵
zynq设计学习笔记2——GPIO之MIO控制LED实验墨漓_lyl FPGA之zynq设计学习笔记嵌入式 fpga
vivado软件操作步骤与学习笔记1——helloworld差不多，这里不再过多赘述，不同点是在zynq的设置中添加上GPIO的设置即可。进入SDK软件后，程序如下：#include"stdio.h"#include"xparameters.h"#include"xgpiops.h"#include"sleep.h"#defineGPIO_DEVICE_IDXPAR_XGPIOPS_0_DEVIC
蓝桥杯备赛计划 laitywgx 蓝桥杯职场和发展
1-2小时的蓝桥杯PythonB组冲刺日程表（持续1个月，聚焦高频考点）：第一周：核心算法突破Day1（周一）学习重点：动态规划（01背包问题）学习资源：AcWing《蓝桥杯辅导课》第8讲（背包问题模板）代码模板速记：#一维01背包模板n,V=map(int,input().split())dp=[0]*(V+1)for_inrange(n):w,v=map(int,input().split()
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D