努力学习滴兔兔

【论文解读】Learning on Graphs with Out-of-Distribution Nodes——KDD2022

论文地址：Learning on Graphs with Out-of-Distribution Nodes | Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining

代码：GitHub - SongYYYY/KDD22-OODGAT: This is the implementation of OODGAT from KDD'22: Learning on Graphs with Out-of-Distribution Nodes.

摘要

1. INTRODUCTION

2. RELATED WORK

2.1 Graph Neural Network

2.2 Outlier Detection

2.3 Semi-supervised Learning With Distribution Mismatch

3 LEARNING ON GRAPHS WITH OUT-OF-DISTRIBUTION NODES

3.1 Problem Formulation

3.2 Semi-supervised Outlier Detection

3.3 Semi-supervised Node Classification

4 OODGAT: END-TO-END MODEL FOR SSOD AND SSNC

4.1 Attention Mechanism: From Node to Edge

4.2 Regularizer

5 EXPERIMENTS

5.1 Experimental Setup

5.2 Main Results

5.3 Ablation Study

6 CONCLUSION

摘要

图形神经网络（GNN）是在Graph类型的数据上执行预测任务的最新模型。虽然现有的GNN在与图相关的各种任务上表现出了出色的性能，但很少关注在训练和测试期间图中存在分布外（OOD）节点的场景。借用CV和NLP的概念，本文将OOD节点定义为具有训练集中看不到的标签的节点。由于许多网络都是由程序自动构建的，因此真实世界的图形通常含有噪声，并且可能包含未知分布的节点。在这项工作中，定义了具有分布外节点的图学习问题。目标：1）检测不属于已知分布的节点，2）将其余节点分类为已知类之一。本文证明了图中的连接模式对于异常值检测是有用的，并提出了一种新的GNN模型，即分布外图注意网络（OODGAT），它显式地模拟了不同类型节点之间的交互，并在特征传播过程中将分布内的点与分布外的点分离。大量实验表明，OODGAT在很大程度上优于现有的异常值检测方法，同时在分布内分类方面更好或可比。

1. INTRODUCTION

图形神经网络（GNN）已成为在图上执行预测任务的重要工具。在各种应用中，GNN最重要的任务之一是半监督节点分类（SSNC）。在SSNC中，GNN聚合来自相邻节点的信息，并生成在邻域内平滑的表示，从而减轻了分类的难度。

近年来，许多研究已经开始考虑现实环境中的图学习任务，例如带有标签噪声的图、低标签率和分布偏移。然而，很少有工作考虑在执行SSNC的图中存在分布外（OOD）节点的场景。通过使用术语“OOD”，借用了CV和NLP的概念，这意味着样本的标签在训练集中是看不到的。在图中，这种问题很常见，因为图通常是以增量方式构建的，其中由于与现有节点的连接而添加了新节点，在大多数情况下，无法保证所有节点都必须连接到来自同一分布的其他节点。例如，我们希望将论文网络中的论文分类为AI相关主题，例如，深度学习、强化学习和优化方法。论文网络是通过网络爬虫获得的，该爬虫采用广度优先搜索（BFS）策略，并在多次迭代中不断探索引用现有论文的论文。当搜索停止时，网络中不能保证只包含已知类别的节点，因为科学论文经常会引用其他研究领域的文章，例如，人工智能论文可能引用神经科学和数学方面的论文。在现实世界的网络中，来自不相关类别的节点的比例甚至可能高于来自感兴趣类别的节点。给定这样一个有噪声的图，我们的任务是预测与某个已知类对应的节点的标签，并识别不属于其中任何一个类的节点。

在CV和NLP中，OOD检测一直是一个历史悠久的热门研究领域。[9] 证明了神经网络倾向于为分布内（ID）样本分配比分布外（OOD）样本更高的最大softmax值，并建议使用神经网络产生的最大softmax值（MSP）作为OOD检测的分数。其他方法试图通过修改模型结构[30，34]、采用特定的不确定性度量[14]或利用标记的异常值[10]来提高检测性能。

与上述仅关注于在推理时识别OOD样本的方法不同，图中OOD节点的存在使任务更具挑战性。首先，在CV和NLP的传统设置中，离群值只出现在测试集中，而在图中，通常给定整张图进行训练，将问题从检测未知未知转移到已知未知。如何利用异常值的可用性是成功的关键。其次，CV和NLP中的分类器通常是以完全监督的方式训练的，具有丰富的标记数据，而对于图，最常见的节点分类方法是以半监督的方式用有限的标记数据训练GNN。由于GNN采用的消息传递框架，ID和OOD节点的潜在特征可能会相互影响。因此，研究分布内和分布外的点之间的信息流如何影响分布内分类和分布外检测的性能是非常重要的。[21]中也出现了类似的问题，作者研究了当标记和未标记数据来自不同分布时，半监督学习（SSL）方法的性能。然而，在基于图的SSNC领域，这一问题尚未探索。第三，由于我们的目的是在一个联合框架中解决节点分类和分布外节点检测，一个自然的问题是如何将这两个任务组合成一个统一的模型，以及如何平衡一个任务对另一个任务的影响。

在这项工作中，首先分析了OOD节点对GNN图学习任务的影响。证明对于同态性高的图，由于特征传播导致的平滑效应，基于消息传播的GNN天生就擅长检测异常值。此外，本文发现移除ID和OOD节点之间的边，同时保留每个簇内的内部边，可以获得最佳的整体性能。基于这些发现，本文提出了一种新的GNN模型——分布图外注意力网络（OODGAT），该模型利用了注意力机制，并显式地建模了ID和OOD节点之间的交互作用。实验表明，OODGAT在检测和分类方面都优于所有基线，甚至超过了直接在测试集上调整的事后检测器。

本文说是第一个用OOD节点正式定义图学习问题的人（但2020年的OpenWGL已经提出了类似的问题）。[36]考虑了类似的设置，其中图形也包含OOD节点。他们开发了一个贝叶斯框架，通过计算多个不确定性度量来检测异常值。我们的工作不同之处在于，我们从网络几何的角度分析GNN的基本优势，并利用图结构中包含的信息以高效优雅的方式解决问题。

本文的主要贡献：

形式化定义了含有OOD节点的图学习问题，并明确了问题的挑战。
从图形结构的角度分析了这个问题，并提出了实现良好性能的基本设计
提出了一种新的GNN模型，称为OODGAT，它明确区分特征传播过程中的ID和OOD节点，并在一个联合框架中解决了节点分类和分布外检测问题
对各种图数据集进行了广泛的实验，以证明该方法的有效性。

2. RELATED WORK

2.1 Graph Neural Network

图形神经网络（GNN）在与图相关的各种应用中表现出了出色的性能。在这项工作中，重点研究了半监督节点分类（SSNC）问题。在SSNC中，GNN聚合来自相邻节点的特征并生成一个潜在空间，其中节点嵌入之间的相似性对应于几何空间中节点之间的连接模式。最常用的GNN包括图卷积网络（GCN）、图注意网络（GAT）和GraphSAGE。

2.2 Outlier Detection

离群点检测，又称OOD检测，已成为各个领域的热门研究领域。根据训练期间OOD数据的可用性，OOD检测器可分为三种类型，即无监督、有监督和半监督方法。

无监督方法。无监督的方法仅利用分内布数据来训练异常值检测器。在各种技术中，最常用的包括ODIN[16]和Mahalanobis距离[14]。这些方法被称为事后检测器，因为它们假设分类网络已经在分布内的数据中进行了训练，并且检测器通过校准其输出概率或利用其潜在空间建立在预训练的分类器之上。其他方法，如[25，28，30]，除了原始分类网络之外，还需要训练专门为OOD检测设计的附加模型。无监督方法在训练期间不利用大量的未标记数据，并且只能找到次优解，因为它们将分类和异常值检测视为两个独立的任务。

有监督方法。监督方法假设在训练期间可以访问一组OOD样本[8，10，13]。这样的方法使用ID训练数据上的交叉熵损失以端到端的方式训练分类器以最小化分类误差，同时使用标记的OOD数据上的置信惩罚损失以保持低预测置信度。例如，[13]将KL散度项应用于OOD样本，以确保其预测接近均匀分布。有监督检测器通常优于无监督检测器，因为它们能够利用训练OOD数据提供的分布信息。然而，OOD样本要么来自不同但相关的数据集[10]，要么由GAN[18]生成，这限制了其在图领域中的应用，在图领域，人们无法找到替代OOD数据集，也无法轻松生成伪OOD数据。

半监督方法。受半监督学习的启发，最近的OOD检测研究还考虑了在训练期间未标记集合可用的情况[1，34，37]。[37]定义了一个新的任务，称为“半监督OOD检测”，其中给了一组有限的标记分布内样本和一组较大的分布内和分布外样本的混合集，其标签在训练期间无法得知。他们使用对比学习来获得未标记样本的潜在表示，并计算其与分布内数据中心的距离作为OOD分数。[1] 采用类似的设置，但解决了集成的问题。这些方法的缺点包括：1）它们不是为图设计的，因此不能利用结构信息；2）它们通常需要训练额外的检测模型，并且不能在同一框架中处理分类和检测。

2.3 Semi-supervised Learning With Distribution Mismatch

SSL假定只能访问一小组标记数据和一大组没有标记信息的样本。Oliver等人[21]指出，当标记数据和未标记数据之间存在类分布不匹配时，现有的SSL方法往往会降低原始分类性能。在他们的发现之后，研究人员开发了对OOD样本具有鲁棒性的SSL方法，其性能至少与完全监督的学习一样好[6，12，35]。这种方法的关键思想很简单：它们试图检测和删除未标记数据的OOD部分，并仅在剩余的已纯化集上应用SSL技术。这种设置与我们的设置相似，因为他们也将问题视为两个任务，即对分布数据的半监督学习和对未标记集的异常值检测，其中每个任务都对另一个任务有影响。然而，这些方法通过将正则化项添加到原始分类损失（例如，交叉熵）来执行SSL，如VAT[20]和最小熵正则化[5]，而在图域中，SSNC通常使用GNN来完成，GNN以隐式方式实现半监督学习。

3 LEARNING ON GRAPHS WITH OUT-OF-DISTRIBUTION NODES

3.1 Problem Formulation

图，其中表示节点集，表示边集，邻接矩阵 $A\in \{0, 1\}^{|N|\times |N|$ 。每个节点在图中与特征向量和标签相对应，总体特征矩阵和类向量可以分别用和表示。在SSNC中，节点集可以进一步划分为 $V=V_l\cup V_u$ ，其中指在训练期间标签可访问的节点集。类似地，特征矩阵和类向量可以分为，。SSNC的目标是，使用训练集, 未标记的特征和图结构，预测中节点的标签。不同于传统的封闭世界SSNC，后者假设中的节点和从相同的分布中采样，本文将问题推广到更现实的设置中，其中中的节点可能来自不同于中节点的分布。由于标记数据和未标记数据之间的分布偏移，类向量可能包含中看不到的标签, 标签空间被放大了 $y=y_l\cup y_u$ 。本文中，标签在中的节点为ID节点或正常值，标签在 $y_u \backslash y_l$ 中的为OOD节点或异常值，并且称这种设定为含OOD节点的图学习，其目标为：1）将标签 $B=\{0,1\}$ 分配给中的节点，其中0表示ID，1表示OOD，2）对于ID的节点，进一步将它们分类为中的某一类。需要注意的是，对于这两个任务，在训练期间都会看到整个图，这导致了一个半监督和直推式的设置。为了简单起见，在本文的剩余部分，这两个任务分别被称为半监督异常节点检测（SSOD）和半监督节点分类（SSNC）。

3.2 Semi-supervised Outlier Detection

我们是否可以利用未标记的数据和图结构，用于更好的OOD检测？

为了回答这个问题，本文首先简要回顾图上最常见的任务，即SSNC。在SSNC中，GNN用于在相邻节点之间传播信息，并产生潜在空间，其中特征相对于图结构平滑分布[15]。平滑度是可用的，因为广泛采用的同质假设，即连接的节点倾向于共享相同的标签[22]。本文认为，像SSNC一样，节点之间的连接模式也可以提供区分ID和OOD的信息。首先给出以下命题：

命题。给定图，原始标签集 $Y=Y_l \cup Y_u$ , 以及标识标签集合 $B=\{0,1\}$ 。假设：（1）存在映射 $f: y\mapsto B$ ，其将中的每个标签映射为ID或OOD；（2）相对于是同质的，即中的边倾向于连接中具有相同标签的节点。因此，相对于是同质的。

根据该命题，本文提出了以下假设：GNN天生适合SSOD，因为它们天生就配备了一个正则化器，该正则化器将预测的OOD分数推到紧密连接的社区内，这有助于具有高同质性的图。在图2中，左图显示了在不考虑图形结构的情况下获得的OOD分数。总体而言，OOD节点的得分高于ID节点，但由于现代神经网络的弱点，每个社区都有例外[8]。通过根据图结构平滑特征（图2b），GNN设法从其邻居恢复节点的真实分数（绿色箭头）。然而，我们也注意到连接不同类型节点的边，会导致不期望的特征聚集，并会影响内点和外点之间的分离（红色箭头）。由于类内边的数量显著超过了类间边（对于具有高同质性的图），因此整体性能应该比完全不使用结构信息要好。

为了验证该假设，使用多层感知器（MLP）和GCN作为预测因子，在Cora上进行了一项实验，并将预测的类别分布的熵计算为OOD得分。熵越高，模型越可能认为节点是OOD。两种方法的ROC曲线如图3a所示，从图中我们可以看出GCN检测器在很大程度上优于MLP检测器，这验证了图结构对于检测异常值是有用的。为了更好地理解不同类型连接的影响，测试了具有不同边子集的图的检测性能，结果如图3b所示。正如预期的那样，从图中删除类间边缘可以提高检测性能（绿线与橙线）。然而，当进一步移除ID（红线）或OOD（紫线）内部的边时，性能会急剧下降，这表明相同类型节点内的平滑度对于成功检测至关重要。

3.3 Semi-supervised Node Classification

标记和未标记数据之间的分布不匹配会影响半监督学习的性能[21]。在基于图的SSNC中，未标记的节点通过其与标记的节点的连接将其影响传递给模型参数，因此，当图中包含连接分布内和分布外点的边时，很自然会出现[21]中观察到的相同性能下降。一方面，ID和OOD数据之间的信息交换可能会向感兴趣的分布引入噪声，使模型易于过度拟合并导致较差的泛化；另一方面，添加互连可以增强图形的连接性，并有助于监控信号在节点之间的传播。此外，分布内和分布外节点之间的连接模式可以提供关于如何对ID节点进行分类的知识。因此，很难判断类间连接对SSNC是否有益。为了找出相互连接的影响，本文使用GCN作为分类器在一些常用的图数据集上进行了实验，如表1，分别在三种情况下测试了分类精度：保留所有类间边（移除=0）、随机丢弃其中一半（移除=0.5）和全部移除（移除=1.0）。

4 OODGAT: END-TO-END MODEL FOR SSOD AND SSNC

4.1 Attention Mechanism: From Node to Edge

带注意的图卷积的一般形式：

其中， $\alpha_{ij}$ 是从到聚集信息的注意力权重。不同图注意力网络之间的差异在于注意力值的计算方式。例如，GAT[29]建议通过 $e_{ij}=LeakyReLU(a^T[Wh_i||Wh_j])$ 计算和之间的（未标准化的）注意力权重，其中他们使用由参数化的单层神经网络来输出注意力权重。然而，以前的方法都没有考虑OOD节点，并且从它们的方法中获得的注意力系数不能保证包含关于如何区分分布内和分布外值的知识。

在OODGAT中，显式地对分布内和分布外之间的交互进行建模。基于第3节中的讨论，总结了注意力机制应该具有的三个属性：1）允许消息在分布内节点内部传递，2）允许消息在分布外节点内传递，3）阻止分布内和分布外节点之间的信息流。因此，提出以下注意力形式：

其中，和分别是和的注意力得分。如果考虑作为一个为分布内和分布外值分配不同权重的二元分类器，可以发现方程（2）满足上面讨论的所有属性。在图4中对此进行了说明，不失一般性，当和 $w_{c'}$ 都很大时，可以说 $w_v= w_{c'} = 1$ ，当和都很小时，可以说 $w_u=w_{c'}=0$ ，类内边的注意力权重变为 $e_{cu} = e_{c'v} = 1$ ，而类间边的权重变为 $e_{cv} = e_{c'u} = 0$ 。还注意到，对于任何节点, 它自身的注意力固定为 $e_{ii}= 1$ ，即所有节点对可能的最大值。获取后 $e_{ij}$ , 使用softmax在每个邻域中对它们进行归一化，以在聚合前后保持嵌入比例不变：

二进制分类器可以以各种形式定义。为了避免过多的参数和复杂的模型，本文简单地将其实现为逻辑回归分类器，该分类器由 $a\in \mathbb{R} ^{d'}$ 在GNN层的潜在空间上参数化，比如， $w(v)=\sigma(a^TWh_v)$ ，其中 $W\in \mathbb{R} ^ {d'\times d}$ 是GNN层的权重矩阵， $h_v\in\mathbb{R}^d$ 是该层的输入，并且是sigmoid函数。分类器的目标是找到潜在空间的一个分割，使得分布内和分布外的节点之间能很好地分离。为了增强模型的表现力，本文将注意力计算扩展到多头变体，类似于[29]：

其中，是注意力头部的数量，表示串联。在预测层中，将拼接替换为平均，以保持分类的维度合理：

其中是的预测类分布, $\sum_{k=1}^{|y_l|}z_{ik}=1$ 。

4.2 Regularizer

OODGAT的架构如图5所示

一致性正则化。OODGAT集成了一个二进制分类器来度量图中节点的OOD分数，并将节点级别的分数转换为边级别的注意力权重，用于特征聚合。除了分类器预测的分数，还可以获得模型最后一层节点的输出分布，从而可以计算熵作为另一种OOD度量。将分类器预测的分数表示为, 熵给出的分数为，一致性损失：

其中表示由分类器预测的OOD得分的向量：

表示由熵给出的OOD得分的向量：

其中， $\mu_e$ 和 $\sigma _e$ 表示 $\{e_i\}_{i=1}^{|V|}$ 的平均值和标准偏差，是由OODGAT的最后一层给出的预测类分布的熵。

在等式（6）中，使用余弦相似性来约束和之间的差异，即，两种方法应在所有节点上给出相似的预测。一致性正则化器背后的直觉是注意机制和模型最终输出之间的因果关系。也就是说，当分类器给出的分数改变时，用于聚集特征的注意力权重也会改变，这反过来影响模型的最终输出。如果我们将分类器的变化视为原因，那么模型输出的变化可以视为影响。通过对齐因果关系，模型的假设空间被缩小，梯度下降更有可能找到更接近地面真相的解决方案。想象一个极端的情况，分类器完美地工作，并产生接近真实的OOD分数。在这种情况下，边缘的注意力权重也变得接近完美，并且该模型在检测异常值方面变得非常强大，因为它平滑了所有ID和OOD的表示，并防止了ID与OOD之间的信息交换。因此，根据熵计算的OOD分数也接近现实，使得w和e之间的角度很小。从另一个角度来看，我们可以将一致性损失解释为一种监督学习：熵为分类器提供监督，反之亦然。随着训练的进行，分类器不仅从最终输出中学习，还通过在潜在空间中更好地区分ID和OOD来教导模型产生更可靠的预测。因此，这两个模块进行了一场追逐游戏，并相互受益。对于具有两层的OODGAT，计算两层的一致性损失，并且在每一层中，对所有头部的得分向量w进行平均：

熵正则化器。在OODGAT中，使用熵作为预测不确定性的度量。随着训练的进行，交叉熵损失将标记节点的熵推到最低水平。由于神经网络的泛化能力，训练集之外的节点也可能产生低熵预测，特别是那些属性与标记的属性相似或紧密相关的预测，从而在图中产生一些低熵区域。与分类损失相比，希望保持异常值的不确定性尽可能高，以抵消交叉熵导致的熵减少效应。然而，在训练过程中无法获得节点的真实身份，因此将二元分类器给出的预测作为伪标签，并使伪OOD节点的输出接近均匀分布，以增强分布内和分布外节点之间的可区分性。熵损失：

其中是均匀分布，是节点的预测类分布 , $\epsilon$ 是用于选择伪OOD节点的阈值， $\delta$ 指克罗内克函数。

差异正则化器。对于具有两个图卷积层的OODGAT，通过最小化以下差异损失来进一步约束两个层计算的OOD分数之间的差异：

最终优化目标。总体而言，OODGAT的最佳参数是通过最小化以下损失获得的：

其中， $\beta$ , $\gamma$ 和 $\zeta$ 是正则化器的平衡参数， $a^{b\times t}$ 是用于随着训练的进行逐渐衰减正则化器的权重，以控制ID分类和OOD检测之间的平衡点。是介于0和1之间的数字，是一个小数字，是迭代步数。在实验中，设置和分别为0.9和0.01。通过将三个正则化器与交叉熵相结合，OODGAT不仅学会了在分布节点中进行分类，还学会了在潜在空间中将分布内与分布外节点分开，如图6所示。

5 EXPERIMENTS

5.1 Experimental Setup

评估指标。在具有OOD节点的图学习设定中，目标是同时完成两项任务，即1）节点分类和2）异常值检测。对于第一个任务，本文采用分类精度作为评估度量；对于第二项任务，计算了OOD检测文献中常见的两个指标，即ROC曲线下面积（AUROC）和真阳性率达到95%时的假阳性率(FPR@95)。为了全面评估这两个任务的性能，将它们一起视为N+1个类的多类分类问题，即N个ID类和一个OOD类，称这种任务为联合分类，性能可以通过加权F1评估。

数据集。在六个常用的图形数据集上测试OODGAT，即Cora、AmazonComputers、AmazonPhoto、CoauthorCS、LastFMAsia和Wiki CS。对于每个数据集，将所有类划分为ID和OOD，这样ID部分包含节点大小相对平衡的类，ID类的数量至少为三个，以避免过于容易的分类。与传统的SSNC类似，本文为每个ID类随机选择20个节点作为训练集，构建了一个小的验证集，包含来自每个ID类的10个节点，以及从OOD类中随机抽取的相同数量的异常值。

方法。本文以下方法进行了比较：

端到端的方法，它们在同一框架中完成SSOD和SSNC。具体而言，选择MLP、GCN、GraphSAGE、GAT和GATv2作为端到端基线。对于所有方法，我们使用预测分布的熵作为OOD得分。
事后OOD检测器，需要在预训练分类器的基础上训练额外的离群值检测器。使用ODIN、Mahalanobis距离和CaGCN作为事后检测器。ODIN使用温度缩放和输入预处理来校准输出分布，而Mahalanobis距离利用预训练分类器的潜在空间来计算测试样本和已知类之间的距离。对于每种方法，使用原始论文中描述的度量进行OOD检测，即[16]的MSP和[14]的Mahalanobis距离。CaGCN是最近发表的一种校准GNN输出置信度的方法，可以使用校准的置信度作为异常值检测的分数。
GKDE，一种专门设计用于检测图上异常值的方法，提出了一个多源不确定性框架，该框架使用了来自深度学习和信念理论的各种类型的预测不确定性，并表明真空度是OOD检测的最佳度量。
OODGAT，本文提出的方法。它有两个版本：OODGAT-ENT，它使用预测分布的熵作为异常值的度量；OODGATATT，它使用二进制分类器给出的分数。

5.2 Main Results

与端到端方法的比较。首先将我们的方法与端到端方法进行比较。结果列于表2中：

1）在所有数据集上，GNN在SSOD和SSNC中都大大优于MLP，这表明图结构对两项任务都有帮助。

2）GraphSAGE在6个数据集中的5个数据集上的AUROC超过GCN，这可归因于在特征传播期间分离自身和相邻表示的策略。

3）在所有基线模型和数据集中，GAT和/或GATv2在异常值检测中实现了最佳性能。结果表明，即使是朴素的注意机制也有助于区分不同分布的节点

4）对于SSOD，OODGAT在六个数据集上以相当大的优势优于所有基线。在AmazonPhoto和CoauthorCS等简单的数据集上，OODGAT的AUROC超过0.98，而对于LastFMAsia和Wiki CS等困难的任务，OODGAT大大提高了检测能力并取得了不错的性能，证明了所提出的传播策略的有效性。

5）对于SSNC，OODGAT比其他方法获得更好或类似的结果。例如，在AmazonComputers和LastFMAsia上，OODGAT的分类准确度比GAT和/或GATv2高3%和1%。结果表明，通过去除OOD数据带来的干扰，分类器更有可能收敛到具有更好泛化能力的点。

6）从联合分类的角度来看，OODGAT始终优于所有竞争对手，使其成为使用OOD节点进行图形学习的最强大的方法。

与事后OOD检测器的比较。还将OODGAT与ODIN、Mahalanobis距离和CaGCN进行了比较。这种比较是不公平的，因为这些方法要么需要额外的数据预处理，要么涉及多个训练阶段，而OODGAT在不引入额外复杂性的情况下完成任务。对于除OODGAT之外的所有实验，预处理GAT作为基础分类器，并使用不同的后处理检测器进行OOD检测。与原始论文不同，本文直接在测试集上调整检测器，以消除不良超参数配置的可能性。对于OODGAT，不使用测试集进行训练或调整。表3报告了所有方法的检测性能，只有在少数情况下，事后检测器才能提高检测能力（阴影单元格）。除此之外，由于图形数据的特性，如缺乏监督和非连续输入，所有方法都会失去其功能。尽管不公平，OODGAT还是大大优于所有事后检测器，OODGAT的优势来自同时处理特征提取和OOD检测的端到端优化策略，而其他方法使用两阶段更新框架，分别训练分类器和检测器，只能找到次优解。

与GKDE比较。为了确保公平比较，在原始论文中使用的相同数据集上测试了本文的方法，并采用了相同的预处理程序。在表5中报告了OOD检测的AUROC和AUPR，其中GKDE的结果来自原始论文。在所有三个数据集上，OODGAT在AUROC和AUPR方面仍优于GKDE。结果表明，仅仅将现有GNN嵌入到不确定性计算框架中是不够的。相反，更好地利用图表结构中隐含的信息是成功的关键。

5.3 Ablation Study

使用OODGAT-ATT在AmazonComputers上进行了实验，每个损失的权重与表2中的最佳结果相同。在（1）中，仅使用交叉熵损失来训练模型。OOD检测的AUROC约为50%，这与随机猜测相似，表明仅使用交叉熵不足以学习ID和OOD的分类。然后，分别在(2)、(3)和(4)中添加一个正则化项。结果表明，一致性损失可以有效地提高二元分类器的辨别能力，而熵损失和差异损失在没有一致性正则化器的帮助下使用时贡献很小或是负面的。这是符合预期的，因为其他两个损失依赖于通过一致性损失学习的二元分类器的准确预测。比较（2）和（5），发现当熵损失与一致性损失一起使用时，可以进一步提高检测能力。类似地，（2）和（6）之间的比较表明，差异正则化器的添加有助于分布内样本的分类。最佳结果在（7）中获得，其中将所有三个正则化器与交叉熵损失相结合。总之，所有正则化都有助于最终的性能，其中一致性损失起着最重要的作用。

6 CONCLUSION

在本文中，提出并研究了包含OOD节点的图学习问题。证明了GNN天生适合于具有高同质性的图上的异常值检测，并提出了一个端到端模型OODGAT来解决SSOD和SSNC问题。大量实验表明，虽然输入预处理和温度缩放等现有方法不能很好地处理该问题，但OODGAT在分布内节点分类和OOD检测方面始终表现良好。

你可能感兴趣的:(图开集识别,深度学习,人工智能)

深入剖析F5、DNS、LVS、Nginx、Tomcat：Java架构师的流量分发指南（一）呢喃coding 系统架构设计 java lvs nginx
深入剖析F5、DNS、LVS、Nginx、Tomcat：Java架构师的流量分发指南在Java架构设计中，流量分发是保障系统高性能、高可用的关键环节。F5、DNS、LVS、Nginx和Tomcat在流量分发处理中各自扮演着独特的角色，深入理解它们对于Java架构师来说至关重要。一、F5：企业级的应用交付利器（一）功能与特性F5是一款企业级的应用交付网络（ADN）设备，它集负载均衡、应用安全、SSL
Android逆向（Frida思路（第一集）） aaiier android python 开发语言
在FridaAndroid上，如果想先修改某个类的方法1内部调用的方法2，然后再启动方法1，通常用Java.use或Interceptor.attach进行Hook。Java.use()获取类并调用方法choose()查找已创建的实例并调用方法overload()精确调用特定参数的方法Java.cast()转换choose()选中的对象并调用方法implementation会完全替换方法的所有代码
车牌识别相机在停车场的应用电子护照杨健辉智能硬件 ocr
车牌识别相机在停车场的应用已经成为现代智慧停车系统的核心，通过自动化、智能化的管理，显著提升车辆通行效率、降低人工成本并增强安全性。以下是车牌识别相机在停车场的主要应用场景及技术实现：1.无人值守车辆进出管理应用场景自动识别车牌：车辆到达入口/出口时，车牌识别相机自动抓拍车牌并识别号码，道闸自动抬杆放行，无需人工干预。无感支付：识别车牌后自动关联车主账户（如支付宝、微信或ETC），实现自动扣费，车
证件阅读机在金融银行的应用电子护照杨健辉智能硬件人工智能 ocr
证件阅读机（也称为“证件扫描仪”或“OCR阅读器”）在金融银行领域有广泛的应用，主要用于快速、准确地识别和验证客户身份证件（如身份证、护照、驾驶证等），以提高业务办理效率和安全性。主要应用场景开户/办卡：自动读取身份证、护照信息，减少人工录入错误。大额交易/转账：验证客户身份，防止冒用他人证件。贷款/信用卡申请：快速采集客户信息，提高审核效率。反洗钱（AML）：自动比对证件真伪，防范欺诈风险。VI
护照阅读器简介电子护照杨健辉人工智能智能硬件
护照阅读器简介护照阅读器（PassportReader）是一种专用设备，用于快速、准确地读取护照、身份证、签证等旅行证件的机读区（MRZ）和芯片（ePassport）信息，广泛应用于出入境管理、机场安检、酒店登记、金融开户等场景。1.护照阅读器的核心功能（1）OCR识别（光学字符识别）自动识别护照、身份证、签证等证件上的机读区（MRZ）信息，包括姓名、护照号、国籍、出生日期、有效期等。支持多语言（
手机NFC 读护照芯片数据电子护照杨健辉护照阅读器人工智能 ocr
随着全球交流的日益频繁，高效、准确的护照识别技术成为了迫切的需求。国产化厂家推出了具有开创性的移动端护照识别技术，其中最为引人瞩目的便是NFC秒读芯片数据功能。手机NFC读取护照芯片信息传统的护照识别方式往往存在着速度慢、准确率不高、操作繁琐等问题。而中安未来的这项新技术，通过NFC技术实现了对护照芯片数据的秒读。这一突破带来了诸多显著优势。首先，速度上的巨大提升极大地提高了工作效率。无论是在机场
想要了解大模型，看懂这一篇就够了！大模型工作流程及核心参数介绍！ Gq.xxu qwen3 vllm transforms 大语言模型部署深度学习人工智能
若想深入探究大模型核心参数的效果与作用，就务必先弄清大模型的工作流程，明确核心参数在流程各阶段的效能与功能，知晓其具体含义。一，大模型的工作流程大模型运行时的工作原理可以概括为输入处理→特征提取→模型推理→结果生成四个核心阶段，整个过程融合了深度学习架构、自然语言处理技术以及分布式计算能力。从用户输入到大模型输出，整个工作的处理流程如下：输入文本→分词→嵌入+位置编码→Transformer多层处
无人机遥控器数据分享模块解析
一、运行方式1.单向遥控模式指令下发：遥控器操纵信号通过ADC/IO接口输入至处理器，经编码后由无线模块发送至无人机。数据传输：采用DBUS等协议，以串行通信传输18字节帧数据，需反相器处理电平反转问题。2.双向遥测模式状态回传：无人机传感器数据经图数传模块压缩后，通过1.4GHz无线链路发回遥控器，由应用处理器解压并显示。协议支持：采用MAVLink协议实现飞控与安卓地面站深度交互，结合蓝牙传输
自组装mid360便捷化bag包采集设备 hero_heart 命令模式
一、问题一：电脑太重，换nuc采集mid360数据的过程中，发现了头疼的问题，得一手拿着电脑，一手拿着mid360来采集，实在是累胳膊。因此，网购了一个intelnuc,具体型号是12wshi5000华尔街峡谷nuc12i5厚版，买来之后，发现有点坑爹，windows系统下驱动啥都都挺全的，但是ubuntu下驱动貌似不全，1）有线网识别不了（也就是直接把mid360的网口数据线插到nuc上，识别不
深度学习-Tensor
Tensor张量：与numpy中的ndarray不同之处：tensor可以在GPU或其他专用硬件上运行，以加速计算。一、Tensor初始化1.直接从数据中创建data=[[1,2],[3,4]]x_data=torch.tensor(data)2.从numpy数组创建np_array=np.array(data)x_np=torch.from_numpy(np_array)3.从另一个Tensor
【PTA数据结构 | C语言版】输出 1 ~ n 秋说 PTA 数据结构题目集数据结构 c语言算法
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目给定正整数n，输出1~n，每个数字占一行。本题旨在测试不同的算法在各种数据情况下的表现。各组测试数据特点如下：数据0：测试基本正确性；数据1：n=1；数据2：n=1000；数据3：n=10000；数据4：n=100000；数据5：n=1000000。输入格式:输入在一行中给出正整数n(≤10^6)。输出格式:输出1~n，每个数字占一行。输
基于存算一体架构的实时深度学习推理优化瑕疵热点资讯架构深度学习人工智能
博客主页：瑕疵的CSDN主页Gitee主页：瑕疵的gitee主页⏩文章专栏：《热点资讯》基于存算一体架构的实时深度学习推理优化基于存算一体架构的实时深度学习推理优化基于存算一体架构的实时深度学习推理优化引言存算一体架构的核心优势1.能效比突破2.实时性保障架构设计与实现技术1.存储单元创新2.硬件加速器设计3.电路级优化深度学习推理优化策略1.模型压缩技术2.硬件-软件协同优化3.运行时调度典型应
人工智能LLM | 基础配置 | 通过环境变量配置API-KEY 一文通教程 H-大叔人工智能大模型实战与教程人工智能
在实战开发大语言模型的过程中，经常会遇到各种API-KEY的配置问题，例如GPTOpenAIKEY的配置，而且目前大部分都要求将其配置在环境变量中，下面将会讲解如何在Linux、macOS、Windows中配置，本文一文通教程。您可以使用配置环境变量的方法，避免在调用各种SDK时显式地配置API-KEY，从而降低泄漏风险。环境变量是操作系统中用于存储有关系统环境的信息的变量。您可以通过环境变量来配
基于odoo17的设计模式详解---迭代模式花好月圆春祺夏安设计模式
大家好，我是你的Odoo技术伙伴。在Odoo开发中，最常见的操作之一莫过于处理一组数据记录。我们使用search()方法获取一批客户，访问销售订单的所有订单行，或者对选中的多张发票进行批量操作。这背后，都离不开一个基础而又强大的设计模式——迭代器模式（IteratorPattern）。今天，我们将深入探讨这个“润物细无声”的设计模式，看看Odoo是如何将其无缝集成到ORM的记录集（Recordse
2024年最新4大典型安全漏洞是怎么来的？如何解决？，【2024网络安全最新学习路线】 2401_84297193 程序员 web安全学习网络
还有兄弟不知道网络安全面试可以提前刷题吗？费时一周整理的160+网络安全面试题，金九银十，做网络安全面试里的显眼包！王岚嵚工程师面试题（附答案），只能帮兄弟们到这儿了！如果你能答对70%，找一个安全工作，问题不大。对于有1-3年工作经验，想要跳槽的朋友来说，也是很好的温习资料！【完整版领取方式在文末！！】93道网络安全面试题内容实在太多，不一一截图了黑客学习资源推荐最后给大家分享一份全套的网络安全
【人工智能】ChatGPT、DeepSeek-R1、DeepSeek-V3 辨析 G皮T #大语言模型人工智能 LLM 大语言模型 chatgpt deepseek DeepSeek-R1 DeepSeek-V3
ChatGPT、DeepSeek-R1、DeepSeek-V3辨析1.ChatGPT对比DeepSeek1.1技术相似点1.2主要差异1.3关键区别1.4如何选择1.5总结2.DeepSeek-R1对比DeepSeek-V32.1DeepSeek-R12.2DeepSeek-V32.3核心区别总结2.4如何选择3.R1和V3有什么含义3.1DeepSeekR1的"R"3.2DeepSeekV3的"
视频讲解：多层感知机MLP与卷积神经网络CNN在服装图像识别中的应用
原文链接：https://tecdat.cn/?p=42891原文出处：拓端数据部落公众号分析师：ZiqiYe视频讲解：多层感知机MLP与卷积神经网络CNN在服装图像识别中的应用作为数据科学领域的从业者，我们常面临这样的挑战：如何让机器真正“看懂”图像中的信息？在为客户完成服装零售行业的图像识别时，这一问题尤为突出。追溯图像识别技术的发展，早期依赖人工设计特征，如边缘检测、纹理分析等，效率低下且适
在学校研究学习的偏算法，秋招投递开发岗位还有希望吗程序员
前言Thelasttime,Ihavelearned这是星球同学，在周五晚上答疑聊天的时候对我的提问：如果简历上的项目偏算法，但是自学了一些操作系统和计网的知识，秋招的时候投递偏开发的岗位有希望吗？简历上是否也要加上相关项目？估计也是很多朋友的疑问，毕竟很多同学读研，有些老师疯狂push，要成果，发论文。要想尽快发论文，那只能“研究”人工智能、算法的一些东西了。但是众所周知，算法要求很高，不仅要求
python namedtuple转为dict 链池 python 开发语言
python相关学习资料：搭建私人助理大模型需要什么环境？006_指法标准_键盘正位_你好世界_hello_world_单引号_双引号一张图生成指定动作的动态视频,MagicAnimate本地部署Pythonnamedtuple转为dict的方法作为一名经验丰富的开发者，我很高兴能够帮助刚入行的小白们解决编程问题。今天，我们将一起学习如何将Python中的namedtuple转换为dict。这个过
如何在平台中设置不同权限（合成化学师、材料专家、数据工程师）协同工作百态老人 java 开发语言
一、权限管理模型设计：RBAC-ABAC混合架构为实现合成化学师、材料专家和数据工程师的高效协作，需采用基于角色的访问控制（RBAC）结合基于属性的访问控制（ABAC）的混合模型（Ev7-14,Ev36）。该模型兼顾角色职责的清晰划分与动态场景的灵活适配：RBAC基础框架：为三类角色定义核心权限集（Ev13）：合成化学师：实验数据录入、工艺路线修改、报告撰写（Ev1）。材料专家：样品测试分析、工艺
【AI论文】基于图像思维的多模态推理：理论基础、方法及未来前沿东临碣石82 人工智能
摘要：近期，文本思维链（Chain-of-Thought，CoT）显著推动了多模态推理的进展。在这一范式下，模型在语言层面进行推理。然而，这种以文本为中心的方法将视觉信息视为静态的初始语境，从而在丰富的感知数据与离散的符号思维之间造成了根本性的“语义鸿沟”。人类认知往往超越语言的局限，将视觉作为动态的心理草图板加以利用。如今，人工智能领域也正经历着类似的演变，标志着从仅能对图像进行思考的模型向真正
【深度学习新浪潮】什么是上下文长度？小米玄戒Andrew 深度学习新浪潮深度学习人工智能 LLM 语言模型大模型模型优化上下文长度
大型语言模型（LLM）的上下文长度是指模型在处理当前输入时能够有效利用的历史文本长度，通常以token（如单词、子词或标点）为单位衡量。例如，GPT-4支持128Ktoken的上下文，而Llama4Scout甚至达到了10Mtoken的惊人规模。这一指标直接影响模型在长文档理解、多轮对话等复杂任务中的表现。一、上下文长度的合理范围上下文长度的选择需结合具体应用场景：日常对话：通常需要8K–32Kt
Manus AI与多语言手写识别 tonngw 人工智能
技术文章大纲：ManusAI与多语言手写识别引言手写识别技术的发展背景与市场需求ManusAI的定位与核心技术优势多语言场景下的挑战与机遇ManusAI的核心技术架构基于深度学习的端到端手写识别模型多模态数据融合（笔迹压力、书写轨迹等）自适应语言模型与字符集扩展机制多语言手写识别的关键技术非拉丁语系（中文、阿拉伯语等）的笔迹特征提取小样本语言数据的迁移学习策略上下文感知与语法纠错在低资源语言中的应
DeepSeek 帮助自己的工作
引言简述人工智能助手在职场中的普及趋势DeepSeek作为智能创作助手的核心功能概述DeepSeek的核心能力信息检索与整合：基于用户意图精准搜索并生成答案多场景应用：技术文档撰写、数据分析、代码生成等交互优化：遵循用户指定的格式与内容规范职场应用场景与实操案例技术文档撰写自动生成API文档框架根据需求补充技术细节示例代码块与公式的规范化输出数据分析支持快速检索行业数据并生成可视化建议数学建模中的
【DeepSeek实战】17、MCP地图服务集成全景指南：高德、百度、腾讯三大平台接入实战
引言：为什么MCP是地图服务的下一代革命？在数字化时代，位置服务已成为电商、出行、物流等行业的核心基础设施。但单一地图服务商的局限性日益凸显：某外卖平台因高德地图API突发故障导致30分钟订单配送延迟，某打车软件因百度地图路线规划偏差引发用户投诉激增，某物流企业因腾讯地图POI数据不全导致仓库定位错误……这些问题的根源，在于缺乏一套能统一管理多地图服务的智能平台。MCP（地图控制平台）应运而生。它
Python机器学习与深度学习：决策树、随机森林、XGBoost与LightGBM、迁移学习、循环神经网络、长短时记忆网络、时间卷积网络、自编码器、生成对抗网络、YOLO目标检测等 WangYan2022 机器学习/深度学习 Python 机器学习深度学习随机森林迁移学习
融合最新技术动态与实战经验，旨在系统提升以下能力：①掌握ChatGPT、DeepSeek等大语言模型在代码生成、模型调试、实验设计、论文撰写等方面的实际应用技巧②深入理解深度学习与经典机器学习算法的关联与差异，掌握其理论基础③熟练运用PyTorch实现各类深度学习模型，包括迁移学习、循环神经网络（RNN）、长短时记忆网络（LSTM）、时间卷积网络（TCN）、自编码器、生成对抗网络（GAN）、YOL
百度AI工具Comate AI IDE正式发布，一个前端开发者的AI编程工具进化论蜂酷科技资讯人工智能 ide AI编程
6月23日百度AIDAY正式发布ComateAIIDE，对我这个浸淫前端开发五年的老兵而言，这次ComateAIIDE发布对我之后项目开发意义重大。原先我仅将文心快码当成单纯编程智能体使用，提需求，复制代码，然后再去其他工具中完成全栈开发，如今随着ComateAIIDE落地，意味着我拥有了一个集多模态交互、多智能体协同于一体的全流程开发超级搭档。从输入自然语言描述、粘贴Figma设计稿链接，到生成
百度ai智能助手深度体验报告，它如何贯穿我的开发流？蜂酷科技资讯 vim
前段时间电商6.6大促，我接了个硬骨头，重构电商平台的大促活动页，20多个页面，还要同时搞定PC端、手机端和微信小程序。往年这种项目得熬一个月，没想到全程靠文心快码Zulu搭把手，居然提前一周交工了。这篇就实实在在唠唠，这AI助手怎么在我开发时全程在线的。设计图到手，终于不用手动抠像素了以前最怕设计师甩个Figma链接，几百个图层看得眼睛都花，光把按钮阴影、圆角这些细节敲进代码就得耗半天。这次我试
软件项目中的静态缺陷是什么悟能不能悟 java
软件项目中的静态缺陷（StaticDefects）是指在不运行程序代码的情况下，通过分析源代码、配置文件或设计文档发现的代码质量问题或潜在风险。这类缺陷通常通过静态代码分析（StaticCodeAnalysis）工具（如SonarQube、ESLint、Checkstyle等）或人工代码审查识别。核心特点无需运行程序静态分析仅检查代码的结构和语法（例如变量定义、函数调用、控制流程），而不需要编译或
手机通话语音离线ASR识别商用和优化方向 limingade 本地AI电话机器人手机提取电话的信令和声音智能手机 FunASR离线识别 Android做ASR 手机断网离线ASR ASR语音转文字识别语音识别
手机通话语音离线ASR识别商用和优化方向--本地AI电话机器人上一篇：手机FunASR识别SIM卡通话占用内存和运行性能分析下一篇：编写中。一、前言前面的篇章中，我们尝试了将FunASR的ONNX模型文件加载到Android应用中，实现手机本地不依赖服务器和网络的离线ASR语音识别。并将这个ASR能力应用到了手机麦克风、手机本地的历史通话录音、手机实时的SIM卡电话通话内容的解析上。在实践中，我们
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla