vector<>

【论文分享】★★★ 小样本网络异常检测方法 GDN：Few-shot Network Anomaly Detection via Cross-network Meta-learning

题目：Few-shot Network Anomaly Detection via Cross-network Meta-learning

源码：-

时间：2021.02

链接：https://arxiv.org/pdf/2102.11165.pdf

机构：亚利桑那州立大学

会议：WWW（CCF-A）

摘要：本文提出了一种新的图神经网络系列：图偏差网络(GDN)，它可以利用少量标记的异常来加强网络中异常节点和正常节点之间统计上的显著偏差；为所提出的GDN配置一种新的跨网络元学习算法，通过从多个辅助网络传输元知识来实现少镜头网络异常检测。广泛的评估证明了所提出的方法在少量或甚至一次网络异常检测的有效性。

其他：相当重要的一篇文章，和博主的研究方向完全契合，所以这篇论文博主首先用几张ppt做一个简单的总结，随后会做比较详细的翻译工作。

目录

总结

1 介绍

2 相关工作

网络异常检测

图神经网络

3 问题定义

4 方法

4.1 Graph Deviation Networks

1. Network Encoder

2. Abnormality Valuator

3. Deviation Loss

4.2 Cross-network Meta-learning

5 实验

5.1 实验设置

1 数据集

2 对比方法

3 评价标准

4 实现细节

5.2 实验结果

1 全面比较

2 小样本验证

5.3 敏感度和稳健性分析

5.4 消融实验

6 结论

问题

总结

下图很清晰地展示了这篇文章的两个动机以及这篇文章的两个研究点，首先提出一个图偏差网络(GDN)，然后再基于GDN进行跨网络的训练，提出了Meta-GNN模型。

这张图的左侧是本文提出来的新的神经网络，图偏差网络GDN，右侧是对GDN进行跨网络训练得到Meta-GDN。GDN由三个关键部分组成。

GDN的第一个部分：网络编码器

GDN的第二个部分：异常估值器

GDN的第三个部分：偏移损失，优化异常值

vi为异常节点时，yi=1，这个损失函数会使得该异常节点的异常得分与产生至少的较大正偏差。Vi为正常结点时，yi=0，这个损失函数会使得正常节点的异常得分尽可能接近。用一句话概括一下：异常结点的异常分数，应该落在该高斯分布右侧远离均值区域，正常结点的异常值，应该落在高斯分布的均值附近。这就是对异常值的一个优化。

到这一步，我已经讲完了这篇文章的第一个点，也是提出了一个将graph映射为了标量异常分数的神经网络GDN。接下来我要讲的是这篇文章的第二个大的点，也就是跨网络来训练GDN。

上面这张图是本文对Meta-GDN的描述，下面这张图是Meta-GNN（这篇文章博主也写过阅读笔记，可以看这篇：https://blog.csdn.net/qq_39328436/article/details/123679075）的描述。在我看来这两张图简直是一摸一样，总结一句话就是用元学习的策略来训练模型。

所谓的跨网络，其实就是在网络数据集上随机抽取子图，构成元学习的支持集和查询集，进行元训练，这是在19年就有过的想法。我认为可以用，但是不至于专门作为整篇论文的第二个大点。如果后面有新的理解，我会更新此处的描述。

1 介绍

网络结构数据，从社会网络到团队协作网络，从引文网络到分子图，已经被广泛用于建模无数的真实世界的系统。尽管如此，现实世界的网络通常被一小部分节点所污染，即异常，其模式明显偏离绝大多数节点。例如，在一个代表论文间引文关系的引文网络中，有部分科研论文存在与论文内容不符的虚假参考文献(即边)。由于极少的异常情况都可能造成极其不利的影响，网络异常检测问题受到了工业界和学术界的广泛关注。
由于标注异常需要耗费人力并且需要专门的领域知识，现有的方法主要是在无监督的情况下发展起来的。作为一种流行的范式，人们试图通过基于自动编码器模型的重构误差或基于矩阵分解方法的残差来度量节点的异常。然而，由于缺乏对异常的先验知识，他们所识别的异常可能被证明是数据噪声。一个潜在的解决这个问题是利用有限或几个标签异常的先验知识学习anomaly-informed模型,这种方法是相对低成本的，在真实的场景中,少量的标签异常可以从部署检测系统或由用户的反馈。同时，这些有价值的知识通常分散在目标网络同一域内的其他网络中，可以进一步利用这些知识来提取监督信号。例如，LinkedIn和Indeed拥有类似的社交网络，代表着求职领域的用户友谊;在计算机科学领域，ACM和DBLP可以被视为具有相似引文关系的引文网络。根据以往的研究，由于拓扑结构和节点属性的相似性，可以将有价值的知识从源网络转移到目标网络，从而提高目标网络的性能。因此，在本工作中，我们提出研究跨网络设置下的小样本网络异常检测的新问题。

尽管如此，解决这一未得到充分研究的问题仍然不简单，主要原因如下:

(1) 从微观(网络内)的角度来看，由于我们对异常的认识有限，很难精确地描述异常模式。如果我们直接采用现有的半监督或PU学习技术，这些方法往往达不到令人满意的结果，因为它们可能仍然需要相当大比例的异常样本。为了处理如图1(a)所示的这种不完全监督挑战，如何尽可能少地利用标记的异常来学习正常模式的高级抽象是有必要探索的;

(2)从宏观(网络间)的角度来看，虽然同一域的网络在总体上可能具有相似的特征，但不同网络中存在的异常可能来自非常不同的流形。以往关于跨网络学习的研究多集中于单一网络的知识迁移，这可能会导致结果不稳定和负迁移的风险。

由于从多个网络中学习可以提供关于异常特征的更全面的知识，因此非常需要一种能够适应这些知识的跨网络学习算法。

为了解决上述问题，我们首先设计了一种新的GNN架构，即图偏差网络(GDN)，利用有限的标记数据进行网络异常检测。具体来说，给定任意网络，GDN首先使用GNN -backbone异常分数学习器为每个节点分配一个异常分数，然后根据先验概率定义异常分数的均值作为参考分数，指导后续的异常分数学习。通过利用偏离损失，GDN能够在异常得分空间中强制异常节点的异常得分与正常节点的异常得分存在统计学上的显著偏差(如图1(b)所示)。为了进一步将这种能力从多个网络转移到目标网络，我们提出了一种跨网络元学习算法，从多个小样本网络异常检测任务中学习GDN的良好广义初始化。无缝集成的Meta-GDN框架能够提取全面的元知识，用于跨多个网络的异常检测，极大地缓解了单一网络传输的局限性。随后，在标记异常很少甚至只有一个的情况下，通过微调使初始化容易适应目标网络，在很大程度上提高了目标网络上的异常检测性能。综上所述，我们的主要贡献有三方面:

问题：据我们所知，我们是第一个小样本网络异常检测这一新问题的。值得注意的是，我们建议通过跨多个网络传递知识来解决这个问题。
算法：我们提出了Meta-GDN,，它集成了一组新的图神经网络(即GDN)和跨网络元学习，以检测小样本异常。
评估:我们进行了大量的实验来证实我们方法的有效性。实验结果表明，Meta-GNN在网络异常检测方面的性能优于目前最先进的网络异常检测方法。

2 相关工作

网络异常检测

网络异常检测方法针对的是网络结构数据。以往的研究主要是研究平面网络的异常检测问题。由于网络结构是普通网络中唯一可用的信息模态，这类异常检测方法试图利用网络结构信息从不同的角度发现异常。作者在此处提出了以下研究：

DOMINANT ：Deep anomaly detection on attributed networks 用神经网络做编码器和解码器学习嵌入（看上去，多少有点可读性）
Semi-GNN：A Semi-supervised Graph Attentive Network for Financial Fraud Detection.有点不太理解多视点图
GAS：Spam review detection with graph convolutional networks 邮件审查机制
Error-Bounded Graph Anomaly Loss for GNNs

图神经网络

图神经网络在将图的信息转化为低维潜在表示方面取得了突破性的成功。基于光谱的图卷积网络(GCNs)最初受到图谱理论的启发，通过设计不同的图卷积层来证明其有效性。其中，Kipf等人提出的模型（Semi-Supervised Classification with Graph Convolutional Networks）采用线性滤波器，成为最流行的模型。除了基于频谱的图卷积模型外，遵循邻域聚合方案的基于空间的图神经网络也得到了广泛的研究。这些方法不是为每个节点训练单独的嵌入，而是学习一组聚合函数来聚合节点的局部邻域特征。GraphSAGE学习了一个嵌入函数，该函数可以被泛化到不可见的节点，从而能够在网络结构化数据上进行归纳表示学习。类似地，Graph Attention Networks (GATs)提出在聚合节点的邻域信息时，通过引入自注意策略来学习隐表示。此外，图同构网络(GIN)扩展了用神经网络参数化通用多集函数的思想，并被证明具有与Weisfeiler-Lehman (WL)图同构检验同样强大的理论能力。为了超越单一的图，将知识转移到多个图中，近年来，研究人员探索将gnn与元学习技术整合在一起。例如PA-GNN通过元优化将清理后的图的鲁棒性传递给目标图。Meta-NA是一个图对齐模型，它可以跨多个图学习统一的度量空间，可以很容易地将不同图的实体连接起来。然而，这些努力并不能应用于我们的问题，我们是第一个研究小样本跨网络异常检测问题的。

3 问题定义

粗体大写字母表示矩阵
粗体小写字母表示向量
小写字母表示标量
书法字体表示集和
属性网络表示一： $\mathbf{G}=(\vartheta, \mathcal{E}, \mathbf{X})$ ，分别代表结点集和，边集和，属性特征集和。
属性网络表示二： $\mathbf{G}=(\mathbf{A}, \mathbf{X})$ ， $\mathbf{A}=\{0,1\}^{n \times n}$ 为表示网络结构的邻接矩阵。
小样本跨网异常检测目的：通过从辅助网络传输非常有限的ground-truth异常监测知识，最大限度地提高目标网络的检测性能。
目标网络： $\mathrm{G}^{t}$
辅助网络： $\mathcal{G}^{s}=\left\{\mathbf{G}_{1}^{s}, \mathbf{G}_{2}^{s}, \ldots, \mathbf{G}_{P}^{s}\right\}$
辅助网络与目标网络共享相同或者相似的域
有标记的异常结点： $\boldsymbol{V}^{L}$
无标记的异常结点： $\boldsymbol{V}^{U}$
所以节点集和为： $V=\left\{V^{L}, V^{U}\right\}$
本文的小样本场景中： $\left|\mathcal{V}^{L}\right| \ll\left|\mathcal{V}^{U}\right|$

Few-shot Cross-network Anomaly Detection 小样本跨网路异常检测

已知：

辅助网络： $\mathcal{G}^{s}=\left\{\mathrm{G}_{1}^{s}=\left(\mathrm{A}_{1}^{s}, \mathrm{X}_{1}^{s}\right), \mathrm{G}_{2}^{s}=\right.$ $\left.\left(\mathrm{A}_{2}^{s}, \mathrm{X}_{2}^{s}\right), \ldots, \mathrm{G}_{P}^{s}=\left(\mathrm{A}_{P}^{s}, \mathrm{X}_{P}^{s}\right)\right\}$
目标网络： $\mathrm{G}^{t}=$ $\left(\mathrm{A}^{t}, \mathbf{X}^{t}\right)$ ,
有标签样本集合： $\mathcal{V}_{1}^{L}, \mathcal{V}_{2}^{L}, \ldots, \mathcal{V}_{P}^{L}$ and $\mathcal{V}_{t}^{L}$

目标：

学习异常检测模型，该模型能够利用来自多个辅助网络 $\left\{\mathrm{G}_{1}^{S}, \mathrm{G}_{2}^{s}, \ldots, \mathrm{G}_{P}^{S}\right\}$ 的ground-truth异常知识，去检测目标网络G中的异常节点。理想情况下，检测到的异常节点应该比正常节点有更高的排名分数。

4 方法

在本节中，我们将详细介绍提出的用于小样本网络异常检测的框架Meta-GDN。具体来说，Meta-GDN通过以下两个关键解决了所讨论的挑战：(1)图偏差网络(GDN)，这是一种新的图神经网络，能够在具有有限标记数据的任意单个网络上进行异常检测；(2)跨网络元学习算法，使GDN能够跨多个辅助网络传输元知识，实现目标网络的小样本异常检测。图2提供了Meta-GDN的概述。

4.1 Graph Deviation Networks

我们首先提出了一种新的图神经网络，称为图偏差网络(graph Deviation network, GDN)。GDN由三个关键部分组成，包括 (1)用于学习节点表示的网络编码器; (2)异常估值器，用于估计每个节点的异常得分; (3)偏移损失，用于优化具有小样本标记异常的模型。具体情况如下:

1. Network Encoder

为了从输入网络中学习节点表示，我们首先构建了网络编码器模块。具体来说，它是由多个GNN层构建的，这些层将每个节点编码为低维潜在表示。一般来说，GNN遵循邻域消息传递机制，通过迭代的方式聚合局部邻域的特征来计算节点表示。在形式上，通用GNN层使用两个关键函数计算节点表示：

$\begin{aligned} \mathbf{h}_{\mathcal{N}_{i}}^{l} &=\text { AGGREGATE }^{l}\left(\left\{\mathbf{h}_{j}^{l-1} \mid \forall j \in \mathcal{N}_{i} \cup v_{i}\right\}\right) \\ \mathbf{h}_{i}^{l} &=\text { TRANSFORM }\left(\mathbf{h}_{i}^{l-1}, \mathbf{h}_{\mathcal{N}_{i}}^{l}\right) \end{aligned}$

$\mathbf{h}_{i}^{l}$ 是结点 $v_{i}$ 第 $l$ 层的潜在表示， $\mathcal{N}_{i}$ 是 $v_{i}$ 的一阶邻居。AGGREGATE $(\cdot)$ 是一个聚合函数，聚合来自相邻节点的消息 ;TRANSFORM $(\cdot)$ 根据节点的前一层表示和来自邻居的聚合消息计算节点的新表示。

为了捕获网络中的长期节点依赖关系，我们在网络编码器中叠加了多个GNN层，因此，网络编码器可以表示为:

$\mathrm{H}^{1}=\mathrm{GNN}^{1}(\mathrm{~A}, \mathrm{X})$ $. . .$ $\mathrm{Z}=\mathrm{GNN}^{L}\left(\mathrm{~A}, \mathrm{H}^{L-1}\right)$

其中Z是从网络编码器学习到的节点表示。为简单起见，我们使用一个参数化函数 $f_{\theta_{e}}(\cdot)$ 表示网络编码器(层GNN）。值得注意的是，网络编码器与任意基于GNN的体系结构兼容，这里我们在实现中使用了简单图卷积(Simple Graph Convolution, SGC)。

2. Abnormality Valuator

由网络编码器学习到的表示随后被送入异常值评估器 $f_{\theta_{s}}(\cdot)$ ，进一步评估每个结点的异常情况。异常评估器由两个前馈层构成，将中间节点表示转化为标量异常得分：
$\begin{aligned} \mathbf{o}_{i} &=\operatorname{ReLU}\left(\mathbf{W}_{s} \mathbf{z}_{i}+\mathbf{b}_{s}\right) \\ s_{i} &=\mathbf{u}_{s}^{\mathrm{T}} \mathbf{o}_{i}+b_{s} \end{aligned}$
$s_{i}$ 表示结点 $v_{i}$ 的异常值； $o_{i}$ 表示中间输出； $W_{s}$ 和 $u_{s}$ 分别是可学习的权重矩阵和权重向量； $\mathbf{b}_{s}$ 和 $b_{s}$ 是偏置项。
具体而言，整个GDN模型可以描述为:
$f_{\theta}(\mathbf{A}, \mathbf{X})=f_{\theta_{s}}\left(f_{\theta_{e}}(\mathbf{A}, \mathbf{X})\right)$
GDN直接将输入网络映射到标量异常分数，并可以端到端方式进行训练。

3. Deviation Loss

GDN的目标是根据计算出的异常分数，用少量标签来区分正常节点和异常节点。在这里，我们建议采用偏差损失来加强模型，对特征与正常节点显著偏离的节点给予较大的异常分数。为了指导模型学习，我们首先定义一个参考分数(即 $\mu_{r}$ )作为随机选取的一组正常节点的异常分数的平均值。它可以作为参考来量化异常节点的得分偏离正常节点的程度。
根据以往的研究，高斯分布可以很好地拟合各种数据集的异常分数分布，采样 k 个结点的异常值构造以下分布： $\left\{r_{1}, r_{2}, \ldots, r_{k}\right\} \sim \mathcal{N}\left(\mu, \sigma^{2}\right)$ 。参考分数计算为所有采样分数的平均值：
$\mu_{r}=\frac{1}{k} \sum_{i=1}^{k} r_{i}$
节点的异常分值与参考分值之间的偏差可以用标准分值的形式定义:
$\operatorname{dev}\left(v_{i}\right)=\frac{s_{i}-\mu_{r}}{\sigma_{r}}$
$\sigma_{r}$ 是采样的K个异常得分 $R=\left\{r_{1}, \ldots, r_{k}\right\}$ 的标准差。将距离函数替换为上式中的偏差，由对比损失得到最终目标函数:
$\mathcal{L}=\left(1-y_{i}\right) \cdot\left|\operatorname{dev}\left(v_{i}\right)\right|+y_{i} \cdot \max \left(0, m-\operatorname{dev}\left(v_{i}\right)\right)$
其中是输入节点的ground-truth标签。如果节点为异常节点，则= 1，否则= 0。请注意，是一个置信度，它定义了一个围绕偏差的半径。
通过最小化上述损失函数，GDN将使正常节点的异常得分尽可能接近，同时使与异常节点的异常得分之间产生至少的较大正偏差。通过这种方式，GDN能够学习具有较少标记异常的正常模式的高级抽象，并使节点表示学习能够从罕见异常中区分正常节点。因此，如果一个节点的模式明显偏离了学习到的正常模式的抽象，就会给该节点分配一个较大的异常分数。
我们的初步结果表明，只要不是太大，GDN对和的选择并不敏感。具体来说，我们在实验中设置= 0，= 1，这有助于GDN在不同的数据集上获得稳定的检测性能。另外值得一提的是，由于我们无法访问正常节点的标签，所以我们将 $\mathcal{V}^{U}$ 中未标记的节点视为正常节点。注意，通过这种方式，剩余未标记异常和所有正常节点将被视为正常处理，从而将污染引入到训练集。值得注意的是，通过使用这种简单的策略，GDN表现得非常好，并且对不同的污染水平都很健壮。第5.4节评估了不同污染水平对模型性能的影响。

4.2 Cross-network Meta-learning

有了提出的图偏差网络(GDN)，我们能够有效地检测带有有限标记数据的任意网络上的异常。当来自目标网络同一域的辅助网络可用时，如何传递这些有价值的知识是实现目标网络小样本异常检测的关键。尽管跨网络学习方法是可行的，但如果直接借用现有的跨网络学习方法的思想，其效果会相当有限。主要原因是，这些方法只专注于从单个网络传递知识，不同网络上的异常特征不同，可能会导致知识的负传递。为此，我们转而利用多个辅助网络来提取异常的综合知识。
元学习作为一种提取和转移知识的有效范式，近年来因其在各种高影响领域的广泛应用而受到越来越多的研究关注。从本质上讲，元学习的目标是对一个模型进行各种学习任务的训练，使学习后的模型能够有效地适应只有很少甚至只有一个标记数据的新任务。特别是**Finn et al.[10]**提出了一种模型不可知的元学习算法，明确地学习模型参数，使得模型能够在标记数据有限的情况下，通过少量的梯度步长对新任务实现良好的泛化。受此工作的启发，我们提出从多个辅助网络中学习一个元学习器(即Meta-GDN)作为GDN的初始化。其中，Meta-GDN在训练阶段从辅助网络上不同的小样本网络异常检测任务中提取ground-truth异常元知识，并针对目标网络上的新任务进一步进行微调，使模型能够快速有效地适应。
我们将每个学习任务定义为在单个网络上执行小样本异常检测，其目标是按照Eq(7 损失函数)中的定义增大异常分数。 $\mathcal{T}_{i}$ 表示由网络 $\mathrm{G}_{i}^{s}$ 构造的小样本网络异常检测，每个epoch中训练P个任务。GDN模型由函数 $f_{\theta}$ 表示，给定P个任务，优化算法会首先将每一个任务的初始参数 $\theta_{i}^{\prime}$ 调整为 $\theta_{i}^{\prime}$ 。更新的参数 $\theta_{i}^{\prime}$ 是由 $\mathcal{L}_{\mathcal{T}_{i}}$ 在每一个batch中计算而来，一个梯度步长的参数更新可以描述为：
$\boldsymbol{\theta}_{i}^{\prime}=\boldsymbol{\theta}-\alpha \nabla_{\boldsymbol{\theta}} \mathcal{L}_{\mathcal{T}_{i}}\left(f_{\theta}\right)$

α是元学习的学习率，以上公式只描述了步一步梯度更新。通过在所有学习任务中优化相对的最佳性能来训练模型参数。具体地说，元目标函数定义如下:
$\min _{\theta} \sum_{i=1}^{P} \mathcal{L}_{\mathcal{T}_{i}}\left(f_{\theta_{i}^{\prime}}\right)=\min _{\theta} \sum_{i=1}^{P} \mathcal{L}_{\mathcal{T}_{i}}\left(f_{\theta-\alpha} \nabla_{\theta} \mathcal{L}_{\mathcal{T}_{i}}\left(f_{\theta}\right)\right)$

通过优化GDN的目标，更新后的模型参数可以保持对每个网络的异常检测能力。由于元优化是对参数执行的，目标是使用更新的参数(即’)为所有任务计算的，相应的，模型参数经过一个或少量的梯度步骤的优化后对目标任务(网络)将产生极大的效果。
在形式上，我们利用随机梯度下降(SGD)在所有任务中更新模型参数，使模型参数更新如下:
$\boldsymbol{\theta} \leftarrow \boldsymbol{\theta}-\beta \nabla_{\boldsymbol{\theta}} \sum_{i=1}^{P} \mathcal{L}_{\mathcal{T}_{i}}\left(f_{\theta_{i}^{\prime}}\right)$
其中是元步骤大小。完整的算法在下面的算法中总结。具体来说，对于每一批，我们从未标记的数据和标记的异常数据中随机抽取相同数量的节点，分别表示正常节点和异常节点。

5 实验

本节旨在回答以下研究问题:

RQ1：Meta-GDN对于检测目标网络上的异常有多少有效性?
RQ2：通过提供不同数量的辅助网络或不同的异常污染级别，Meta-GDN的性能会发生多大的变化？
RQ3：Meta-GDN的各个组成部分(即图偏差网络或跨网络元学习)对最终的检测性能有何贡献?

5.1 实验设置

1 数据集

在实验中，我们采用了三个真实世界的数据集，这些数据集都是公开的，在之前的研究中已经被广泛使用。上表总结了每个数据集的统计信息。详细说明如下：

Yelp：

Yelp是从Yelp.com上收集的，包含了对美国几个州的餐馆的评论，这些餐馆是按邮政编码组织的。根据Yelp反欺诈过滤算法，评论者分为两类，异常评论员和正常评论员。我们根据邮政编码选择同一位置的餐厅来构建每个网络，其中节点代表评论者，如果两个评论者评论过同一家餐厅，那么他们之间就有一条链接。我们将bag-of-words模型应用于文本内容之上，以获得每个节点的属性

PubMed：

PubMed是一个引文网络，其中节点表示与糖尿病相关的科学论文，边缘表示引文关系。节点属性由一个TF/IDF加权的词向量表示，该词向量来自一个包含500个唯一词的字典。我们将大型网络随机划分为大小相似且不重叠的子网络。

Reddit：

Reddit是从一个在线讨论论坛收集的，其中节点代表threads，如果thread被同一用户评论，则这两个结点之间会有一条边。节点属性是使用线程的平均词嵌入向量构造的。同样地，我们从原始的大型网络中提取出不重叠的子网络进行实验。

请注意，除了Yelp数据集，我们无法访问PubMed和Reddit的ground-truth。因此，我们参考了两种异常注入方法去注入一组组合的异常(即结构异常和上下文异常)，分别是扰动原始网络的拓扑结构和节点属性。为了注入结构异常，我们采用了[7]生成一组小团的方法，因为小团是一种典型的异常子结构。因此，我们在网络中随机选择节点(即团大小)，然后使这些节点彼此完全连接。通过重复这个过程次(即cliques)，我们可以得到×结构异常。在我们的实验中，我们将派系大小设置为15。此外，我们利用[31]引入的方法来生成上下文异常。具体而言，首先随机选择一个节点，然后从网络中随机抽取另外50个节点。我们在50个节点中选择属性与节点欧氏距离最大的节点。节点(即x)的属性将被替换为节点(即x)的属性。请注意，我们以相同的数量注入结构和上下文异常，注入异常的总数量约为网络规模的5%。

2 对比方法

将我们提出的Meta-GDN框架及其基模型GDN与两类异常检测方法进行了比较，包括(1)只考虑节点属性的基于特征的方法(如LOF、Autoencoder和DeepSAD)，以及(2)基于网络的方法(如SCAN、ConOut、Radar、DOMINANT、和SemiGNN)，其中拓扑信息和节点属性都涉及。这些比较baseline方法的细节如下：

LOF：一种基于特征的方法，在上下文层面检测异常
Autoencoder：是一种基于特征的无监督深度自编码器模型，该模型引入了基于L1或L2规范的异常正则化惩罚。
DeepSAD：是一种最先进的用于一般半监督异常检测的深度学习方法。在我们的实验中，我们利用节点属性作为输入特征。
SCAN：是一种基于结构相似度的网络异常检测的有效算法。
ConOut：根据局部上下文中相应的子图和属性的相关子集来识别网络异常。
Radar：是一种无监督的方法，通过特征属性信息的残差及其与网络结构的一致性来检测属性网络上的异常。
DOMINANT ：是一个基于 GCN 的自动编码器框架，使用网络结构和节点属性的重构误差计算异常分数。
SemiGNN ：是一种半监督的GNN模型，它利用层次注意机制来更好地关联不同的邻居和不同的视图。

3 评价标准

在本文中，我们使用以下指标对不同异常检测方法的性能进行综合评价:

AUC-ROC：在以往的异常检测研究中被广泛应用。曲线下面积(AUC)被解释为随机选择的异常比随机选择的正常样本得到更高分数的概率。
AUC-PR：是在不同阈值下准确率与召回率曲线下的面积，它只评估正类(即异常对象)的性能。AUC-PR计算为[21]中定义的平均精度，并在[23]中用作评价指标。
Precision@K：定义为对象的排序列表中真实异常的比例。根据特定异常检测算法计算出的异常分数，得到由高到低的排序列表。

4 实现细节

网络编码器：两层Simple Graph Convolution实现GDN中的网络编码器
异常值评估器：两层神经网络，隐藏层为512个单元，输出层为1个单元。
置信度：5
k=5000
网络总数为5（4个辅助网络和1和目标网络）
每个网络有十个有标记异常
GDN和Meta-GDN训练1000个epoch
batch size=16
学习率=0.01
在目标网络上进行微调，将对应的节点分成40%进行微调，20%进行验证，40%进行测试。
对于所有的比较方法，我们选择在验证集上性能最好的超参数，并将结果报告在目标网络的测试数据上，以便进行公平的比较。特别是对于所有基于网络的方法，在训练过程中都可以访问整个网络结构和节点属性。

5.2 实验结果

1 全面比较

2 小样本验证

5.3 敏感度和稳健性分析

5.4 消融实验

6 结论

本文首次对小样本跨网异常检测问题进行了研究。为了解决这个问题，我们首先设计了一种新的GNN架构，即GDN，它能够利用有限的标记异常来加强单个网络中异常节点和正常节点之间统计上的显著偏差。为了进一步利用辅助网络中的知识，实现对目标网络的小样本异常检测，我们提出了一种跨网络元学习方法Meta-GDN，该方法能够从多个辅助网络中提取全面的元知识。

问题

这里的辅助网络指的是不同的数据集吗?还是指不同的网络结构？

你可能感兴趣的:(#,小样本,#,GNN,#,异常检测,小样本,gnn,异常检测)

python为什么需要文本编辑器-推荐几款高效的Python文本编辑器| 高效的文本编辑器的特点是什么... weixin_39991305
我们都知道程序员花费大量的时间在编写、阅读和编辑代码上，因此一定要使用高效的文本编辑器才能够提高并很好的完成工作的效率和保证工作的质量。什么是高效的文本编辑器呢？除了自己用的得心应手外，小编认为还应该包含以下几个特点：·突出代码的结构，让你在编写代码时就能够发现常见的bug；·包含自动缩进功能；·显示代码长度的标志；·用于执行常见操作的快捷键；如果你是编程新手小白，小u非常建议你使用具备上述功能而
蓝桥杯真题 3513.岛屿个数 Feliz.. dfs和bfs 算法深度优先
原题地址:1.岛屿个数-蓝桥云课问题描述小蓝得到了一副大小为M×NM×N的格子地图，可以将其视作一个只包含字符'0'（代表海水）和'1'（代表陆地）的二维数组，地图之外可以视作全部是海水，每个岛屿由在上/下/左/右四个方向上相邻的'1'相连接而形成。在岛屿AA所占据的格子中，如果可以从中选出kk个不同的格子，使得他们的坐标能够组成一个这样的排列：(x0,y0),(x1,y1),…,(xk−1,yk
Python解决“特定数组的逆序拼接”问题啥都鼓捣的小yao 经典算法练习 python 算法开发语言
Python解决“特定数组的逆序拼接”问题问题描述测试样例解决思路代码问题描述小U得到了一个数字n，他的任务是构造一个特定数组。这个数组的构造规则是：对于每个i从1到n，将数字n到i逆序拼接，直到i等于n为止。最终，输出这个拼接后的数组。例如，当n等于3时，拼接后的数组是[3,2,1,3,2,3]。测试样例样例1：输入：n=3输出：[3,2,1,3,2,3]样例2：输入：n=4输出：[4,3,2,
python语言程序设计基础,python编程代码大全 Rtee1 python 开发语言服务器
大家好，小编为大家解答python语言程序设计基础第二版课后答案的问题。很多人还不知道PYTHON语言程序设计实践教程(陈东)答案，现在让我们一起来看看吧！目录1Python基本语法元素￲1.1程序设计基本方法1.1.1计算机与程序设计1.1.2编译与解释1.1.3程序的基本编写方法—IPO1.1.4计算机编程1.2Python开发环境配置1.2.1Python语言概述1.2.2Python程序的
运用IC-CAP软件对射频集成电路的表征与参数分析 Keep-Follow 课程设计
摘要本文聚焦于运用IC-CAP软件对射频集成电路进行全面表征与参数分析。详细阐述IC-CAP软件在该领域的功能特性，通过具体的射频集成电路案例，深入介绍使用软件进行直流参数测试、小信号S参数分析、大信号特性表征的流程与方法。探讨如何依据分析结果优化射频集成电路性能，展现软件在助力电路设计、提升产品质量方面的关键作用，为射频集成电路研发工程师提供极具价值的技术参考。关键词IC-CAP软件；射频集成电
算法设计与分析4（变治法） songx_99 算法设计与分析算法
变治法将问题转化为一个或数个有一定关联当形式上不同的更加简单或更加好解决的子问题。变治法的应用：预排序思想用预排序可以简化许多问题，如检查元素唯一性，检查出现次数最多的元素等堆算法堆的定义首先它是一个完全二叉树，完全二叉树表明树的每一层都是满的，只有最后一层最右边的元素有可能缺位。且父结点的值大于它的两个子节点，则称是一个大根堆，若值小于两个子节点，称小根堆堆化有向下调整，向上调整两种，大致思路相
线性代数-MIT 18.06-汇总儒雅的钓翁数学基础线性代数矩阵
第一讲：方程组的几何解释第二讲：矩阵消元第三讲：乘法和逆矩阵第四讲：AAA的LULULU分解第五讲：转换、置换、向量空间R第六讲：列空间和零空间第七讲：求解Ax=0Ax=0Ax=0，主变量，特解第八讲：求解Ax=bAx=bAx=b：可解性和解的结构第九讲：线性相关性、基、维数第十讲四个基本子空间第十一讲：矩阵空间、秩1矩阵和小世界图第十二讲：图和网络第十三讲：复习一第十四讲：正交向量与子空间第十五
k8s集群版本升级少陽君 K8S kubernetes 容器云原生
Kubernetes集群版本升级是为了获得最新的功能、增强的安全性和性能改进。然而，升级过程需要谨慎进行，特别是在生产环境中。通常，Kubernetes集群的版本升级应遵循逐步升级的策略，不建议直接跳过多个版本。Kubernetes版本升级的常见流程：升级顺序：先升级控制平面节点（MasterNodes），然后升级工作节点（WorkerNodes）。遵循版本兼容性：Kubernetes支持小版本的
CFD Fluent 出现 floating error 可能是什么原因，怎么解决 Hardess-god CFD 算法人工智能
在使用ANSYSFluent进行流体动力学模拟时，遇到浮点错误（floatingpointerror）通常指的是计算过程中发生了数值问题。这种错误可能由多种原因引起，以下是一些常见的原因及其相应的解决方法：常见原因及解决方法：网格问题：问题描述：如果网格质量不足，特别是含有高偏斜度或非常小的单元，可能会导致计算不稳定。解决方法：重新生成更精细或更合理的网格。确保网格在边界层和流体流动发生显著变化的
蓝桥杯2024年第十五届省赛真题-魔法巡游（Python）罄竹_ python刷题 python 蓝桥杯算法
前言本文参考了FJ_EYoungOneC的文章思路，并且修改了该文章的某些理解上的偏差。一、题目题目来源：dotcpp题目描述在蓝桥王国中，两位魔法使者，小蓝与小桥，肩负着维护时空秩序的使命。他们每人分别持有N个符文石，这些石头被赋予了强大的力量，每一块上都刻有一个介于1到109之间的数字符号。小蓝的符文石集合标记为s1,s2,...,sN，小桥的则为t1,t2,...,tN。两位魔法使者的任务是
悬镜安全获评专精特新企业！ DevSecOps选型指南软件供应链安全工具悬镜安全开源治理软件成分分析 ASPM 专精特新小巨人
近日，北京安普诺信息技术有限公司（以下简称：悬镜安全）凭借在DevSecOps敏捷安全和中国数字供应链安全领域的关键技术自主创新、市场引领以及在守护中国数字供应链安全做出的行业贡献等多重维度，从众多参评企业中脱颖而出，成功入选第六批专精特新“小巨人”企业！01关键前沿科技引领在此背景下，悬镜安全以关键前沿技术为引领方向，不断完善企业发展体系，增强核心竞争力，持续为行业提供更加高效、安全的数字化服务
MiniMind：3小时完全从0训练一个仅有26M的小参数GPT，最低仅需2G显卡即可推理训练！哈罗·沃德 LLM gpt
MiniMind：3小时完全从0训练一个仅有26M的小参数GPT，最低仅需2G显卡即可推理训练！概述MiniMind是一个开源的微型语言模型，它的设计目标是让个人GPU用户也能够快速推理甚至训练语言模型。它的体积仅为26M，大约是GPT3的1/7000，非常适合快速部署和实验。https://github.com/user-attachments/assets/88b98128-636e-43bc
【贪心算法】1、分发饼干念奕玥【Java】数据结构与算法 java leetcode 贪心算法
贪心算法或贪心思想采用贪心的策略，保证每次操作都是局部最优的，从而使最后得到的结果是全局最优的。可用于解决分配问题e.g.leetcode455分发饼干解题思路：目标：尽可能满足越多数量的孩子。根据目标，可以容易想到，先去满足胃口值小的孩子。为了尽量使饼干可以满足更多的孩子，所以要把饼干尺寸大于等于孩子胃口值的饼干中挑尺寸最小的饼干给孩子。满足了这个孩子之后，再采取同样的策略去考虑剩下的孩子，直到
使用Spring Boot实现分布式任务调度 weixin_836869520 spring boot 分布式后端
使用SpringBoot实现分布式任务调度大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！一、SpringBoot与分布式任务调度概述在分布式系统中，任务调度是一项关键的技术，它能够有效地管理和调度系统中的各种任务，确保任务能够按时执行并具有高可用性和可靠性。SpringBoot作为Java领域流行的开发框架，提供了多种实现分布式任务调度的解决方案。二、SpringB
在Spring Boot中实现分布式任务调度微赚淘客系统开发者 spring boot 分布式后端
在SpringBoot中实现分布式任务调度大家好，我是微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！使用SpringBoot与Quartz实现分布式任务调度1.引入依赖在SpringBoot项目中，首先需要引入Quartz和相关依赖：org.springframework.bootspring-boot-starter-quartz2.配置Quartz在SpringBoot的配
在Spring Boot中集成分布式任务调度微赚淘客机器人开发者联盟@聚娃科技 spring boot 分布式后端
在SpringBoot中集成分布式任务调度大家好，我是微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！1.引言分布式任务调度是现代企业应用中常见的需求，特别是在微服务架构中，不同服务可能需要定时执行任务、定时触发某些业务逻辑或者周期性地处理数据。SpringBoot提供了多种方式来实现分布式任务调度，包括使用Quartz、Spring自带的任务调度以及集成第三方调度中心等。2.使
进制转换（R转十）（1290. 二进制转换十进制、1292. 十六进制转十进制、1291. 八进制转十进制、1405. 小丽找潜在的素数）是帅帅的少年东方博宜OJ题库解析算法 c++数据结构
题单地址：题单中心-东方博宜OJ这里以二进制转十进制为例（按位加权求和法）1290.二进制转换十进制问题描述请将一个25位以内的2进制正整数转换为1010进制！输入一个25位以内的二进制正整数。输出该数对应的十进制。样例输入111111111111111111111111输出16777215解析：按位加权(2^n)求和法。#includeusingnamespacestd;intmain(){st
golang是如何回收goroutine的 double12gzh golang golang
目录1.写在前面2.生命周期3.必备条件1.写在前面微信公众号：[double12gzh]关注容器技术、关注Kubernetes。问题或建议，请公众号留言。本文是基于golang1.13Goroutines易于创建，堆栈小，上下文切换快。由于这些原因，开发人员喜欢它们，并经常使用它们。然而，一个程序如果产生许多这样生命周期很短的goroutine，那将会花费相当多的时间来创建和销毁它们。2.生命周
记录华为OBS文件上传下载多种方式 yychen_java java 华为 java spring
公司要从阿里的oss切换到华为的obs，为了尽量小代价的改动，所以想找和阿里一样上传的方式，之前阿里做的是后端生成文件上传的url，前端做上传动作，这里记录一下obs的多种上传方式。直接上代码：1、获取OBS配置引入mavencom.huaweicloudesdk-obs-java3.21.11其中的各种配置自己在华为平台找到哦。importcom.obs.services.ObsClient;i
面试题：session和cookie的区别？客户端禁用cookie, session还能用吗？来之前不会起名字面试题 java 服务器 javascript 面试
session和cookie的区别区别一：存放位置不同cookie数据保存在客户端，session数据保存在服务端。区别二：session比cookie安全cookie不是很安全，别人可以分析存放在本地的COOKIE并进行COOKIE欺骗，考虑安全选session区别三：cookie对服务器造成的压力比session小session会在一定时间内保存在服务器上。当访问增多，会比较占用你服务器的性能
http与https的区别哥谭居民0001 网络安全服务器
加密方式：加密技术是对信息进行编码和解码的技术，编码是把原来可读信息（又称明文）译成代码形式（又称密文），其逆过程就是解码（解密），加密技术的要点是加密算法，加密算法可以分为三类：对称加密，如AES基本原理：将明文分成N个组，然后使用密钥对各个组进行加密，形成各自的密文，最后把所有的分组密文进行合并，形成最终的密文。优势：算法公开、计算量小、加密速度快、加密效率高缺陷：双方都使用同样密钥，安全性得
使用浏览器原生API实现录屏功能会说法语的猪 javascript javascript 开发语言 ecmascript
好早之前写了个小deme，本来都忘了，现在无意中又翻出来了，所以也来记录一下吧！废话不说了，直接上代码了：webRTCconstcontrol=document.querySelector('.control')control.addEventListener('click',start)asyncfunctionstart(){co
数据分析实战：Shopee虾皮网销售数据分析 harvensage 数据分析数据分析数据挖掘
一、背景目标Shopee（虾皮网）是东南亚电商平台，覆盖新加坡、马来西亚、菲律宾、泰国、越南、巴西、墨西哥、哥伦比亚、智利等十余个市场，触达超10亿消费者！2023年Shopee总订单量达82亿，23年Q4总订单数同比增长46%！分析数据样本来自某爬虫系统爬取的Shopee网从2023年4月至2023年5月期间特定产品的销售数据。任务要求任务要求：从数据中获取在2023年5月上市的产品。使用问题1
Linux驱动开发实战之SRIO驱动（一） niuTaylor linux 驱动开发 c语言开发语言
活动发起人@小虚竹想对你说：这是一个以写作博客为目的的创作活动，旨在鼓励大学生博主们挖掘自己的创作潜能，展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴，那么，快来参加吧！我们一起发掘写作的魅力，书写出属于我们的故事。我们诚挚邀请你参加为期14天的创作挑战赛！提醒：在发布作品前，请将不需要的内容删除。LinuxSRIO驱动开发终极指南：从基础到实战一、SRIO协议基础SRI
从零至巅：逆向爬虫之道 0_0 蓝花楹下逆向爬虫爬虫
逆向爬虫-涅槃吾本一介凡鸟，栖于尘世，碌碌无为，浑浑噩噩，如沧海一粟，渺小而无足轻重。然，虽为小雀，心亦怀鸿鹄之志，欲挥羽向天，如凤凰般，翱翔九天，俯瞰苍茫大地。奈何羽翼未丰，学识浅薄，常感力不从心，困于樊笼，不得展翅高飞。然，吾深知，学如逆水行舟，不进则退。故，今执笔为记，以明志，以自勉。愿以此笔记为舟，载吾渡学海，以勤为桨，以思为帆，逐浪前行，终至彼岸。虽前路漫漫，荆棘丛生，然吾心坚定，誓不负
一个后端工程师对前端云 Vercel 的体验和探索程序员
今天小猿姐特邀咱们资深的程序猿为大家带来产品的体验报告。Vercel概述Vercel是一个为前端开发者设计的一体化平台（前端云），可以帮助开发者快速地将网站和应用程序部署到各种环境中，并且提供了一个灵活、可扩展和安全的平台，非常适合开发者在不同平台和环境中进行开发和部署。Vercel的主要特点包括：通过自动配置构建设置和提供详细的构建日志，简化了部署管理过程。借助集成的CI/CD功能，开发者可以预
GitHub霸榜神器！NextChat领衔DeepSeek全栈开发范式大禹智库《向量数据库指南》《实战AI智能体》机器学习 RAG AI智能体人工智能 Manus deepseek NextChat
一、项目概况与生态定位NextChat（原ChatGPT-Next-Web）是GitHub上斩获81.2K星标的现象级开源项目，定位为"轻量级AI助手终端"，支持DeepSeek、Claude、GPT-4、Gemini等20+主流大模型。其核心价值在于以5MB超小客户端实现跨平台（Windows/Mac/Linux/iOS/Android）无缝衔接，同时提供云端一键部署方案，成为个人用户与企业私有
CVPR2025 | 对抗样本&智能安全方向论文汇总 | 持续更新中~ 四口鲸鱼爱吃盐文献阅读安全 transformer 深度学习对抗样本神经网络视觉语言模型后门攻击
汇总结果来源：CVPR2025AcceptedPapers若文中出现的论文链接和GitHub链接点不开，则说明还未公布，在公布后笔者会及时添加.若笔者未及时添加，欢迎读者告知.文章根据题目关键词搜索，可能会有遗漏.若笔者出现遗漏，欢迎告知.部分文章还未公布正文，只有名称.MindtheGap：通过查询更新分析检测正在进行中的黑盒对抗攻击MindtheGap:DetectingBlack-boxAd
React中的高优先级任务插队机制东方睡衣 react.js javascript 前端
说到高优先级任务插队机制，就要提到Reatfiber这个东西了，也就是时间分片，说实话这东西我之前了解过，但是下午被面试官问到了，我还说都能答上来，结果突然问到时间分片后，被分化的小任务的执行顺序，还有就是如果有优先级高的任务插入进来，它们的执行顺序是什么，当时头皮发麻，想着我都说到这里了，怎么还问，刚刚看了下，其实原理很简单，下面一起来看看吧！在React的concurrent模式下，低优先级任
关于离子滤波小记文弱_书生乱七八糟人工智能计算机视觉算法
粒子滤波（ParticleFilter,PF）粒子滤波是一种基于蒙特卡洛方法的贝叶斯滤波算法，主要用于解决非线性、非高斯的状态估计问题。它广泛应用于机器人定位、目标跟踪、金融建模等领域。1.粒子滤波的基本概念粒子滤波的核心思想是用一组加权的**随机样本（粒子）**来近似后验概率分布，而非采用卡尔曼滤波那样的参数化分布假设（如高斯分布）。设系统的状态模型如下：xk=f(xk−1,uk,wk)x_k=
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。