smile-yan

《异常检测——从经典算法到深度学习》20 HotSpot：多维特征 Additive KPI 的异常定位

《异常检测——从经典算法到深度学习》

0 概论
1 基于隔离森林的异常检测算法
2 基于LOF的异常检测算法
3 基于One-Class SVM的异常检测算法
4 基于高斯概率密度异常检测算法
5 Opprentice——异常检测经典算法最终篇
6 基于重构概率的 VAE 异常检测
7 基于条件VAE异常检测
8 Donut: 基于 VAE 的 Web 应用周期性 KPI 无监督异常检测
9 异常检测资料汇总（持续更新&抛砖引玉）
10 Bagel: 基于条件 VAE 的鲁棒无监督KPI异常检测
11 ADS: 针对大量出现的KPI流快速部署异常检测模型
12 Buzz: 对复杂 KPI 基于VAE对抗训练的非监督异常检测
13 MAD: 基于GANs的时间序列数据多元异常检测
14 对于流数据基于 RRCF 的异常检测
15 通过无监督和主动学习进行实用的白盒异常检测
16 基于VAE和LOF的无监督KPI异常检测算法
17 基于 VAE-LSTM 混合模型的时间异常检测
18 USAD：多元时间序列的无监督异常检测
19 OmniAnomaly：基于随机循环网络的多元时间序列鲁棒异常检测
20 HotSpot：多维特征 Additive KPI 的异常定位
相关：
VAE 模型基本原理简单介绍
GAN 数学原理简单介绍以及代码实践
单指标时间序列异常检测——基于重构概率的变分自编码（VAE）代码实现（详细解释）

20. HotSpot：多维特征 Additive KPI 的异常定位

论文下载：netman | ieee.org 下载后排版有一定偏差，但内容相同。
论文发表于 IEEE Access 2018
源码地址：暂时没有找到源码

20.1 论文概述

首先必须说明的是，该论文提出的算法与本系列其他算法有很大的不同，包括：

相对与异常检测 工作，更加注重的是 异常定位；
数据对象为 Additive多维特征 KPI 数据（什么事 Additive KPI 在后面介绍）

20.1.1 论文提出算法的动机是什么？应用于什么场景？（Motivation）

当异常发生后，我们需要找到异常发生的根因（root cause），也就是定位到具体哪个KPI表现出异常，即找出根本原因。

这里举个例子，对于某一个特定业务，需要用到的中间件包括 mysql, redis, es，对应的微服务包括 service1, service2，我们对提供服务的各个阶段都采集 KPI 数据，当异常发生时，我们需要快速找到究竟是谁出了问题。这里需要强调 root cause 的含义，当我们发现某个服务模块有问题而这个服务模块包括 redis 与 mysql 以及服务提供逻辑代码，我们需要进一步确定到底哪块出问题，而不是笼统地回答。

因此，算法的应用场景也比较清楚，该场景满足以下三个条件:

场景具有多个流程。类似于我们求的是多项式计算入 (1+2*4 - 7) / 3，而不是只有一个流程，如 1 + 3。
场景中每个流程都可以量化，即使用 KPI 表示健康情况。
场景中各个流程中具有一定的相关性。如果每个流程都相互独立，那就不存在寻找 root cause 的需求了。比如三个相互独立的房间中有三个人，哪个房间的灯亮了一定就是那个房间的人干的事情，不需要一个一个步骤调查分析了。

20.1.2 论文提出了什么算法，是如何找到 root cause ?

论文用到的最核心的算法应当包括：

蒙特卡罗搜索树 Monte Carlo tree search (MCTS)，用来搜索定位异常发生地。
Potential Score (ps) 用来评估每个元素的潜在风险程度的方法。

关于这两个方法如何应用在论文中在后面做详细介绍，目前给一个粗略的答复。

论文通过 Potential Score 评估每个结点的异常程度；
论文通过 Monte Carlo Tree Search 定位异常根因。

20.1.3 总体概述论文内容

论文提出了采用 MCTS 方法的 HotSpot 框架（在异常定位文献中首次出现），可以捕捉异常是如何从根本原因在整个聚合层次结构中传播的（确定异常根因），并且论文提出了一种分层剪枝的方法来进一步缩小搜索空间以节省搜索时间，提高算法速率。

20.2 相关技术背景介绍

20.2.1 additive KPI

比如 page view, revenue, traffic volume，大概可以理解为数值类型的。事实上后来的很多KPI异常检测论文默认数据对象就是数值类型的。

20.2.2 多特征 additive KPI 数据的异常定位

多特征additive KPI 异常定位问题是识别最有可能导致总 KPI 值异常变化的模块及其元素。论文原文使用的是长方体（cuboid）来表示模块的概念，如图一所示：

20.2.3 Monte Carlo Tree Search（MCTS）蒙特卡罗搜索

蒙特卡洛树搜索（MCTS）是一种启发式搜索算法，适用于某些类型的决策过程，尤其是游戏中使用的决策过程（例如AlphaGo）。

这部分的资料比较多，感兴趣的可以自行搜索，可以参考一下 https://blog.csdn.net/qq_24178985/article/details/121803376。

不过也可以不急着深入理解这个方法，继续看其他部分。

20.3 论文阅读

这里跳几个比较重要的部分进行介绍

20.3.1 Contribution

为了处理根源的巨大搜索空间，HotSpot 采用了 MCTS 方法（文献中首次应用在异常定位）。
在采用 MCTS 中的动作值是我们基于“涟漪效应（ripple effect）”的新颖的潜在得分（potential score），其捕获了对于多维 additive KPI，一个属性组合的KPI值的改变（作为原因）如何能够引起其他属性组合的KPI值改变（作为结果）。
我们提出了一种分层剪枝方法（在精神上类似于 Apriori 原理）来进一步减少搜索空间。
我们使用一个顶级全球搜索引擎的真实世界数据，表明 HotSpot 在有效性和鲁棒性方面都比现有的两种方法有了很大的改进，HotSpot对所有类型的案例的95%实现了超过90%的F-score，而对于现有方法，所有类型的案例中只有不到15%具有超过90%的F-score。
我们的实践经验表明，HotSpot 可以将手动工作的本地化时间从 1 小时以上缩短到 20秒以内。

20.3.2 问题定义

此部分描述了论文解决的是一个什么样的问题，先从定义出发：

这里是指接下来的论文、实验中可能用到的条目（term）的介绍说明，在公式中也会用到，这里我们详细介绍一下：

条目	定义	标识	举例
属性	每条PV记录的信息类别	-	$\text{Province (P), ISP(I), DC(D), Channel(C)}$
属性值	每个属性的候选值	-	$\text{{Beijing, Shanghai, Guangdong} for Province(P)}$
元素	每个属性的不同值的组合向量	$e = (p, i, d, c)$	$\text{(Beijing,,,), (,Mobile,,), (Beijing, Mobile,,)}$
PV值	根据元素的访问日志数	$v(e_i)$	$v(\text{Beijing,,,*})$
数据立方体	多维数据的数据结构	${n-d} \ cube$	维度为{P，I，D，C}的四维数据立方体
长方体Cuboids	长方体是一个数据立方体，其维度在所有给定维度的子集中	$B_i$	${B_P, B_{P,I}, B_{P,I,D},...\}$ for the 4-d data cube with the dimensions $\text{\{P, I, D, C\}}$
潜在得分Potential Score	衡量一组元素成为根本原因的潜力的概念	$p s$	$p s (S)$ ， $S=\{\text{(Beijing, , , ), (, Mobile, , )}\}$

下面的两个表用来表示 PV 例子，网站上的PV记录可以有几个属性。例如，“10:00:01（时间戳）；北京、移动、DC1、Channel1“为记录，北京、移动、DC1、Channel1分别根据地区§、ISP(I)、数据中心(D)和频道©四个属性为候选值，其中 $P=\{p\}$ 、 $I=\{i\}$ 、 $D=\{d\}$ 、 $C=\{c\}$ 分别为地区、ISP、数据中心和 ADS 频道的36、10、6、10个不同值的集合。 $P$ 和 $I$ 的值基于客户端 IP，并分别使用 IP 到地理定位数据库和 BGP 表进行解析。每个地区的 ISP 都是一个独立的公司，因此相同的 ISP 名称在不同的地区往往表现不同。渠道是不同广告市场的标签，如医疗或教育。表2 显示了PV记录的一些示例。

不同属性值组合的向量在本文中称为元素（element），表示为 $e = (p, i, d, c)$ ，其中 $p\in P$ 或者 $p = *$ , $\in I$ 或者 $i = *$ , $d\in D$ 或者 $d = *$ , $c\in C$ 或者 $c = *$ , 这里的 $*$ 是通配符，当 $e = (p, i, d, c)$ 在每一个时间尺度（如本文中的尺度为每分钟）中，我们根据一个元素 $e$ 来计算 PV 记录的数目，并将这个数字称为该元素的 PV 值，用 $v (e)$ 表示，即 $v (e) =$ 在特定时间尺度上的#个记录。表3 显示了与表2中的PV记录相对应的PV值。

所有这些最细粒度元素的集合，如表3 中的元素，用叶子表示： $\text{LEAF}=\{e|e=(p,i,d,c), p \neq*, i \neq *, d \neq * , c \neq * \}$ 。当一个或多个属性值为 * 时，其他元素都可以基于 Leaf 中的元素求和。例如，对于表 3 中 10:00（从10:00:00到10:00:59) 的三个元素，我们可以获得更粗粒度元素的值，例如：

$\begin{array}{c} v\left(\text { Beijing, Mobile, } D C_{1}, *\right)=2+1=3, \\ v(\text { Bei jing }, *, *, *)=2+1+3=6 . \end{array}$

根据聚集程度的不同，我们将元素划分为不同的集合，每个集合对应一个长方体。长方体是数据立方体的子立方体，数据立方体是一种数据结构，允许在多维度上建模和查看数据[3]，例如，叶的元素构成一个4-D数据立方体，如图所示 1. 长方体表示为 $B_i$ （ $i$ 可以是 $P$ 、 $I$ 、 $D$ 和 $C$ 中的任意组合），例如， $B_P$ 是一维长方体， $B_{P,I,D}$ 是三维长方体。长方体的元素集 $B_i$ 用 $E(B_i)$ 来表示，比如， $E\left(B_{P}\right)=\{e \mid e=(p, *, *, *), p \neq *\}$ ， $E\left(B_{P, I, D}\right)=\{e \mid e=(p, i, d, *), p \neq *, i \neq *, d \neq *\}$ ， $LEAF=E\left(B_{P, I, D, C}\right)$ 。

此外，我们构造长方体并为其标记层ID，如图所示 2. 另外，我们让 $B_P$ 或 $B_I$ 是 $B_{PI}$ 的父长方体， $B_{P,I}$ 是 $B_P$ 或 $B_I$ 的子长方体。因此，长方体的元素都具有父子结点关系，比如 $*)\left(\in E\left(B_{P}\right)\right)$ 和 $*)\left(\in E\left(B_{P, I}\right)\right)$ 。

论文中使用 $e^{\prime}=\left(p^{\prime}, i^{\prime}, d^{\prime}, c^{\prime}\right)$ 表示 $e = (p, i, d, c)$ 的后代，其中 $e\neq e^{\prime}$ ， $p^{\prime} = p$ 或者 $p = *$ ， $i^{\prime} = i$ 或者 $i = *$ ， $d^{\prime} = d$ 或者 $d = *$ ， $c^{\prime} = c$ 或者 $c = *$ 。 $Desc(e)=\{e^{\prime} | e^{\prime}$ 是 $e$ 的后代 $\}$ ， ${Desc}^{\prime}(e)=\{ e^{\prime} | e^{\prime} =(p,i,d,c) \in LEAF, p\neq *, i \neq *, d \neq *, c \neq *\}$ 。如果 $\in LEAF$ ，PV 值 $v (e)$ 可以直接评估，否则

$v(e)=\sum_{e^{\prime} \in \operatorname{Desc}^{\prime}(e)} v\left(e^{\prime}\right) \tag{1}$

比如，

$v(\text { Beijing }, *, *, *)=\sum_{j, k, h} v\left(\text { Beijing }, i_{j}, d_{k}, c_{h}\right) \tag{2}$

$\text { Total } P V=v(*, *, *, *)=\sum_{i, j, k, h} v\left(p_{i}, i_{j}, d_{k}, c_{h}\right) \tag{3}$

20.3.3 问题陈述

addictive KPI（多维属性）异常定位问题是识别最有可能导致总KPI值异常变化的长方体及其元素。

为了陈述清楚这个问题，我们在表4 和表5 中举了一个简单的例子。表4表示了一个2维属性 PV 结构。存在两个一维长方体， $B_P$ 和 $B_I$ ，一个二维长方体 $B_{PI}$ 。每个长方体包含一组元素，即 $E(B_{P})=\{Beijing，*),（Shanghai，*),（guangdong，*)\}$ ， $E(B_I)=\{(*, Mobile），(*, Unicom）\}$ ， $Leaf=E(B_{P,I})=\{(Beijing，Mobile)，(Shanghai，Mobile)，(guangdong，Mobine)，(Beijing，Unicom)，(Shanghai，Unicom)，(Guangdong，Unicom)\}$ 。 $v (p, i)$ 显示在表格的单元格中，例如 $v (B e i j i n g, M o b i l e) = 20$ ， $v (B e i j i n g, *) = 30$ 。

当总PV异常时，PV变化如表5所示。在每个单元格中，第一个数字是预测PV值 $f (p, i)$ ，第二个数字是实际PV值 $v (p, i)$ （如何检测总PV和计算元素的预测值将在第四节 A 中介绍）。总 PV 的预测值为100，而实际 PV 值仅为75（表5的右下角）。因此，由于总PV的异常变化 $v (*, *) = 75$ 比触发异常定位的 $f (*, *) = 100$ 小得多，因此触发异常定位。

对于 $B_P$ $B_I$ 和 $B_{P,I}$ 三个长方体，它们可以从不同的角度表达 PV KPI。当总PV发生异常变化时，这三个长方体中的每一个都受到影响。如表5所示，每个长方体（阴影细胞）中都有一些异常元素。在现实中，操作员需要确定哪个长方体和这个长方体的哪些元素是这种异常的最潜在的根本原因。然后他们可以开始尝试修复异常并减轻损失。因此，对于可加性KPI的异常定位问题可以重述如下：

有效和高效地识别总KPI值异常的最潜在的根本原因，即一个特定长方体 $B_i$ 的元素子集。根因集合 $\subseteq E\left(B_{i}\right)$ 。

注意，这个定义允许在同一个长方体中的多个元素作为根本原因集。例如，表5 中示例的根本原因集是 $=\{(\text { Beijing }, *),(\text { Shanghai }, *)\}$ 。但这一定义排除了多个长方体同时存在根源的情况，这在现实中极为罕见。还要注意，我们只处理总KPI值异常的情况。

20.4 核心思路

论文提出了潜在得分（Potential Score）作为度量函数，并应用蒙特卡罗树搜索(MCTS)算法和分层剪枝策略克服了搜索空间过大的问题。

20.4.1 评估数据集中的潜在得分 Potential Score for measuring the potential of sets

在我们的异常定位问题中，一个可以用来“全局”比较不同元素集的根本原因“潜力”的度量。然而，正如第一个挑战所示，这样的度量并不容易开发，简单的度量也不起作用。

我们对这个潜在得分的想法是基于以下直觉：当根原因元素的KPI值发生变化时，它的所有后代叶元素的KPI值也相应地发生变化。因此，候选根本原因元素的“潜在得分”是用来衡量该元素的后代叶元素的预期变化和实际变化之间的差异。详见§IV-B2。另外，MCTS需要潜在分数作为一个价值函数来指导搜索。

20.4.2 高效搜索的MCTS和分层剪枝 MCTS and Hierarchical Pruning for efficiently searching

该问题的搜索空间巨大，需要一种有效的搜索算法。本文的思路是采用一些已知的善于在大空间中搜索的先进算法，而不是像文献 [1]、[2] 那样在小得多的搜索空间中用它们更简单的异常定位来发展有机的启发式算法。受 AlphaGo 在围棋中成功采用 MCTS 算法文献[4]、[5]的启发，本文的核心思想是将 MCTS 算法作为异常定位算法的基础。然而，在采用 MCTS 方面仍然存在一个剩余的挑战，我们现在总结我们的核心思想来解决这些问题。

来自图 2我们可以看到，当我们从低层到高层时，长方体中元素 $n$ 的数量变得越来越多。例如，在 $B_P$ 中有36个元素， $B_{P,I}$ 中有 $36 * 10$ ， $B_{P,I,D,C}$ 中有 $36 * 10 * 6 * 10$ 。回想根本原因集是长方体的(2n-1)个子集之一。即使对MCTS来说，搜索如此巨大的空间也不是一件容易的事情。

为了进一步缩小搜索空间，Hotspot 采用了分层剪枝策略。基本思想是，在搜索较低层之后，HotSpot 会剪除一些不太可能是根本原因元素的元素（在较高层）。直觉是，如果父元素有一个非常低的潜在得分，每个子元素不太可能是根本原因元素，因此可以剪枝。这种方法在精神上与关联规则挖掘中的Apriori原理非常相似[3]。我们称我们的剪枝方法为层次剪枝，因为它的剪枝策略利用了层的层次信息。

20.4.3 总体办法 Overall Approach

HotSpot的核心思想概括如下。我们把这种异常定位看作是一个空间很大的搜索问题；采用MCTS作为基本搜索算法；提出了一个对异常定位具有物理意义的潜在得分度量作为每一集合的潜在度量和MCTS中的值函数；应用分层剪枝方法（类似于Apriori原则）来减少搜索空间。搜索从第1层开始，逐层进行，在每个长方体内应用MCTS，如图所示 3.

20.5 HotSpot 的设计

本部分介绍了Hotspot的详细设计。 HotSpot逐层搜索长方体的集合，即从第1层到第L层（L为层数）。对于给定层的每一个长方体，Hotspot应用MCTS寻找其具有最大潜在得分(PS)的子集，称为该长方体的最佳集（缩写为BSet）。当从一层到下一层时，使用分层剪枝。我们重复这个过程，直到层 $L$ 被搜索，或者得到根本原因集 $R S e t$ （ $p s (R S e t) > P T$ ），其中 $P T$ 是指 $p s$ 的阈值。当 $p s > P T$ 时，我们认为它足够大，可以被视为根本原因集。最终输出 $R S e t$ 是算法生成的所有 $B S e t$ 中 $p s$ 最大的 $B S e t$ 。接下来，我们描述一种检测总KPI和预测本节中元素的方法。然后给出了热点的各个组成部分，即潜在得分、MCTS和分层剪枝。

20.5.1 异常检测与预报 Anomaly Detection and Forecast

HotSpot 需要一个异常检测算法（1）来检测总KPI中的异常，算法（2）来计算其他元素的预测值。

我们采用了业界广泛使用的统计算法对总KPI进行异常检测文献 [6]。均值 $\mu$ 和标准差 $\sigma$ 在一个周期中一个时间间隔进行计算（在我们的案例中间隔为 1 分钟），其中的 $\mu$ 被视为预测值。阈值（ $T_l$ 和T_u分别代表下限和上限）定义如下：

$T_l = \mu - c \times \sigma ,\ T_u = \mu + c \times \sigma \tag{4}$
其中 $c$ 是确定上下限的程度的参数（通常设置为2.0）参考文献 [6]。请注意，阈值是定期更新的。如果实际值超过阈值，则检测异常。该算法适合于我们的场景，因为1）它非常适合于 addictive KPI数据，因为大多数加性KPI数据是周期性的；2）它计算效率高。

20.5.2 潜在得分 Potential Score

(1) 波纹效应(Ripple effect)：我们在表VI中使用了一个新的异常案例来说明根本原因元素的KPI变化是如何根据我们总结的“涟漪效应”传播到其他元素的。 $(B e i j i n g, *)$ 的 PV 值从 30（ $f (B e i j i n g, *)$ ）下降到 12，并且 $(B e i j i n g, *)$ 是本例中唯一一个根因元素（其他的没有变化）。由于 $v (B e i j i n g ， *)$ 是由它的后代元素 $v (B e i j i n g ， M o b i l e)$ 和 $v (B e i j i n g, U n i c o m)$ 聚合而成的，它们一定发生了相应的变化。注意它们的变化值， $h (B e i j i n g, *) = 18$ ， $h (B e i j i n g, M o b i l e) = 12$ ， $h (B e i j i n g, U n i c o m) = 6$ 。我们通过公式 $h(Beijing,*)\times \frac{f(Beijing, Mobile)}{f(Beijing, *)}$ 可以得出实际值 $v (B e i j i n g, M o b i l e) = 8$ 的比例份额。此外， $h (B e i j i n g, M o b i l e)$ 反过来也促进了 $v$ 的变化 $v (*, M o b i l e)$ 。

上面的示例说明了根本原因元素是如何影响其后代元素（在LEAF中）和其他共享其共同后代元素的元素的。通常，当根本原因元素的值增加或减少时，它遵循如下波动效应特性：

设 $x$ 表示不在 $L E A F$ 中的元素，即 $\notin LEAF$ 。设 $x_{i}^{\prime}$ 表示 $x$ 在 $L E A F$ 中的后代元素，即 $x_{i}^{\prime} \in {Desc}^{\prime}(x)$ 。当 $x$ 的 PV 值通过 $h (x)$ 改变以后，即 $h (x) = f (x) - v (x)$ ， $x^{\prime}_i$ 将根据他们的预测值的比例得到其 $h (x)$ 的份额，即，

$v\left(x_{i}^{\prime}\right)=f\left(x_{i}^{\prime}\right)-h(x) \times \frac{f\left(x_{i}^{\prime}\right)}{f(x)},(f(x) \neq 0) . \tag{5}$

然后使用公式 1 更新 $x_{i}^{\prime}$ 祖先的所有其他元素 $e$ 。上面的涟漪效应描述了根本原因只包含一个元素的情况。当涉及到一个集合（两个或多个元素）时，我们可以为每个元素重用该属性。

(2) 潜在得分(Potential Score)：涟漪效应揭示了根本原因集如何影响许多其他元素的值。因此，为了衡量一个集合的潜在性是根本原因，我们建议1）假设集合 $S$ 是根本原因，2) 根据波纹效应推导叶中后代元素的新PV值，3) 将所有实际PV值与新推导的叶元素PV值进行比较。两种值越接近，该集合就越有可能成为根本原因集。

设 $y_{1}, y_{2}, y_{3}, \ldots, y_{n}$ 表达 $L E A F$ 中所有元素。我们用 $a(y_i)$ 表示一个假定的根因集 $S$ 的新推导的 PV 值。我们计算两种条件下的 $a(y_i)$ 的值：

$\nsubseteq LEAF$ : 如果 $y_i \notin {Desc^{\prime}}(S)$ ， $a(y_i) =f(y_i)$ ；否则，根据公式5计算 $a(y_i)$ 的值。
$\subseteq LEAF$ : 如果 $y_i \notin {Desc^{\prime}}(S)$ ， $a(y_i) =f(y_i)$ ；否则， $a(y_i)=v(y_i)$

设 $\vec{a}$ 表示 $a(y_i)$ 组成的向量，即 $\vec{a} = [a(y_1), a(y_2), \ldots ,a(y_n)]$ 。类似地，设 $\vec{v} =[v(y_1), v(y_2), \ldots ,v(y_n)]$ ， $\vec{f}=[f(y_1), f(y_2), \ldots ,f(y_n)]$ 。

接着我们定义集合 $S$ 的潜在得分（Potential Score, ps）为：
$=\max \left(1-\frac{d(\vec{v}, \vec{a})}{d(\vec{v}, \vec{f})}, 0\right) \tag{6}$
其中， $d(\vec{u}, \vec{w})$ 表示向量 $\vec{u}$ 和 $\vec{w}$ 之间的距离。这里我们采用欧几里得距离：

$d(\vec{u}, \vec{w})=\sqrt{\sum_{i}\left(u_{i}-w_{i}\right)^{2}} \tag{7}$

集合的潜在得分范围为0～1，即[0,1]。如果一个集合有更高的得分，它将被认为有更高的潜力成为根本原因。

上述潜在分数的定义是“全局”的，即任意两个元素集都可以比较它们的潜在分数，以确定哪一个具有更大的潜在分数。这在MCTS中起到了很好的价值函数的作用。

当两个元素集具有相同的潜在得分时，我们遵循一个“简洁”原则。也就是说，元素数目较少的元素获胜，要么遵循奥卡姆剃刀原理[1]，要么因为一个集合中的元素集体是另一个集合中的元素的祖先（首选为根本原因）。

(3) 一个示例：现在我们说明如何根据表5 中案例的潜在得分来找到根本原因。长方体由 $B_p$ ， $B_I$ 和 $B_{P,I}$ 组成。首先会找到每个长方体的最佳集合（这个长方体潜在得分最大的子集）。接下来，我们通过比较最佳集合来选择根本原因集合。 $\vec{y}$ 按照如下顺序代表：[(Bei jing;Mobile); (Shanghai;Mobile); (Guangdong;Mobile); (Bei jing;Unicom); (Shanghai;Unicom); (Guangdong;Unicom )]， $\vec{f}=(20,15,10,10,25,20)$ ， $\vec{v}=(14,9,10,7, 15, 20)$ 。对于长方体 $B_P$ ，它包含三个元素（Beijing，*)、(Shanghai，*)和 (Guanguone，*)，所以所有的子集都是 $S_{p1}=\{(Beijing，*)\}$ ， $S_{p2}=\{(Shanghai，*)\}$ ， $S_{p3}=\{(Guangdong，*)\}$ ， $KaTeX parse error: Expected '}', got 'EOF' at end of input: …，(shanghai，*)\}$ ， $S_{p5}=\{(Beijing，*)，(guanguon，*)\}$ ， $S_{p6}=\{(Shanghai，*)，(guanguon，*)\}$ 和 $S_{p7}=\{(Beijing，*)，(shanghai，*)，(guanguon，*)\}$ 。以集合 $S_{p1}$ 为例，根据公式 5 我们可以推导出 $\vec{a}(S_{p1})) =(14,15,10,7,25,20)$ ，从而可以计算 $ps(S_{p1})=0.13.$ 。实际上，我们可以发现 $S_{p4}$ 和 $S_{p7}$ 都有最大的 $p s$ 值， $ps(S_{p4})=ps(S_{p7})=1$ 。总而言之， $S_{p4}$ 是 $B_p$ 中最好的集合。类似地，可以得到 $B_I$ 和 $B_{P,I}$ 中的最佳集合， $S_{i3}=\{(*, Mobile), (*, Unicom)\}$ ， $ps(S_{i3})=0.47$ （ $\vec{a}(S_i3)=(14,9,10,7,15,20)$ ）， $S_{pi1}=\{(Bei jing,Mobile), (Bei jing,Unicom), (Shanghai,Mobile), (Shanghai,Unicom)\}$ ， $ps(S_{pi1})=1$ （ $\vec{a}(S_{pi1})=(14,9,10,7,15,20)$ ）。比较三个最优集， $S_{p4}$ 是 $p s$ 最大、最简洁的结果集。

上面的例子说明了我们使用潜在分数来识别根本原因集的核心思想。实际上，元素太多了，所以可能的集合数量非常大，尤其是在较高层的长方体中。为了解决这个问题，我们采用了MCTS算法和层次剪枝策略，这将在下面介绍。同时，利用这两种方法可以得到简洁的结果。

20.5.3 MCTS 算法

对于给定的长方体 $B$ ，我们想要获得最佳集（这个长方体潜在得分最大的子集）。假定 $E (B)$ 中有 $n$ 个元素。在B中对根原因集的搜索空间是2n-1，对于大 $n$ 来说，这显然是非常大的。 HotSpot 采用 MCTS 主要是为了应对搜索空间爆炸的挑战。

MCTS是一种启发式方法，通过在决策空间中抽取随机样本，根据已有的随机样本的结果建立搜索树，在给定的决策域中搜索最优决策。在很高的层次上，MCTS试图平衡沿着那些有希望的分支的开发和沿着那些未被开发的分支的开发。它在人工智能(AI)领域被广泛应用于可以表示为顺序决策树的领域，特别是游戏和规划问题[4]，如 AlphaGo[5]。

在MCTS中，每个节点代表一个状态 $S$ （根可以看作是️ $\varnothing$ )。一个行动空间 $A (S)$ 包含在 $S$ 上可以采取的所有法律行动。通过采取合适的行动，算法可以经过路径 $(s, a)$ 从一个状态 $s$ 移动到另外一个，记作 $\in A(s)$ 。可以有与边相关联的变量，算法使用这些变量来指示在状态 $s$ 采取行动 $A$ 的 “value”。

我们采用MCTS来解决长方体的异常定位问题，如下所示。我们首先对这个长方体中的每个 $e$ 计算 $p s (e)$ ，并根据 $p s (e)$ 对所有 $e$ 进行排序。每个状态 $s$ 对应于当前正在探索的候选根本原因集 $S (s)$ 。 $N (s)$ 是 $s$ 被访问的次数。我们为每个边 $(s ， a)$ 设置三个变量。 $N (s ， a)$ 是访问计数，即该边(s，a)被访问的次数。 $p s (S (s))$ 是集合 $S (s)$ 的得分。假定 $S$ 在 $(S ， A)$ 之后跃迁到 $S^\prime$ 。则边 $(S, A)$ 的作用值 $a)=\max _{u \in\left\{s^{\prime}\right\} \cup \text { descendent }\left(s^{\prime}\right)} p s(S(u))$ ，该作用值等于树中 $S^{\prime}$ 及其子节点的最大潜在得分。对于每个 $S$ 将 $Q (s, a)$ 初始化为 $P S (S (s))$ 。

现在我们来说明MCTS迭代在我们的异常定位中的四个步骤。假设在当前迭代开始时，状态树如图所示 4(a)。

(a) 选择 此步骤的目标是从当前状态树中选择一个要展开的节点。每次执行此步骤时，树遍历总是从根状态开始。假设在这个选择步骤中我们已经前进到当前状态 $s$ 。如果 $A (s)$ 中的所有动作都在以前的迭代中被访问过，则通过使用上限置信阈值(Upper Confidence thresholds, UCB)算法 [7]，从可用动作 $A (s)$ 的集合中选择动作 $a$ ，如公式8所示。

$a=\underset{a \in A(s)}{\arg \max }\left\{Q(s, a)+C \sqrt{\frac{\ln N(s)}{N(s, a)}}\right\} . \tag{8}$

$Q (s, a)$ 是采取移动 $a$ 的值。 $Q (s, a)$ 值越高，在该选择步骤中选择移动 $a$ 的机会越大，这是 MCTS 中的利用机制。等式的第二部分只是用于探索的标准 UCB 机制。可以通过修改 $C$ 来改变利用与研究（exploitation and exploration）之间的平衡，一个常用的 $C$ 值是 $\sqrt{2}$ 文献[8]，我们在本文中选择这个值，也可以在实践中根据经验选择这个值。

如果存在根本没有被用过的动作 $\in A(s)$ ，因为 $N (s, a = 0$ 所以不能应用公式 8 。相反，我们将采取未访问操作的概率指定为 $R=(1-Q(s,a_{max}))$ ，其中 $a_{max} = \argmax_{a\in A(s)\cap N(s,a)=0}Q(s,a)$ 。

选择步骤从树的根部开始，并在根据公式8选择叶子状态时停止或者选择一个未访问的动作。比如，在图4(a) 中的实线包含的部分，选择叶状态 ${e_1,e_3\}$ 时停止选择。

(b) 扩展 在选择步骤中选择状态 $S$ 之后，我们通过添加一个新节点 $S^\prime$ 来扩展蒙特卡罗树，其中 $S\left(s^{\prime}\right)=S(s) \cup\left\{e^{*}\right\}$ ， $e^{*}=\arg \max _{e \in\left\{e_{1}, e_{2}, \ldots, e_{n}\right\}-S(s)} p s(e)$ 。我们选择 $e^{*}$ 使其具有剩余元素中最大的 $p s (s)$ 值，而不是随机选择 $e^{*}$ 。比如，在图4(b)中， $S(s)=\{e_1,e_3\}$ 被选中后， $e^{*}=e_4$ 会被添加，得到 $s^{'}$ ，并且 $S(s'=\{e_1,e_3,e_4\}$ 。

(d) Backup 从 $S^{\prime}$ 到根的路径上的所有节点上的动作值 $Q$ 和访问计数 $N$ 都将更新，如图4(d) 中的粗体箭头所示，回想 $Q$ 的定义，沿着这条路径，我们只有当子节点的 $Q$ 大于父亲的 $Q$ 时才更新父亲的 $Q$ 。

在长方体中本地化根本原因集。我们在每个长方体中应用MTCS，对此我们迭代执行上述四个步骤，直到至少出现以下三个条件之一：

找到了一个最佳集合，即如果 $ps(S)\ge PT$ ，满足条件 $B S e t = S$ ；
对集合的所有可用节点进行扩展；
迭代时间大于经验配置的最大数 $M$ 。

在第二个终止条件和第三个终止条件下，如果我们没有得到一个 $P S$ 大于 $P T$ 的集合，我们将返回 $P S$ 最大的 $B S e t$ 作为 $R S e t$ 。

20.5.4 分层剪枝 Hierarchical Pruning

为了进一步减少高层长方体的搜索空间，Hotspot采用了分层剪枝策略。其基本思想是，Hotspot 逐层搜索长方体，即从第1层到第 $L$ 层，在搜索到较低的一层后，在较高的一层中剪除一些不太可能是根本原因的元素。

对于层 $L$ ( $1\leq l \leq L$ ) 中的每一个长方体 $B$ ，利用 MCTS 算法可以得到最优集（该长方体潜在得分最大的子集） ${BSet}_{l,B}$ 。我们的直觉如下。如果 $l + 1$ 层中的一个元素 $p_1，i_1，*，*)$ 具有较高的潜在得分，那么它在 $l$ 层中的父元素 $P_1，*，*，*)$ 和 $i_1，*，*)$ 也将具有相对较高的潜在得分。因此，如果父元素的潜在得分很低，那么每个子元素都不太可能是根本原因元素，尽管可能有很少的情况，子元素 $a$ 的潜在得分确实高于其父元素，但其他一些子元素 $b$ 的 PV 变化抵消了 $a$ 对父元素潜在得分的影响。因此，如果层 $l$ 中的一个元素不在 $BSet_{l,b}$ 中，HotSpot会选择剪除它的所有子元素。这种方法在思路上与关联规则挖掘中的Apriori原理非常相似[3]。我们称我们的剪枝方法为层次剪枝，因为它的剪枝策略利用了层的层次信息。

我们以表7中的一个例子来说明我们在图5的分层剪枝方法。假设我们在第1层，使用 MCTS 获得的最佳集合是 $BSet_{1,B_P}=\{(Fujian,*),(Jiangsu,*)\}$ 和 $ps(BSset_{1,B_l}=\{(*,Mobile)，(*, Unicom)\}$ 其中， $ps(BSset_{1,B_l}=0.32$ 。在第2层搜索长方体时，由于元素 $(Z h e j i a n g, U n i c o m)$ 和 $(Z h e j i a n g, U n i c o m)$ 的父元素 $(Z h e j i a n g, *)$ 不在第1层的 BSets 中，所以我们对元素 $(Z h e j i a n g, U n i c o m)$ 进行剪枝。因此，我们只需要搜索剩下的四个元素来寻找 $B_{P,I}$ 。这样，潜在集的数量将从 63 减少到 15( $2^6-1$ 到 $2^4-1$ )。然后在第2层再次使用MCTS，得到 $RSet=BSet_{2,B_{P,I}}=\{(Fujian, Mobile),(Jiangsu,Unicom)\}$ ，其中 $ps(BSet_{2,B_{P,I}})=1$ 。

20.5.5 算法总览

我们现在总结我们的总体热点算法，其伪代码如算法1所示。 HotSpot以元素的 PV 值、潜在阈值 $P T$ 和最大迭代次数 $M作为输入。它从第1层开始，对于给定层的每个长方体，Hotspot应用MCTS来找到其最佳集合。当从一层到下一层时，使用分层剪枝。我们重复这个过程，直到搜索到层 $L$ ，或者得到根本原因集 $R s e t (P s (R s e t) > P T)$ 。最终输出的 $R S e t$ 是算法生成的所有 $B S e t$ 中 $P S$ 最大的 $B S e t$ 。

算法步骤描述清晰，代码中还添加了注解，容易理解，这里不复介绍。

20.6 实验部分

论文源码未公开，目前只能在 github 上找到一个相关的代码可以参考一下，https://github.com/junkfei/Multidimensional_root_cause_analysis/tree/4bf4865e8f633e88f3af91f684bbb12ac24d471c

代码并非论文源码，仅供参考。

20.7 总结

论文强调的是如何找到异常原因，并且定位到异常发生根因。这个与我们之前提到的论文均不相同，但这类型的算法是非常有意义的。工业场景下异常发生后除了及时修复问题，减少异常带来的损失，还应该定位到哪个步骤出了问题，并不断总结，优化常常出问题的步骤。

所以如果在其他方向上找不到可以发论文的点，不妨考虑这个方向。

没能找到合适的代码，给各位小伙伴们道歉 ~ 不过希望读者查查资料，了解论文原理，并且想想自己是否可以参考这个思路进行创新，创造属于自己的可靠方法。

Smileyan
2022.11.30 22:57

你可能感兴趣的:(异常检测,深度学习,算法,人工智能)

基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化建库及灾后重建高级实践 weixin_贾防洪评价风险评估滑坡泥石流地质灾害
第一章、ChatGPT、DeepSeek大语言模型提示词与地质灾害基础及平台介绍【基础实践篇】1、什么是大模型？大模型（LargeLanguageModel,LLM）是一种基于深度学习技术的大规模自然语言处理模型。代表性大模型：GPT-4、BERT、T5、ChatGPT等。特点：多任务能力：可以完成文本生成、分类、翻译、问答等任务。上下文理解：能理解复杂的上下文信息。广泛适配性：适合科研、教育、行
DeepSeek API在AutoCAD中的创新应用与挑战 CodeJourney. 数据库算法人工智能
在数字化设计领域，随着人工智能技术的飞速发展，将AI能力融入传统设计软件成为提升设计效率和质量的重要趋势。AutoCAD作为广泛应用的计算机辅助设计软件，与DeepSeekAPI的结合展现出了巨大的潜力。这种融合不仅为设计工作带来了全新的思路和方法，还在多个方面对设计流程进行了优化和创新。一、DeepSeekAPI赋能AutoCAD的多元应用场景（一）智能设计辅助：让创意快速落地在传统设计过程中，
AI 赋能应急管理：ChatGPT、DeepSeek、Grok 的应用探索一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能（AI）技术的快速发展，大语言模型（LLM）在应急管理领域的应用逐步扩大。ChatGPT、DeepSeek、Grok等AI模型凭借强大的文本处理、数据分析和推理能力，可为灾害预警、应急响应、风险评估等提供高效支持。本文将对比三大AI模型在应急管理中的优势，并探讨其在未来智能化应急管理体系中的应用前景。2.应急管理中的核心挑战应
DeepSeek的崛起：2025新春国产AI模型的全球影响力耶耶Norsea 网络杂烩人工智能百度
摘要在2025年新春之际，国产AI模型DeepSeek以现象级的姿态迅速崛起，凭借免费、易用及高性能的特点，吸引了全球科技界的广泛关注。这款大型人工智能模型不仅展现了国产技术的实力，还为用户提供了高效便捷的使用体验，成为行业内的焦点。关键词DeepSeek崛起,2025新春,国产AI模型,免费易用,高性能特点一、国产AI的崭新篇章1.1DeepSeek的诞生背景在2025年新春之际，DeepSee
栈力扣hot100热门面试算法题面试基础核心思路背题滑动窗口最大值字符串解码每日温度柱状图中最大矩形有效的括号最小栈尘土哥算法 leetcode 面试
栈栈的核心思路：每个数都要进栈or队列，但是要及时维护栈or队列，当某元素没有存在的意义时就删掉，关键是思考栈尾什么时候有用与没用。滑动窗口最大值https://leetcode.cn/problems/sliding-window-maximum/题解链接https://leetcode.cn/problems/sliding-window-maximum/solutions/3067170/d
一文说清楚什么是预训练（Pre-Training）、微调（Fine-Tuning），零基础小白建议收藏！！小城哇哇人工智能语言模型 AI大模型大模型微调预训练 agi LLM
前言预训练和微调是现代AI模型的核心技术，通过两者的结合，机器能够在处理复杂任务时表现得更为高效和精准。预训练为模型提供了广泛的语言能力，而微调则确保了模型能够根据特定任务进行细化和优化。近年来，人工智能（AI）在各个领域的突破性进展，尤其是在自然语言处理（NLP）方面，引起了广泛关注。两项重要的技术方法——预训练和微调，成为了AI模型发展的基石。预训练通常是指在大规模数据集上进行模型训练，以帮助
ONE Deep模型：LG AI Research的开源突破耶耶Norsea 网络杂烩自动化
摘要由LGAIResearch开发的ONEDeep系列开源AI模型，参数规模覆盖2.4亿至32亿。经评估，2.4B参数规模的ONEDeep模型在性能上优于同类其他模型，展现出显著优势。这一成果为AI技术的应用与研究提供了强有力的支持。关键词ONEDeep模型,开源AI模型,LGAIResearch,2.4B参数,性能优越一、ONEDeep模型概述1.1ONEDeep模型的开发背景在当今人工智能技术
anythingLLM 使用教程惟贤箬溪穷玩Ai AIGC 人工智能
一、anythingLLM简介anythingLLM是一款灵活且功能强大的语言模型，它基于先进的深度学习架构构建，旨在为用户提供多样化的自然语言处理服务。其设计理念注重通用性和可扩展性，能够适应多种领域和任务，无论是文本生成、智能问答，还是翻译、摘要提取等，都能展现出出色的性能。与同类模型相比，anythingLLM具有训练数据丰富、模型优化程度高的优势，能够生成更符合逻辑、更具实用性的文本内容。
使用OTP动态令牌认证 yangtom249 Python python
为加强网络安全管理，降低帐号被冒用、盗用等带来的风险，有些系统启用OTP手机令牌双因子认证登录，即在原有用户名+密码认证的基础上，增加OTP动态口令认证。基于OTP算法的动态令牌加强了帐号的安全性，简单易用。1、什么是OTP动态令牌认证？OTP（One-TimePassword）是一种基于共享密钥和时间戳算法的一次性密码。一般每30或60秒产生一个新口令，在客户端的动态口令和服务器的动态口令验证时
深度解析大模型推理框架：原理、应用与实践百度_开发者中心人工智能大模型自然语言处理
在当今数据驱动的时代，大模型推理框架已经成为人工智能领域的重要支柱。本文将通过简明扼要、清晰易懂的方式，带领读者深入了解大模型推理框架的原理、应用领域和实践经验，帮助读者更好地掌握这一技术，并在实际工作中发挥其价值。一、大模型推理框架简介大模型推理框架是指一种基于深度学习技术的推理框架，主要用于解决大规模数据集下的复杂问题。该框架通过对海量数据进行高效的训练和推理，能够快速地对各种复杂场景进行分析
大模型推理框架：从理论到实践的全面解析百度_开发者中心人工智能大模型自然语言处理
在数据驱动的时代，深度学习技术已经渗透到各个行业，从图像识别到自然语言处理，从推荐系统到智能客服，其应用无处不在。然而，深度学习模型的训练和推理过程往往涉及大量数据和复杂计算，传统的计算框架难以满足需求。因此，大模型推理框架应运而生，成为解决这一问题的关键。一、大模型推理框架基本概念大模型推理框架是一种基于深度学习技术的推理框架，它通过对海量数据进行高效的训练和推理，能够快速地对各种复杂场景进行分
广州各大IT公司情况调查总结 Monika Zhang 就业面试攻略其他
腾讯微信地址：广东省广州市海珠区新港中路397号TIT创意园B1-B3号使用C语言，C#居多门槛比较高字节跳动广州市天河区珠江东路6号广州周大福金融中心15层01-06室应聘比较注重算法阿里广州市海珠区阅江西路唯品会总部大厦西侧约170米不需要机试，面试难度比较高，注重技术深度，要有一技之长华为广州市黄埔区黄埔东路与红荔西路交叉路口往南约80米需要机试，三道算法题，400分，150分及格，多刷题不
Python基础知识点总结豆芽819 tip python 开发语言
1Python简介Python特点：解释型语言：无需编译，逐行执行。动态类型：变量类型在运行时确定。简洁易读：语法接近自然语言，代码简洁。跨平台支持：Windows/Linux/macOS均可运行。应用领域：Web开发、数据分析、人工智能、自动化脚本等。开发环境：推荐使用IDLE、PyCharm、VSCode或JupyterNotebook。2Python数值运算基本运算符：算术：+,-,*,/,
YOLO算法全面改进指南（二） niuTaylor YOLO改进 YOLO 算法
以下是为YOLO系列算法设计的系统性改进框架，结合前沿技术与多领域创新，提供可支持高水平论文发表的详细改进思路。本方案整合了轻量化设计、多模态融合、动态特征优化等创新点，并给出可验证的实验方向。一、多模态提示驱动的开放场景检测系统1.核心创新三模态提示机制：文本提示编码器：基于RepRTA（可重参数化区域文本对齐）构建轻量级文本编码网络，将自然语言描述映射为128维语义向量。视觉提示编码器：采用S
算法之魂：深入剖析数据结构中的七大排序算法 GeminiGlory 数据结构数据结构排序算法算法
目录1.冒泡排序（BubbleSort）2.选择排序（SelectionSort）3.插入排序（InsertionSort）4.希尔排序（ShellSort）5.快速排序（QuickSort）6.归并排序（MergeSort）7.堆排序（HeapSort）在计算机科学领域，排序是一项基础但至关重要的操作。无论你是处理数据库查询结果还是优化搜索效率，了解不同的排序算法及其适用场景都至关重要。本文将介
LLM-Agent方法评估与效果分析 agent人工智能ai开发
1.引言近年来，随着大型语言模型（LLM）的快速发展，基于强化学习（RL）对LLM进行微调以使其具备代理（Agent）能力成为研究热点。从基础的单智能体强化学习算法（如PPO）到多智能体协作、语料重组以及在线自学习等新技术不断涌现，研究人员致力于探索如何提高LLM在实际应用中的决策能力、推理能力和任务执行效率。本文主要聚焦于当前LLM-Agent方法的检索与评估，旨在全面探讨各类方法的技术实现、实
人工智能和云计算带来的技术变革：工业自动化的新趋势 AI天才研究院 LLM大模型落地实战指南大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能（AI）和云计算技术的发展，我们正面临着一场巨大的技术变革。这些技术正在改变我们的生活方式、工作方式和社会结构。在工业自动化领域，人工智能和云计算技术正在为我们提供新的可能性和挑战。本文将探讨这些技术如何影响工业自动化，以及未来的发展趋势和挑战。1.1人工智能的基本概念人工智能（ArtificialIntelligence，AI）是一种试图使计算机具有人类智能的技术。AI的
《南京日报》专题报道 | 耘瞳科技“工业之眼”加码“中国智造” 耘瞳科技科技
在江宁开发区，机器人已不再是科幻电影里的遥远想象，他们就像人类的“同事”，在工地上忙着贴砖、刷墙、搬运、检测；在体育训练场上帮助运动员矫正姿势；在医院里帮助医生发现帕金森早期征兆，在智慧工厂里与人类分工协作……作为南京市机器人产业“一核多翼”布局的“核”，江宁开发区当前聚集人工智能产业核心及上下游关联企业超百家。近日，《南京日报》走访了多家链条上的“明星企业”，耘瞳科技作为中国领先的智能检测与测量
2017安全之势：云、大数据、IoT、人工智能 weixin_34392906 人工智能大数据嵌入式
“新技术让信息系统变成了孙悟空，开始无所不能，但安全仍是它的‘紧箍咒’！怎样解开这个‘紧箍咒’？各路安全厂商各显其能，但似乎路漫漫兮离目标还很遥远。”三未信安董事长张岳公在ZD至顶网《百位意见领袖寄语2017》中说出了这样一句话，我觉着很有道理。安全是一个永恒的话题，如果说它与新的信息技术相生相克也不过分。即便如此，我们更要尽可能的减少安全带来的束缚。2017已经到来，不妨来看看至顶网与业界大咖总
双一流软件工程大二听闻 Java 前景堪忧，是否该转C++或人工智能或者读研？程序员yt java c++人工智能
今天给大家分享的是一位粉丝的提问，双一流软件工程大二听闻Java前景堪忧，是否该转C++或人工智能或者读研？接下来把粉丝的具体提问和我的回复分享给大家，希望也能给一些类似情况的小伙伴一些启发和帮助。同学提问：yt老师好，我是双一流软件工程的大二学生，一直在学习java方向，目前掌握了数据库，spring框架等内容，大一暑假在老家一个小公司找了段实习，有蓝桥杯java组b组国一，专业排名前2（保研名
编程行业必备！12个热门AI工具帮你写代码~ DevSecOps选型指南人工智能软件供应链安全工具代码安全开发助手 SAST 安全
到今年，AI编程工具的发展已经非常成熟了，它们可以极大地提高开发效率，帮助程序员解决复杂问题，并优化代码质量。拒绝废话，今天给大家推荐12款AI编程工具！1悬镜安全灵脉AI开发安全卫士灵脉AI开发安全卫士是基于多模智能引擎的新一代静态代码安全扫描产品，通过自动化审查流程来定位潜在缺陷、提升审计效率和代码质量，并显著减少手动审查所需的时间和精力。该平台利用人工智能技术，提供逐行的代码反馈，建议改进和
算法刷题记录——LeetCode篇(1) [第1~100题](持续更新) Allen Wurlitzer 实战-算法解题算法 leetcode 职场和发展
更新时间：2025-03-21LeetCode刷题目录：算法刷题记录——专题目录汇总技术博客总目录：计算机技术系列博客——目录页优先整理热门100及面试150，不定期持续更新，欢迎关注！1.两数之和给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案，并且你不能使用两次相同的元素。你可以
LLM 大模型技术知识最佳学习路径图发布！ AGI-杠哥学习人工智能语言模型 agi 自然语言处理
近日，经常有小伙伴私信我，大模型知识太多了，有点懵啊，我该如何学习LLM大模型？今天我们就来剖析下LLM大模型技术知识的学习路径。如果你是一个LLM大模型的“技术小白”，我们建议的学习路径如下：技术交流群前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~我们建了大模型技术与面试交流群
Stacking算法：集成学习的终极武器 civilpy 算法集成学习机器学习
Stacking算法：集成学习的终极武器在机器学习的竞技场中，集成学习方法以其卓越的性能而闻名。其中，Stacking（堆叠泛化）作为一种高级集成技术，更是被誉为“集成学习的终极武器”。本文将带你深入了解Stacking算法的原理和实现，并提供一些实战技巧和最佳实践。1.Stacking算法原理探秘Stacking算法的核心思想是训练多个不同的基模型，并将它们的预测结果作为新模型的输入特征，以此来
集成学习（上）：Bagging集成方法万事可爱^ 机器学习修仙之旅 #监督学习集成学习机器学习人工智能 Bagging 随机森林
一、什么是集成学习？在机器学习的世界里，没有哪个模型是完美无缺的。就像古希腊神话中的"盲人摸象"，单个模型往往只能捕捉到数据特征的某个侧面。但当我们把多个模型的智慧集合起来，就能像拼图一样还原出完整的真相，接下来我们就来介绍一种“拼图”算法——集成学习。集成学习是一种机器学习技术，它通过组合多个模型（通常称为“弱学习器”或“基础模型”）的预测结果，构建出更强、更准确的学习算法。这种方法的主要思想是
直方图梯度提升：大数据时代的极速决策引擎万事可爱^ 大数据机器学习深度学习直方图梯度提升 GBDT 算法
一、为什么需要直方图梯度提升？在Kaggle竞赛的冠军解决方案中，超过70%的获奖方案都使用了梯度提升算法。但当数据量突破百万级时，传统梯度提升树（GBDT）面临三大致命瓶颈：训练耗时剧增：每个特征的分割点计算都需要全量数据排序内存消耗爆炸：存储排序后的特征值需要额外空间处理效率低下：无法有效利用现代CPU的多核特性而梯度提升决策树（GBDT）作为集成学习的代表算法，通过迭代构建决策树实现预测能力
【集成学习】：Stacking原理以及Python代码实现 Geeksongs 机器学习 python 机器学习深度学习人工智能算法
Stacking集成学习在各类机器学习竞赛当中得到了广泛的应用，尤其是在结构化的机器学习竞赛当中表现非常好。今天我们就来介绍下stacking这个在机器学习模型融合当中的大杀器的原理。并在博文的后面附有相关代码实现。总体来说，stacking集成算法主要是一种基于“标签”的学习，有以下的特点：用法：模型利用交叉验证，对训练集进行预测，从而实现二次学习优点：可以结合不同的模型缺点：增加了时间开销，容
Redis 哨兵模式的选举算法是什么？少林码僧 redis sentinel
Redis哨兵模式中的选举算法主要用于在主节点出现故障时，从多个Sentinel节点中选出一个领导者（Leader）来执行故障转移操作。Redis哨兵的选举算法基于Raft算法的简化版本，但不完全等同于标准的Raft算法。以下是其主要过程：一、发现主节点故障当一个Sentinel节点主观地认为主节点不可达时（通常是在一定时间内没有收到主节点的PING回复），它会将主节点标记为主观下线（Subjec
windows使用ssh-copy-id命令的解决方案爱编程的喵喵 Windows实用技巧 windows ssh ssh-copy-id 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了windows使用ssh-copy-
Kafka 的消息压缩机制：优化存储与传输的利器阿贾克斯的黎明 java linq c#java
目录Kafka的消息压缩机制：优化存储与传输的利器一、消息压缩机制的重要意义1.减少存储成本2.提升网络传输效率二、Kafka常用的消息压缩算法1.GZIP压缩2.Snappy压缩3.前端展示压缩状态（Vue3+TS）在消息中间件的大家族中，Kafka以其卓越的性能而备受瞩目。其中，Kafka的消息压缩机制是一项非常重要的特性，它就像是一个高效的“压缩包”，在不损失数据内容的前提下，有效减少数据的
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs