子衿JDD

【论文阅读】MAG：一种用于航天器遥测数据中有效异常检测的新方法

文章目录

- 摘要
- 1 引言
- 2 问题描述
- 3 拟议框架
- 4 所提出方法的细节
- - A.数据预处理
  - B.变量相关分析
  - C.MAG模型
  - D.异常分数
- 5 实验
- - A.数据集和性能指标
  - B.实验设置与平台
  - C.结果和比较
- 6 结论

摘要

异常检测是保证航天器稳定性的关键。在航天器运行过程中，传感器和控制器产生大量周期较长的多维时间序列遥测数据，以及及时准确地检测航天器内部异常的一个关键点是从大量遥测数据中提取基本特征。然而，由于遥测数据内的耦合关系和时间特征复杂，存在巨大的挑战。为了解决这个问题，我们提出了一种称为最大信息系数注意力图网络 (MAG) 的新方法。基本框架是一个图神经网络，它利用嵌入向量来描述每个维度的内在属性，相关性分析来研究长期依赖关系，这是一种用于确定维度之间短期交互的注意力机制，以及长短期记忆 (LSTM) 来提取时间特征。这些模块通过图神经网络的融合导致 MAG 模型的构建，允许对复杂的变量关系和时间特征进行全面分析，从而成功检测各种类型的异常。由于遥测数据具有异构的特点，我们采用了损失函数，设计了一种适用于MAG的无监督异常评分方法。为了验证该算法的有效性，我们使用两个公开的和两个新的可用航天器遥测数据集进行了实验，结果表明我们的算法在检测航天器数据异常方面比其他几种先进的方法更有效、更准确。
关键词：异常检测，异常评分，图神经网络(GNN)，多变量时间序列，航天器遥测数据。

1 引言

由于航天器系统的复杂性和大小，其性能非常重要[1]。特别是，即使是微小的故障也会导致航天器发生灾难性破坏。因此，在开发故障时，航天器系统中异常行为的早期检测对于防止它加剧灾难性故障至关重要。

由于航天器遥测数据的维数相互关系和高维性质的复杂性，传统的建模技术在异常检测方面遇到了挑战。因此，依赖遥测数据的数据驱动方法受到了极大的关注[2]。鉴于异常通常很少见且数量少，仅使用正常遥测数据进行无监督学习以发现固有模式具有更大的价值。仅使用正常遥测数据的异常检测的关键是从多维时间序列数据中提取航天器正常运行状态的基本特征。然而，由于遥测数据之间的相互关系和时间特征复杂，这带来了重大挑战。

针对这一挑战，许多学者提出了各种经典的无监督异常检测模型，该模型在各个领域都表现出了优异的性能。这些包括局部离群因子(LOF)[3]、单类支持向量机(OC-SVM)[4]和支持向量数据描述(SVDD)[5]等[6]。此外，传统的机器学习方法不足以解决处理高维和大规模数据的挑战。随着人工智能的发展，深度学习越来越多地解决了这个问题[7]。例如，Su等人[8]和Song等人[9]分别提出了基于GRU-VAE和ST-GAN的异常检测方法。这些方法在公共可用数据集上表现出可靠的性能。

然而，前面提到的那些主要是为具有平移不变性的欧氏域数据设计的，而遥测数据更好地映射到非欧氏域数据，如图结构[10]。出于这个原因，图神经网络非常适合遥测数据，其中图节点代表检测窗口内变量的特征，图边描述维度之间的相关性。事实上，Deng等人[11]提出了一种基于偏差得分的异常检测算法，Xie等人[12]提出了一种结合小波变换和图神经网络的异常检测方法，两者在工业数据集上都表现出了令人称道的性能。

尽管如此，上述方法并不完全适合我们的问题。在复杂、多维和时间敏感的遥测数据的情况下，准确捕获每个检测窗口内每个变量的内在和时间特征至关重要，同时广泛检查它们复杂的非线性相互依赖性。此外，遥测数据表征了长周期属性，使得仅依靠短期窗口来提取相关能力的方法是不够的。此外，从航天器系统获得的遥测数据包含两个异构数据类型:模拟变量和状态变量(模拟变量是连续的，状态变量是二进制的)，这使得单个损失函数不充分。

基于上述分析，本文提出了一种新的图神经网络框架。每个变量的内在和时间特征被表示为节点，而短期窗口内的长期关联分析和注意力被描述为边。最终，整个图结构都经过更新，最终实现异常检测过程。我们工作的主要贡献和优点如下。

1）本文旨在从三个方面表示遥测数据检测窗口中的有效特征：利用嵌入向量来描述每个维度的属性，使用图结构展示维度之间的关系，使用 LSTM 提取时间特征，并通过图神经网络融合各种组件。
2）为了考虑遥测数据的长周期，本文采用最大信息系数（MIC）来研究变量的长期关系，一种注意力机制来捕获窗口的短期关联，并最终结合这两种方法来构建图中表示关联的边。
3)本文解决了遥测数据的异质性以及边缘融合构造的特点，提出了一种新的损失函数。此外，还设计了一个适合网络结构的阈值分数。

本文的其余部分安排如下。第 II 节描述了航天器系统遥测数据异常检测的问题。第 III 节介绍了我们异常检测方法的总体框架。第四节详细描述了所提出的最大信息系数注意图网络(MAG)算法。实验结果报告在第 V 节中。最后，第六节对文章进行了总结。

2 问题描述

航天器遥测数据的类型可分为模拟变量（例如压电电压、加速度量）和状态变量（例如模块控制命令）。异常通常被指示为遥测数据中多个遥测变量的离群值或子序列，包括点异常、形状异常、趋势异常、上下文异常和多重集合异常。在图1(a)中，变量之间的期间存在不一致。特别是变量1的期间较长，可能超过用于检测的窗口长度。这个特性也突显了仅在检测时间窗口长度内分析相关性的不足。因此，必须对整个序列进行关联分析。由模拟变量和状态变量组成的异常如图1(b)所示。状态1到状态4是由控制台发送或接收的命令。在异常期间，由地面测试人员主动输入错误的模块命令得到的模拟变量观察到趋势异常和点异常。

实现实时异常检测的方法包括利用滑动窗口数据对多元时间序列进行实时预测，然后确定预测结果是否与观测值有较大的偏差。如果偏差太大，则预测被认为是异常的。将X={x(1),x(2),…,x(T)}定义为原始时间序列，该时间序列的时间跨度为T，将x^(T+1)定义为该时间序列在模型之后的时刻T+1的预测值，并将x(T+1)定义为在时刻T+1的真实遥测值，则其是否为异常可以用以下表达式表示：

其中‖·‖表示计算ˆx(T+1)和x(T+1)偏差的规则，τ是预定义的异常阈值。^x(T +1) 和 x(T +1) 之间的偏差越大，x(T +1) 的异常概率越高。如图1中的数据异常所示，问题的关键是找到数据的时间和变量相关性。我们提出了模型 MAG 来解决这个问题并预测 ^x(T +1)，并提出了一种新的公式来找到阈值 τ。

3 拟议框架

所提出的 MAG 框架旨在捕获遥测数据变量之间的相关性和时间特征，将它们集成到图中。随后，该框架利用来自图的聚合更新来预测未来的变量结果，并通过将它们与观测值进行比较来检测异常。
所提出框架的整体结构如图2所示。它由以下四个主要部分组成。
1)变量相关分析：利用MIC算法对航天器系统得到的遥测数据进行分析，得到相关系数矩阵，反映正常工况下变量之间的相关性。
2)时间分析和注意机制：数据经过滑动窗口分割。LSTM用于从窗口时间序列中提取时间特征，同时使用嵌入向量来捕获每个维度的固有属性。利用注意机制得到注意系数矩阵。
3)图聚合:将相关系数矩阵和注意系数矩阵整合为边，将时间特征节点和嵌入向量作为节点特征构建图。随后，整个网络通过迭代过程聚合和更新。
4) 异常评估：最终，MAG 网络预测下一个变量值并将其与观察值进行比较，生成错误分数。然后使用该分数来确定异常的存在。

4 所提出方法的细节

A.数据预处理

对多变量遥测数据进行分区对于实时计算是必不可少的，这需要建立实时计算检测窗口。首先，拆分多变量遥测数据 Φ ⊂ RT ×N。数据的总长度为 T，由 N 个变量组成，一组训练数据表示为 Φtrain ⊆ RT1×N ，一组测试数据表示为 Φtest ⊆ RT2 ×N。请注意，训练数据集中的所有数据点都必须正常。

接下来，训练数据集 Φtrain ⊆ RT1×N 被分割成一系列子序列 Xtrain = {Xi train, i = 1, 2,。, m} ⊆RSw ×N 通过滑动窗口，其中 Xitrain 表示当窗口大小设置为 sw 时 Xt−sw :t。给定步长 st，子序列的数量可以通过 m = (T1−sw)/st + 1 计算。类似地，测试数据集 Φtest ⊆ RT2 ×N 被划分为子序列 Xtest = {Xjtest, j = 1, 2,。, n} 通过滑动窗口，其中 n = (T2−sw)/st + 1。为了验证目的，测试数据集中的每个点都标有二进制数（0 表示正常，1 表示异常）。

B.变量相关分析

由于遥测变量的周期性质不一致，数据检测窗口不能覆盖整个周期。在滑动数据窗口之前，需要对原始训练数据进行相关性分析。MIC [13] 是一种测量两个变量之间相关性的有效方法。

对于给定的训练数据集 Φtrain ⊆ RT1×N ，对于任意两个具有 T1 元素的离散变量，A = {ai | i = 1, 之间的 MIC 值。, T1} 和 B = {bi | i = 1,., T1} 可以通过以下等式获得：

其中 p(a, b) 是变量 a 和 b 的联合概率密度，p(a) 和 p(b) 分别是由直方图估计方法计算的变量 a 和 b 的边际概率密度。

对于有限集 D = {(ai, bi)，i = 1,。, n}，给定一个网格 G，我们可以将 D 的 ai 值划分为 bin，将 D 的 bi 值划分为 b bin。MIC 由下式给出

最大信息系数是特征矩阵中获得的最高归一化 MI 值。其中ω(1) < B(T1) < O(T 1−ε1)和0 < ε < 1。一般来说，当B(T1) = T 0.6 1时，MIC在实践中效果很好。计算后，可以得到N个遥测变量与相关矩阵M之间的MIC值。mij 表示遥测变量 i 和遥测变量 j 之间的相关性，其值在 0 到 1 之间。

C.MAG模型

在训练阶段，时间窗口内的每个遥测变量都表现出时间和内在属性特征。使用嵌入向量表示每个遥测变量的内在属性，从而实现后续反馈、性能差异和更新。此外，注意力机制可用于更有效地表达窗口内变量之间的关系。因此，我们为每个遥测变量引入一个嵌入向量来表示其特征vi∈Rd，对于i∈{1，2，。, N }。这些嵌入是随机初始化的，然后与模型的其余部分一起训练。这些嵌入 vi 之间的相似性代表了遥测变量的内在属性。

在 MAG 模型中，对于 Xtrain 或 Xtest 的子序列组合，将模型输入定义为历史子序列数据 x(t) := [x(t−w)， x(t−w+1)。, x(t−1)] 对于在时间 t 的大小为 w 的滑动窗口。注意系数αi,ji的计算如下:

在计算注意系数αi,j后，结合相关系数mij形成每条边eij，构造邻接矩阵E

在边的构建之后，我们使用 LSTM 技术来提取时间关联特征。x(t) 受到 LSTM 网络以提取时间特征。时间特征可以通过 LSTM 网络提取，表示为

最后，利用图神经网络来整合子序列内的时间和空间关联。构建的图模型利用前面提到的 ei,j 来形成邻接矩阵。时间特征 y(t) 用作图神经网络的输入，能够从每个节点及其邻居聚合和更新信息，最终生成节点 i 的输出表示为 z(t)i，如下所示：

其中 y(t)i ∈ Rw 是节点 i 的时间输入特征，N (i) ={j | eij > 0} 是节点 i 的邻居集，W ∈ Rd×wi 是每个节点的共享线性变换的可训练权重矩阵。

从上面的特征提取器中，我们得到所有 N 个节点的表示为 {z(t)1 ,。, z(t)N }。对于每个 z(t)i ，我们将其乘以嵌入 vi 的相应时间序列的继续元素（表示为 ◦）。然后，我们使用所有节点的结果作为输出维度为 N 的堆叠全连接层的输入来预测时间步 t 的遥测值向量

模型的预测输出表示为 ^x(t)。我们将第二节中描述的模拟变量和状态变量分别表示为 x(t)a 和 x(t)s。考虑到这两种类型的异质性，采用了不同的损失函数。模拟变量利用均方误差，最小化预测输出ˆx(T)a与观测数据x(T)a之间的差异。另一方面，对于状态变量，使用了二元交叉熵损失。为了减轻过度拟合并确保滑动窗口内最终边缘的适当大小，我们引入了一个约束项。该术语考虑了相应图 [14] 的非循环性，并结合了相关分析的结果。最终的损失函数如下：

其中 λ 和 c 表示拉格朗日乘数和惩罚参数，并通过增广拉格朗日方法 [15] 求解。Ns表示状态变量的维数，Na表示模拟变量的维数。MAG的网络结构如图3所示。

D.异常分数

在通过网络获得图形结构之后，检测偏离正常模式的异常是下一步。该模型通过为每个遥测计算单独的异常值，然后将它们合并为每个时间戳的单个异常值来实现这一点。由于我们的检测算法选择了基于MAG的模型，因此还需要根据该模型的特征专门设计异常值确定规则。异常分数比较时刻t的预期行为与观察到的行为，并计算时刻t与真实遥测值之间的误差值Err(t)

为了防止任何一个遥测值产生比其他遥测值过高的偏差，我们对每个遥测值的误差值Err(t)进行归一化，得到a(t)。

在阈值选择部分，为了避免引入额外的超参数，我们在实验中提出了一种计算方便的方法。通过计算训练集上每个时间戳的偏差atrain(t)，我们可以通过以下等式计算阈值以获得:

其中 cv 是变异系数，它是遥测数据中变化程度的统计度量。̃μ 和 ̃σ 分别是值 atrain(t) 的中值和四分位数范围 (IQR)。我们使用中位数和 IQR 而不是变异系数所需的均值和标准差，因为它们不假设数据分布，并且对模型的异常分数更稳健。最后，如果测试集的Err(t)超过任何固定阈值τ，则标记为异常的时间tis。

许多已发表的异常检测算法[16]使用3σ算法和峰阈值(POT)算法来挖掘阈值τ。POT是一种使用极值理论的阈值挖掘方法，假设时间序列中的峰值满足广义帕累托分布(GPD)。然而，当数据的分布特性与GPD不一致时，POT方法的适用性可能会受到限制。对于航天器系统的遥测数据，下一部分的实验表明我们的方法更具适应性。
基于MAG的模型算法的过程如算法1所示。

5 实验

A.数据集和性能指标

我们在两个新的遥测数据集和两个公共数据集上进行了实验。两个新的数据集 SCC-1 和 SCC-2 来自两个不同卫星系统的遥测数据。NASA为土壤水分主动被动(SMAP)卫星和火星科学实验室(MSL)漫游[17]提供了两个公共遥测数据集。四个数据集的详细信息如表 I 所示。
对于这些数据集，正常数据点标记为0，异常值标记为1。然后，将10%的训练数据集划分为验证数据集。请注意，训练数据集仅包含正常时间序列。我们使用常用的指标来评估我们提出的 MAG 算法的性能，即 Precision、Recall 和 F1 分数


其中 TP 是预测的实际异常的数量，FP 是假阳性样本的数量，FN 是假阴性样本的数量。

B.实验设置与平台

在数据预处理阶段，我们设置窗口大小 w = 50 和步长 st = 1，然后将原始时间序列拆分为所需的子序列。在网络结构中，我们将嵌入向量维度设置为128，并将隐藏层设置为128。我们利用学习率为1 × 10−3的Adam优化器[18]来训练模型。我们使用了一种广泛使用的调整策略[19][20]：如果连续异常段中的某个时间点被检测到，那么该段中的所有异常都被认为被正确检测到。基于异常时间点会引发警报，并进一步使整个段在现实应用中被注意到的观察，这种策略是合理的。我们使用CUDA 11.6和PyTorch几何库[22]，在PyTorch [21]版本1.9.1中实现了我们的方法和其变体。我们将训练模型设置为100个周期，并将早期停止设置为10。为了获得可靠的结果并减少训练阶段的随机性，样本被分别训练和测试了十次，然后计算了性能指标的标准偏差。最后，我们的算法在配备Intel® Xeon® CPU E5-2690 v4 @ 2.60 GHz和NVIDIA RTX 3090显卡的服务器上进行训练和测试。

C.结果和比较

1）窗口大小：为了确定适当的窗口大小 Sw，我们通过选择部分小数据集在三个数据集上进行了实验。窗口大小设置为 20、30、50、80、100、150 和 200。
四个数据集的 F1 分数如图 4 所示。选择过长窗口会导致冗余信息、响应缓慢和计算复杂度增加。相反，选择太短的窗口长度将导致时间特征的捕获不足，导致稳定性不足。四个小数据集的实验结果表明，窗口大小为 50 是最优的。

2)基线比较：为了展示我们提出的算法的有效性，我们对其性能与其他基准无监督异常检测算法进行了比较分析。其中包括基于深度学习的模型，如AnomalyTransformer[19]、ST-GAN[9]、InterFusion[23]、GDN[11]和GRU-VAE[8];基于聚类的技术，如Deep-SVDD[24];以及OC-SVM[25]和IsolationForest[26]。值得注意的是，STGAN 和 AnomalyTransformer 代表最复杂的深度模型。我们在SCC-1、SCC-2、SMAP和MSL数据集上进行十轮评估，得出平均精确度、召回率和F1分数的结果。四种算法的比较结果如表II所示。
根据表 II，我们的方法在所有四个数据集上都获得了最高的 F1 分数，证明了平衡误报率和漏报率的最佳性能。此外，我们的方法在 SCC-1 和 SMAP 数据集上的召回率方面表现出最令人满意的结果，这表明在这两个数据集上产生误报的可能性最小。
3）消融比较：为了研究我们方法的每个组件的必要性，我们逐渐排除和替换这些组件并监控模型性能如何下降。实验结果如表III所示。
为了比较边缘机制的有效性，我们通过消除相关性分析或注意力机制进行了单独的实验。实验结果表明，这两种机制的融合产生了最有利的结果，因为相关分析后注意力机制的引入有效地提高了模型的适应性。然而，仅依靠注意力机制和窗口内的数据不足以有效捕捉长时间相关性和依赖性的程度。

此外，我们使用 Pearson 和 Spearman 方法 [27] 来比较相关性。实验结果表明，MIC 优于 Pearson 和 Spearman 相关系数。这种差异的出现是因为 Pearson 和 Spearman 相关系数假设线性相关，导致分析非线性关系时不准确。相反，MIC 不依赖于这样的假设，并且可以准确地捕获扩展周期内的线性和非线性相关性。

关于时间关系分析，我们使用消融实验比较了线性、RNN 和 GRU 层连接 [28]。研究结果表明，使用网络层或线性层会导致效率较低，这主要是由于无法提取时间特征。相比之下，结合 RNN、GRU 或 LSTM 的层连接会产生更有效的发现。具体来说，LSTM 具有比 GRU 和 RNN 更复杂和更稳健的结构，可以更好地控制信息流并实现长期依赖关系捕获。因此，LSTM 可以提取优越的时间特征，从而获得更好的结果。

关于损失函数，我们应用了均方误差（MSE）和均绝对误差（MAE）[29]，并将它们与我们的方法进行了比较。实验结果表明，针对两种不同类型的数据采用两种混合损失函数可以显着提高模型的效率。

4)阈值比较：我们还评估了阈值 τ 对四个数据集的 F1 分数的影响。如图 5 所示，当阈值太小时，召回值会很低，导致 F1 分数降低。虽然如果阈值设置得太高，精度值会减小，导致 F1 分数下降。因此，适当地设置阈值以确保最佳 F1 分数至关重要。

我们对两种阈值方法进行了比较：基于高斯分布的 3σ 阈值和极值理论阈值 (EVT)。这些阈值对四个测试数据集的 F1 分数的影响如图 5 所示。结果表明，随着阈值 (τ) 的增加，F1 分数最初达到峰值，然后下降。我们提出的阈值方法非常接近通过穷举搜索获得的最佳阈值，从而证明了我们的异常阈值确定规则的有效性。这可能是因为 3σ 阈值和 EVT 方法都假设先验分布不适用于遥测数据。相反，我们的方法使用利用中值和四分位范围的公式，更稳健，不受数据分布形状的影响。

6 结论

本文提出了一种基于MAG结构模型的遥测数据异常检测算法。具体来说，该算法构建了一个图结构模型，使用嵌入向量描述每个维度的内在属性，进行相关性分析以研究长期依赖关系，通过注意力机制确定各维度之间的短期相互作用，并使用LSTM提取时序特征。最后，通过图神经网络融合这些模块，该模型有效地整合了这些序列的维度和时间特征之间的耦合关系，从而能够成功检测各种类型的异常。为了确定异常，引入了适应网络结构的异常分数。

为了确定我们提出的异常检测算法的有效性和优越性，我们在四个真实的遥测数据集上进行了实验，并将我们的方法与其他最先进的算法进行了比较，取得了最佳结果。此外，消融实验进一步证明了我们模型组件的有效性。与其他广泛使用的技术相比，我们提出的异常阈值表现出更高的准确性，并非常接近最佳阈值。

然而，虽然不影响实时异常检测的效率，但在相关分析计算过程中，计算成本随着数据量的增加而增加，保证了MIC计算效率的优化。此外，研究更多用于各种异常类型的基于 MAG 的异常检测算法并推进故障诊断提出了有前景的研究课题。

没代码

CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读 Laughing-q 论文阅读深度学习人工智能目标检测实例分割 transformer
CBNetV2:ACompositeBackboneNetworkArchitectureforObjectDetection论文阅读介绍方法CBNetV2融合方式对Assistant的监督实验与SOTA的比较在主流backbone架构上的通用性与更宽更深的网络比较与可变形卷积的兼容在主流检测器上的模型适用性在SwinTransformer上的模型适用性消融实验paper：https://arxi
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT s1ckrain 计算机视觉论文阅读计算机视觉人工智能
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题：SAM是一个基于大规模数据预训练的强大提示框架，推动了分割领域的发展。尽管SAM具有通用性，但在无需人工提示的情况下，针对特定视觉概念（如自动分割用户宠物狗）的定制化研究尚不充分。方法提出：提出了一种无需训练的SAM个性化方法，称为PerSAM。仅需单次数据（一张带参考掩码的图像），即可在新
GS-SLAM论文阅读笔记-MGSO zenpluck GS论文阅读论文阅读笔记
前言MGSO首字母缩略词是直接稀疏里程计(DSO)，我们建立的光度SLAM系统和高斯飞溅(GS)的混合。这应该是第一个前端用DSO的高斯SLAM，不知道这个系统的组合能不能打得过ORB-SLAM3，以及对DSO会做出怎么样的改进以适应高斯地图，接下来就看一下吧！GishelloG^s_ihelloGishello我是红色文章目录前言1.背景介绍2.关键内容2.1SLAMmodule2.2Dense
联邦学习算法安全优化与可解释性研究智能计算研究中心其他
内容概要本研究围绕联邦学习算法的安全性优化与模型可解释性增强展开系统性探索。首先，针对联邦学习中数据隐私泄露与模型性能损耗的固有矛盾，提出一种融合差分隐私与动态权重聚合的协同优化框架，通过分层加密机制降低敏感信息暴露风险。其次，引入可解释性算法（如LIME与SHAP）构建透明化决策路径，结合注意力机制实现特征贡献度的可视化映射，有效提升模型在医疗影像异常检测与金融欺诈识别场景中的可信度。此外，研究
【论文阅读】MMedPO：用临床感知多模态偏好优化调整医学视觉语言模型勤奋的小笼包论文阅读语言模型人工智能自然语言处理 chatgpt
MMedPO：用临床感知多模态偏好优化调整医学视觉语言模型1.背景2.核心问题：3.方法：3.实验结果与优势4.技术贡献与意义5.结论MMedPO:AligningMedicalVision-LanguageModelswithClinical-AwareMultimodalPreferenceOptimizationMMedPO：用临床感知多模态偏好优化调整医学视觉语言模型gitgub:地址1.
机器学习之KMeans算法知舟不叙机器学习算法 kmeans
文章目录引言1.KMeans算法简介2.KMeans算法的数学原理3.KMeans算法的步骤3.1初始化簇中心3.2分配数据点3.3更新簇中心3.4停止条件4.KMeans算法的优缺点4.1优点4.2缺点5.KMeans算法的应用场景5.1图像分割5.2市场细分5.3文档聚类5.4异常检测6.Python实现KMeans算法7.总结引言KMeans算法是机器学习中最经典的无监督学习算法之一，广泛应
医图论文 CVPR‘24 | 适应医学图像中泛化异常检测的视觉-语言模型小白学视觉医学图像处理论文解读语言模型人工智能计算机视觉医学图像顶会医学图像处理 CVPR 论文解读
论文信息题目：AdaptingVisual-LanguageModelsforGeneralizableAnomalyDetectioninMedicalImages适应医学图像中泛化异常检测的视觉-语言模型作者：ChaoqinHuang，AofanJiang，JinghaoFeng，YaZhang，XinchaoWang，YanfengWang源码：https://github.com/Medi
论文阅读：Deep Stacked Hierarchical Multi-patch Network for Image Deblurring 行走的歌文献阅读图像处理计算机视觉机器学习深度学习图像去雨图像处理
这是一篇去模糊的文章，后来发现直接套用不合适，无法获取到相应的特征，遂作罢，简单记录一下。2019CVPR：DMPHN这篇文章是2019CVPR的一篇去模糊方向的文章，师兄分享的时候看了一下，后来也发现这个网络结构在很多workshop以及文章中都见过。文章：ArXiv代码：Github在去模糊领域，目前的多尺度和尺度循环模型存在一些问题：1)由粗到细方案中的去卷积/上采样操作导致运行时间昂贵;2
DeepSeek在智慧物流管控中的全场景落地方案猴的哥儿笔记大数据交通物流 python 数据仓库微服务
一、智慧物流核心痛点与DeepSeek解决方案矩阵物流环节行业痛点DeepSeek技术方案价值增益仓储管理库存预测误差率>30%多模态时空预测模型库存周转率↑40%运输调度车辆空驶率35%强化学习动态调度引擎运输成本↓25%路径规划突发路况响应延迟>30分钟实时路况语义理解+自适应规划准时交付率↑18%异常检测50%异常依赖人工发现多传感器融合的异常模式识别异常发现时效↑6倍客户服务50%咨询需人
Python物联网与传感器数据分析 master_chenchengg python python 办公效率 python开发 IT
Python物联网与传感器数据分析开场白：连接物理世界与数字宇宙物联网的魅力：让物体开口说话Python：编织万物互联的魔法传感器：感知世界的触角数据捕获：从现实世界到数字领域传感器类型概览：温度、湿度、光照及其他Python与硬件接口：树莓派的奇妙旅程实时数据流：如何捕捉每一刻的变化数据处理：挖掘数字宝藏的秘密数据清洗：让数据焕发光彩数据分析：揭秘模式与趋势异常检测：识别噪声与干扰可视化展示：讲
【论文阅读方法】沐神课程：如何读论文晴空对晚照论文阅读论文阅读
一篇论文的一般结构titleabstractintroductionmethodexperienceconclusion三明治论文阅读法第一遍：海选title+abstract+conclusion——确定要不要读第二遍：精读对整个文章过一遍，知道每一块在做什么可以从标题开始读到最后，注意不用咬文嚼字，不要太细节，公式、证明等很细节的部分可以忽略掉重点弄清楚每一个图表，算法在做什么，x轴y轴每一个
论文阅读笔记——QLORA: Efficient Finetuning of Quantized LLMs 寻丶幽风论文阅读笔记论文阅读笔记人工智能深度学习语言模型
QLoRA论文4-bit标准浮点数量化常见的量化技术是最大绝对值量化：XInt8=round(127absmax(XFP32)XFP32)=round(cFP32,XFP32)式(1)X^{Int8}=round(\frac{127}{absmax(X^{FP32})}X^{FP32})=round(c^{FP32},X^{FP32})\qquad\qquad\text{式(1)}XInt8=ro
数据挖掘技术介绍柒柒钏数据挖掘数据挖掘人工智能
数据挖掘技术介绍分类聚类关联规则挖掘预测异常检测特征选择与降维文本挖掘序列模式挖掘深度学习集成学习数据挖掘（DataMining）是一种从大量数据中提取有用信息和模式的技术，旨在从数据中发现隐藏的规律、趋势或关系，从而为决策提供支持。分类定义：是一种监督学习方法，用于将数据分为不同的类别。功能：根据已标记的训练数据，学习一个模型，用于预测新数据的类别。方法：决策树、支持向量机、神经网络、逻辑回归、
全面解析RRU软件可测性设计引入AI算法的实践 youngerwang 测试验证之禅道射频移动 python pytorch 信息与通信集成测试测试覆盖率开源
文章目录全面解析RRU软件可测性设计引入AI算法的实践本文概要整体架构流程一、引言二、具体思想点2.1智能测试用例生成2.2异常检测与定位三、落地要求3.1数据基础3.2算法与模型3.3系统集成四、检查评估项4.1测试用例生成评估4.2异常检测与定位评估5AI算法设计和框架应用5.1.算法设计思路5.2.模型设计5.3.用例设计训练数据准备模型训练全面解析RRU软件可测性设计引入AI算法的实践本文
基于 DeepSeek 的自动化运维（适合企业降本增效） Real Man★ 运维自动化
基于DeepSeek的自动化运维解决方案DeepSeek凭借其强大的AI能力（如自然语言处理、时序预测、异常检测），可显著提升运维效率，实现从监控告警到故障自愈的全流程自动化。以下是结合企业级场景的实战方案：一、核心应用场景与实现路径智能监控与告警日志分析：使用DeepSeek-NLP模型自动解析日志，提取关键错误模式（如OutOfMemory、Timeout）。python复制fromdeeps
论文阅读：Personalized Purchase Prediction of Market with Wasserstein-Based Sequence Matching Narcissus`小暮一步步来学大数据推荐系统
PersonalizedPurchasePredictionofMarketwithWasserstein-BasedSequenceMatching概述问题背景及陈述预测算法步骤一：itemembeddings步骤二：计算wassersteinDistance步骤三：Wasserstein-BasedDynamicTimeWarping预测实验评价标准数据集对比的baseline结论市场篮子的应
论文阅读笔记：Graph Matching Networks for Learning the Similarity of Graph Structured Objects 游离态GLZ不可能是金融技术宅知识图谱机器学习深度学习人工智能
论文做的是用于图匹配的神经网络研究，作者做出了两点贡献:证明GNN可以经过训练，产生嵌入graph-leve的向量可以用于相似性计算。作者提出了一种新的基于注意力的跨图匹配机制GMN(cross-graphattention-basedmatchingmechanism)，来计算出一对图之间的相似度评分。（核心创新点）论文证明了该模型在不同领域的有效性，包括具有挑战性的基于控制流图(control
论文阅读 EEG-TCNet Plan-C- 论文阅读
EEG-TCNet:AnAccurateTemporalConvolutionalNetworkforEmbeddedMotor-ImageryBrain–MachineInterfaces1.Intrduction本文提出了一种新颖的时间卷积网络（TCN），在需要很少的可训练参数的情况下实现了出色的精度。EG-TCNET成功地推广了单个数据集，通过0.25的元效应优于MOABB的当前最新技术水平
论文阅读《Semantic Stereo Matching with Pyramid Cost Volumes》 cunese0088 深度学习
SSPCV-Net（语义立体匹配网络）目的：进一步捕捉视差的细节主要模块：数据集：SceneFlow,KITTI2012,KITTI2015,Cityscape(比较泛化能力)-------------------------------------------------------------------------------------------------------Concatevo
论文阅读笔记——π0: A Vision-Language-Action Flow Model for General Robot Control 寻丶幽风论文阅读笔记论文阅读笔记人工智能机器人语言模型
π0论文π0π_0π0是基于预训练的VLM模型增加了actionexpert，并结合了flowmatching方法训练的自回归模型，能够直接输出模型的actionchunk（50）。π0采用FlowMatching技术来建模连续动作的分布，这一创新使模型能够精确控制高频率的灵巧操作任务，同时具备处理多模态数据的能力。架构受到Transfusion的启发：通过单一Transformer处理多目标任务
【论文阅读】Learning Transferable Visual Models From Natural Language Supervision（2021） Bosenya12 论文阅读
摘要State-of-the-art（最先进的）computervisionsystems（计算机视觉系统）aretrainedtopredictafixedsetofpredeterminedobjectcategories（被训练来预测一组固定的预定对象类别）.Thisrestrictedformofsupervision（受限制的监督形式）limitstheirgenerality（通用性）
InternVL：论文阅读 -- 多模态大模型(视觉语言模型) XiaoJ1234567 LLM 论文阅读语言模型人工智能多模态大模型 internVL
更多内容：XiaoJ的知识星球文章目录InternVL:扩展视觉基础模型与通用视觉语言任务对齐1.概述2.InternVL整体架构1）大型视觉编码器：InternViT-6B2）语言中间件：QLLaMA。3）训练策略（1）第一阶段：视觉-语言对比训练（2）第二阶段：视觉语言生成训练（3）第三阶段：监督微调（SFT）3.InternVL应用1）对于视觉感知任务2）对于对比任务3）对于生成任务4）对于
数据挖掘导论Pangaea-Ning Tan 读书笔记——（第一，二，三章）小黄人的黄数据挖掘数据挖掘
《数据挖掘导论》Pang-NingTan，MichaelSteinbach，VipinKumar读书笔记，第一章绪论数据挖掘任务预测任务描述任务分类任务回归任务聚类分析关联分析异常检测章节导读数据挖掘数据处理第2章第3章分类第4章决策树过拟合性能评估等第5章
Java 大视界 -- Java 大数据中的时间序列数据异常检测算法对比与实践（103）青云交大数据新视界 Java 大视界 java 大数据算法时间序列分析异常检测孤立森林 LSTM
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
论文阅读-秦汉时期北方边疆组织的空间互动模式与直道的定位（中国） MilkLeong 论文阅读空间计算
论文英文题目：AspatialinteractionmodelofQin-HanDynastyorganisationonthenorthernfrontierandthelocationoftheZhidaohighway(China)发表于：journalofarchaeologicalscience，影响因子：3.030论文主要是使用空间互动模型来对秦汉时期的北方边疆直道进行定位和重建。分析
基于DeepSeek的智能数据分析和自动化处理系统：引领BI行业新变革招风的黑耳数据分析
近期，一款基于DeepSeekAPI的智能数据分析和自动化处理系统横空出世，以其强大的功能和灵活的可扩展性，为BI行业带来了颠覆性的变革。该系统支持多类型数据分析，包括文本、指标和日志等。在文本分析方面，它能够提取关键信息，如人名、地名、时间等，帮助用户快速把握文本要点。同时，系统还能进行情感分析和紧急程度评估，为用户提供更加深入的文本洞察。在指标分析上，系统擅长统计分析、异常检测和趋势预测，助力
论文阅读笔记——Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware 寻丶幽风论文阅读笔记论文阅读笔记人工智能深度学习机器人
ALOHA论文ALOHA解决了策略中的错误可能随时间累积，且人类演示可能是非平稳的，提出了ACT（ActionChunkingwithTransformers）方法。ActionChunking模仿学习中，compoundingerror是致使任务失败的主要原因。具体来说，当智能体（agent）在测试时遇到训练集中未见过的情况时，可能会产生预测误差。这些误差会逐步累积，导致智能体进入未知状态，最终
【论文阅读】LayoutPrompter: Awaken the Design Ability of Large Language Models 进击的乔洋论文阅读语言模型人工智能
LayoutPrompter:AwakentheDesignAbilityofLargeLanguageModelsabstract条件图形布局生成是一种自动将用户约束映射为高质量布局的技术，目前受到了广泛关注。尽管最近的工作取得了很好的性能，但缺乏通用性和数据效率阻碍了它们的实际应用。本文提出Layout-Prompter，利用大型语言模型(llm)通过上下文学习来解决上述问题。LayoutPr
论文阅读方法某风吾起 work 哲学与人生论文阅读
文章目录步骤一：对论文进行自我判断阅读题目和关键词。阅读摘要阅读总结要点步骤二：阅读文章阅读图表和图表的注释阅读引言阅读实验部分阅读结果和作者对结果的讨论（创新点）要点步骤三：精度论文回答问题1回答问题2回答问题3要点步骤一：对论文进行自我判断阅读题目和关键词。观察这些关键词是否与你的研究的内容有关。如果不相干，可以随时停止，换篇文章看。阅读摘要摘要一般包含了整篇文章的主要内容，是非常非常重要的部
论文阅读：Recipe for a General, Powerful, Scalable Graph Transformer 不会&编程图神经网络论文阅读论文阅读 transformer 深度学习图神经网络人工智能
RecipeforaGeneral,Powerful,ScalableGraphTransformer论文和代码地址1介绍与贡献2GPS模型2.1模型框架图2.2PE和SE2.3GPSlayer:一种MPNN+Transformer的混合模型GraphTransformer)论文和代码地址论文地址：https://arxiv.org/pdf/2205.12454v4代码地址：https://git
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f