C00per_

【论文阅读】NoDoze：使用自动来源分类对抗威胁警报疲劳（NDSS-2019）

NODOZE: Combatting Threat Alert Fatigue with Automated Provenance Triage

伊利诺伊大学芝加哥分校
Hassan W U, Guo S, Li D, et al. Nodoze: Combatting threat alert fatigue with automated provenance triage[C]//network and distributed systems security symposium. 2019.

0. 摘要
1. 引言
2. 背景和动机
- A. 攻击实例
- B. 现有工具的局限性
- C. 目标
3. NODOZE 概述和方法
4. 威胁模型和假设
5. 问题定义
- A. 定义
- B. 问题描述
6. 算法
- A. 道路地图
- B. 异常分数传播
- C. IN 和 OUT 分数计算
- D. 异常评分归一化
- E. 路径融合
- F. 决策
- G. 时间复杂度
7. 实现
- A. 事件频率库
- B. 警报分类和图构建
- C. 可视化模块
8. 评估

0. 摘要

威胁警报疲劳”或信息过载问题：网络分析师会在大量错误警报的噪音中错过真正的攻击警报。

NODOZE 首先生成警报事件的因果关系图。然后，它根据相关事件在企业中之前发生的频率，为依赖图中的每条边分配一个异常分数。然后使用一种新颖的网络扩散算法沿着图的相邻边缘传播这些分数，并生成用于分类的聚合异常分数。

在美国 NEC 实验室部署并评估了 NODOZE，根据聚合异常分数始终将真实警报排名高于虚假警报，过引入异常分数的截止阈值，我们估计我们的系统将误报数量减少了 84%，每周为分析师节省 90 多个小时的调查时间。

生成的警报依赖关系图比传统工具生成的警报依赖关系图小两个数量级，而不会牺牲调查所需的重要信息。系统平均运行时开销较低，可以与任何威胁检测软件一起部署。

1. 引言

在许多情况下，如果调查人员只检查单个事件，则错误警报可能看起来与真实警报非常相似。例如，由于勒索软件和 ZIP 程序都在短时间内读写许多文件，因此仅检查单个进程行为的简单勒索软件检测器可以轻松地将 ZIP 归类为勒索软件。现有的 TDS 通常不会提供足够的有关警报的上下文信息。

数据来源分析是威胁警报疲劳问题的一种可能补救措施。数据来源可以通过重建导致警报的事件（向后跟踪）和警报事件的后果（前向跟踪）链来提供有关生成的警报的上下文信息，以更好地将良性系统事件与恶意事件区分开来。但利用数据来源对警报进行分类有两个关键限制：1) 劳动密集——使用现有技术仍然需要网络分析师手动评估每个警报的来源数据，以消除误报，以及2) 依赖爆炸问题——由于现代系统的复杂性，当前的来源跟踪技术将包括错误的依赖，因为输出事件被假定为因果依赖于所有先前的输入事件。

NODOZE 利用历史背景自动降低现有 TDS 的误报率。 NODOZE 通过解决上述现有起源分析技术的两个局限性来实现这一点：它是完全自动化的，并且可以在保持真实攻击场景的同时大大减少依赖图的大小。

起源图中每个事件的可疑性应根据图中相邻事件的可疑性进行调整。由另一个可疑进程创建的进程比由良性进程创建的进程更可疑。

我们的异常分数分配算法是一种没有训练阶段的无监督算法。为了给事件分配异常分数，NODOZE 构建了一个事件频率数据库，其中存储了企业中之前发生的所有事件的频率。在分配异常分数后，NODOZE 使用一种新颖的网络扩散算法来有效地传播和聚合警报依赖图的相邻边（事件）上的分数。最后，它为用于分类的候选警报生成一个聚合异常分数。

为了解决警报调查过程中的依赖爆炸问题，我们提出了行为执行分区的概念。这个想法是根据正常和异常行为对程序执行进行分区，并生成真实警报的最异常依赖图。

我们分别在 9K 和 4K 行 Java 代码中实现了 NODOZE 和事件频率数据库。在美国 NEC 实验室部署并评估了我们的系统。跨越 5 天的 10 亿个系统事件，生成了 364 个警报，包括 10 个 APT 攻击案例和 40 个最近的恶意软件模拟。NODOZE 通过将误报减少 84% 来提高现有 TDS 的准确性。

2. 背景和动机

使用一个攻击示例来说明 NODOZE 作为警报分类系统的有效性和实用性，包括两个方面：1）过滤掉误报以减少警报疲劳，以及 2）使用依赖图简明地解释真实警报加快警报调查过程。

A. 攻击实例

无知的工作人员下载了恶意软件，网络分析师下载诊断工具。二者皆产生了警报且无法区分。

略……，作者旨在说明单从警报来看，真实恶意行为的警报和误报没有区别。

网络分析师为什么要从网上下载诊断工具？不都是跑现场吗？

B. 现有工具的局限性

现有的来源追踪器与 TDS 结合用于警报分类和调查过程时会受到以下限制：

警报爆炸和依赖人工：
依赖爆炸：依赖性不准确主要是由长时间运行的进程引起的，这些进程在其生命周期内与许多主体/对象进行交互。现有方法将整个进程执行视为单个节点，以便所有输入/输出交互成为流程节点的边。这会导致相当大且不准确的图。

考虑我们示例依赖图中的 Internet Explorer IExplorer.exe 顶点，如图 2a 所示。当网络分析师试图找到下载的恶意软件文件 (springs.7zip) 和诊断工具文件 (collect-info.ps1) 的祖先时，他们将无法确定哪个传入 IP/套接字连接顶点与恶意软件文件相关，以及哪个属于诊断工具文件。
依赖爆炸问题的先前解决方案建议将长时间运行的流程的执行划分为自治“单元”，以便在输入和输出事件之间提供更精确的因果依赖关系。但是，这些系统需要最终用户参与和通过源代码检测、使用典型工作负载训练应用程序运行以及修改内核来更改系统。由于专有软件和许可协议，代码检测在企业中通常是不可能的。此外，这些系统仅针对 Linux 实现，它们的设计不适用于像 Microsoft Windows 这样的商用现成操作系统。最后，获取异构大型企业中的典型应用程序工作负载实际上是不可行的。

C. 目标

警报减少：减少误报、漏报和不可操作的项目。
简洁的上下文警报：生成的威胁警报依赖图应该简洁完整。
通用性：应该独立于底层平台（例如 OS、VM 等）、应用程序和 TDS。
实用性：应该不需要任何终端系统更改，并且应该可以部署在任何现有的 TDS 上。

3. NODOZE 概述和方法

NODOZE 充当现有 TDS 的附加组件，以减少误报并提供生成的威胁警报的上下文解释。为了对警报进行分类，NODOZE 首先为生成的警报来源图中的每个事件分配一个异常分数。然后使用一种新颖的网络扩散算法来传播和聚合沿相邻事件的异常分数。最后，它为生成的警报生成一个聚合异常分数，用于分类。

在图 2a 中，有两个威胁警报事件由 E1 和 E2 注释，并用虚线箭头显示。单独查看这些警报事件，它们看起来很相似（都与重要的内部主机建立套接字连接）。然而，当我们使用后向和前向追踪来考虑每个警报事件的祖先和后代时，我们可以看到每个警报事件的行为都明显不同。

为了确定威胁警报是真正的攻击还是误报，NODOZE 使用异常分数来量化过去发生的相关事件的“罕见性”或转移概率。例如，警报事件 E1 的后代，即 dropper.exe → y.y.y.y:445 由几个更罕见的事件组成，即具有较低的转换概率。警报事件 E2 的祖先包含诊断事件，例如定期执行的 Tasklist 和 Ipconfig，以检查企业中计算机的健康状况。因此，E2 的总异常分数将大大低于 E2 的异常分数。

一旦 NODOZE 为警报事件分配了威胁分数，它从具有最高异常分数的依赖图中提取子图，真实警报 E1 的依赖图如图 2b 所示。虽然 IExplorer.exe 收到了多个套接字连接，但 NODOZE 只选择了罕见的 IP 地址 a.a.a.a（从中下载恶意软件的恶意网站）和 b.b.b.b，因为它们的异常分数高于其他正常套接字连接。

4. 威胁模型和假设

假设攻击者无法操纵或删除出处记录，即始终保持日志完整性
不考虑使用不通过系统调用接口的隐式流（侧通道）执行的攻击
不跟踪利用内核漏洞的攻击
假设底层 TDS 的检测率是完整的
假设至少有一个事件在 alert 的祖先或后代中是异常的，将其归类为真正的攻击
不考虑模仿攻击

5. 问题定义

A. 定义

依赖事件：经典三元组，主体客体和关系
依赖路径：依赖事件 Ea 的依赖路径 P 表示导致 Ea 的事件链和由 Ea 引发的事件链（即事件本身及其前后因果事件）。分为数据依赖和控制依赖
依赖图：
真正的警报依赖关系图：进行执行分区划分后的图，剔除掉了错误依赖。

B. 问题描述

给定 n 个警报事件列表 ${E_1, E_2, ..., E_n}$ 和用户指定的阈值参数 $τ_l$ 和 $τ_d$ ，我们的目标是根据它们的异常分数对这些警报进行排名，并过滤掉所有异常分数小于 $τ_d$ 的警报作为误报。

6. 算法

A. 道路地图

分配异常分数的一种简单方法是使用过去发生的系统事件的频率，这样组织中罕见的事件被认为更异常。然而，有时这种假设可能不成立，因为攻击可能涉及经常发生的事件。因此，我们的目标是定义异常分数，而不是仅基于依赖路径中的单个事件，而是基于整个路径。

B. 异常分数传播

给定警报事件 $E_α$ 的完整依赖图 G，我们找到 $E_α$ 的所有长度为 $τ_l$ 的依赖路径。为此，我们从警报事件开始以前后方式运行深度优先遍历，然后将这些后向和前向路径组合起来生成统一路径，以便每个统一路径都包含警报的祖先和后代因果事件。
为了计算异常分数，我们首先为给定的警报事件依赖图 G 构造一个 N × N 转移概率矩阵 M，其中 N 是 G 中的顶点总数。每个矩阵条目 Mε 由以下等式计算： $M_{\varepsilon}=probability(\varepsilon)=\frac{|Freq(\varepsilon)|}{|Freqsrc_rel(\varepsilon)|}$ ，其中 $F re q$ 为发生次数。为了统计过去发生的事件的频率，我们建立了一个事件频率数据库，定期存储和更新整个企业的事件频率。

给定事件的转移概率告诉我们特定来源流向特定目的地的概率；然而，我们最终将通过图传播这个值，但是当我们这样做时，我们想要考虑从源流出的数据总量，以及流入目的地的数据总量。我们计算依赖图 G 中每个实体的 IN 和 OUT 分数向量。

最后，正则性得分 $RS (P)$ 计算如下： $RS(P)=\prod\limits_{i=1}^{l}IN(SRC_i)\times M(\varepsilon_i)\times OUT(DST_i)$ 异常分数为： $A S (P) = 1 - RS (P)$

C. IN 和 OUT 分数计算

我们根据每个实体的类型为每个实体填充 IN 和 OUT 分数。

进程实体：划分很多个时间窗口，如果时间窗口内没有新边加入，则视为稳定窗口，一个实体的IN分数和OUT分数均为稳定窗口与窗口总数之比。
$IN(v)=\frac{|T_{to}^{\prime}|}{|T|}\quad\quad OUT(v)=\frac{|T_{from}^{\prime}|}{|T|}\quad$
数据实体：数据实体主要是文件和网络链接。进一步细分为三类：临时文件、可执行文件和已知的恶意扩展。临时文件给很高的分，用先验知识给可执行文件、恶意扩展、恶意ip低分，其余实体0.5分

D. 异常评分归一化

由于单纯的叠加会导致长路径的分数高于短路径，所以引入一个衰减因子用以归一化。
$RS(P)=\prod\limits_{i=1}^lIN(SRC_i)\times M(\varepsilon_i)\times OUT(DST_i)\times\alpha$

E. 路径融合

该步骤试图通过只包含具有高异常分数的依赖路径来构建一个准确的真正警报依赖图，通过合并，尽量减少路径的数量，进一步保证靠前的路径构建出来的子图包含大部分恶意行为。

F. 决策

NODOZE的主要目标是对给定时间线中的所有警报进行排序。然而，我们也可以计算一个决策或截断阈值τd，它可以用来确定候选威胁警报是真攻击还是高置信度的假警报。

G. 时间复杂度

每次根据给定警报进行两次固定深度的DFS，一次向前一次向后。时间复杂度为 $\mathcal{O}(|b^{D}|$ ，取决于节点的分支数和搜索的深度。

7. 实现

Windows ETW + Linux Auditd、PostgreSQL database
a)事件频率数据库生成器，b)警报分类和图形生成器，以及c)可视化模块

A. 事件频率库

进程实体：进程路径、命令行参数、组标识gid
文件实体：抽象文件路径（删除特定用户信息）
socket实体：保留外部地址，抽象内部地址

B. 警报分类和图构建

合并瞬时进程：有些进程的存在意义仅为唤起另一进程，这种情况将二者合并
合并相同套接字：由同一进程发起的相同地址的套接字合并

C. 可视化模块

使用GraphViz生成点格式的因果图，然后将点文件转换为html格式

8. 评估

准确率：设定当设置阈值使得决策为100%检测真阳性时，假阳性为16%。换句话说，误报减少84%。

依赖图减少程度：减少两个数量级

节省多少人工时间：假设每个假警报花20分钟，过滤掉84%，约90个小时。
运行开销：

[论文阅读] 软件工程 | 探索软件生态系统中的开发者体验关键因素
探索软件生态系统中的开发者体验关键因素：从研究到实践引文格式@article{Zacarias2025,title={ExploringDeveloperExperienceFactorsinSoftwareEcosystems},author={Zacarias,RodrigoOliveiraandAntunes,L{\'e}oCarvalhoRamosandBarros,M{\'a}rciod
Fast Image Deconvolution using Hyper-Laplacian Priors论文阅读青铜锁00 #退化论文阅读论文阅读图像处理
FastImageDeconvolutionusingHyper-LaplacianPriors1.论文的研究目标与实际意义2.论文的创新方法2.1核心框架：交替最小化（AlternatingMinimization）2.2x子问题：频域FFT加速2.3w子问题：高效求解的核心创新2.3.1问题形式2.3.2查找表法（LUT）2.3.3解析解法（特定α\alphaα）2.3.4通用α\alphaα
[论文阅读] 人工智能 + 软件工程 | AI 与敏捷开发的破局之路：从挫败到成功的工作坊纪实张较瘦_ 前沿技术论文阅读人工智能软件工程
AI与敏捷开发的破局之路：从挫败到成功的工作坊纪实论文信息arXiv:2506.20159AIandAgileSoftwareDevelopment:FromFrustrationtoSuccess–XP2025WorkshopSummaryTomasHerda,VictoriaPichler,ZheyingZhang,PekkaAbrahamsson,GeirK.HanssenSubjects:
Diff-Retinex: Rethinking Low-light Image Enhancement with A Generative Diffusion Model 论文阅读钟屿论文阅读人工智能深度学习学习图像处理计算机视觉
Diff-Retinex：用生成式扩散模型重新思考低光照图像增强摘要本文中，我们重新思考了低光照图像增强任务，并提出了一种物理可解释的生成式扩散模型，称为Diff-Retinex。我们的目标是整合物理模型和生成网络的优点。此外，我们希望通过生成网络补充甚至推断低光照图像中缺失的信息。因此，Diff-Retinex将低光照图像增强问题表述为Retinex分解和条件图像生成。在Retinex分解中，我
【论文阅读】人工智能在直升机航空电子系统中的应用肥鼠路易论文阅读人工智能航空电子系统应用
人工智能在直升机航空电子系统中的应用论文摘要文章结构参考文献论文摘要论文摘要:在现代战争形势日趋信息化、智能化的背景下，将人工智能应用于武器装备已经是大势所趋。针对直升机飞行任务的特征，对其发展状况进行了描述，并对其作业能力进行了分析，探索了人工智能技术在直升机航电系统中的应用方向，为推进人工智能在直升机上的转化与应用奠定基础。通过对国外先进直升机智能技术的运用现状及对其作业能力的要求进行分析，探
[论文阅读] 人工智能+软件工程 | 用大语言模型架起软件需求形式化的桥梁张较瘦_ 前沿技术人工智能论文阅读软件工程
用大语言模型架起软件需求形式化的桥梁：一篇ACM调查草案的深度解读论文信息arXiv:2506.14627ACMSurveyDraftonFormalisingSoftwareRequirementswithLargeLanguageModelsArshadBeg,DiarmuidO’Donoghue,RosemaryMonahanComments:22pages.6summarytablesSu
Reti-Diff: Illumination Degradation Image Restoration with Retinex-based Latent Diffusion Model论文阅读青铜锁00 深度学习论文阅读 #退化论文阅读
Reti-Diff:IlluminationDegradationImageRestorationwithRetinex-basedLatentDiffusionModel1.研究目标与实际意义1.1研究目标1.2实际意义2.创新方法与模型设计2.1整体框架2.2RetinexPriorExtraction(RPE)模块2.2.1Retinex分解2.2.2先验压缩2.3Retinex-guide
SIMPL论文阅读 ZHANG8023ZHEN 论文阅读
论文链接：https://arxiv.org/pdf/2402.02519文章还没细看，但主要贡献点应该是SymmetricFusionTransformer和Bezier-basedMotionDecoder.对Bezier-basedMotionDecoder比较感兴趣，之后对这块细看一下
【论文阅读笔记】《CodeS: Towards Building Open-source Language Models for Text-to-SQL 》柠石榴 text2sql 论文论文阅读笔记语言模型
文章目录一、论文基本信息1.文章标题2.所属刊物/会议3.发表年份4.作者列表5.发表单位二、摘要三、解决问题四、创新点五、自己的见解和感想六、研究背景七、研究方法模型实验数据评估指标八、总结九、相关重要文献一、论文基本信息1.文章标题CodeS:TowardsBuildingOpen-sourceLanguageModelsforText-to-SQL2.所属刊物/会议未明确标注（会议缩写为“C
agentformer论文阅读 ZHANG8023ZHEN 论文阅读
参考了这篇博文：https://zhuanlan.zhihu.com/p/512764984主要有这几个部分a.map_encoderi.对地图进行CNNb.ContextEncoderi.timeencoder–将时间信息用transformer和positionemb进行融合，加入到特征中ii.agent-awareattention–self和selfattentionother和other
【论文阅读】DynamicControl ：一种新的controlnet多条件控制方法 prinTao pytorch Diffusion 论文阅读
背景现有方法要么处理条件效率低下，要么使用固定数量的条件，这并不能完全解决多个条件的复杂性及其潜在冲突。这强调了需要创新方法来有效管理多种条件，以实现更可靠和详细的图像合成。为了解决这个问题，我们提出了一个新的框架DynamicControl，它支持不同控制信号的动态组合，允许自适应选择不同数量和类型的条件。本文方法从一个双循环控制器开始，它通过利用预先训练的条件生成模型和判别模型为所有输入条件生
论文阅读：2018 arxiv CrowdHuman: A Benchmark for Detecting Human in a Crowd CSPhD-winston-杨帆论文阅读
https://www.doubao.com/chat/9226473480559618https://arxiv.org/pdf/1805.00123CrowdHuman:ABenchmarkforDetectingHumaninaCrowd文章目录论文翻译CrowdHuman：用于检测人群中人体的基准摘要1.引言2.相关工作2.1.人体检测数据集2.2.人体检测框架。论文翻译CrowdHuma
论文阅读：arxiv 2025 OThink-R1: Intrinsic Fast/Slow Thinking Mode Switching for Over-Reasoning Mitigation CSPhD-winston-杨帆论文阅读
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328https://www.doubao.com/chat/8815924393371650https://arxiv.org/pdf/2506.02397#page=17.09OThink文章目录速览研究背景与问题核心思路与方法实验结果结论与意义速览这篇论文聚焦于
论文阅读：arxiv 2025 Not All Tokens Are What You Need In Thinking
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328https://arxiv.org/pdf/2505.17827https://www.doubao.com/chat/8814790364572162文章目录速览研究背景提出的解决方案：条件token选择（CTS）实验结果核心贡献研究局限总结速览这篇论文主要探
[论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers 颜笑晏晏论文阅读
1.摘要双分支网络结构已显示出其对实时语义分割任务的效率性和有效性。然而，低级细节和高级语义的直接融合将导致细节特征容易被周围上下文信息淹没，即本文中的超调(overshoot)，这限制了现有两个分支模型的准确性的提高。在本文中，我们在卷积神经网络（CNN）和比例积分微分（PID）控制器之间架起了桥梁，并揭示了双分支网络只是一个比例积分（PI）控制器，当然也会存在类似的超调问题。为了解决这个问题，
[论文阅读] 人工智能+软件工程 | 用 LLM + 静态代码分析自动化提升代码质量张较瘦_ 前沿技术论文阅读人工智能软件工程
用LLM+静态代码分析自动化提升代码质量论文信息AugmentingLargeLanguageModelswithStaticCodeAnalysisforAutomatedCodeQualityImprovements@article{abtahi2025augmenting,title={AugmentingLargeLanguageModelswithStaticCodeAnalysisfo
经典论文阅读《A Framework for Unifying Reordering Transformations》《统一重排序变换的框架》好好学习啊天天向上自动性能优化
1）摘要我们提出了一个用于统一迭代重排序变换的框架，这些变换包括循环交换、循环分布、倾斜、分块、索引集拆分和语句重排序。该框架基于这样一种思想：变换可以表示为将原始迭代空间映射到新迭代空间的调度。框架旨在为变换提供一种统一的表示和推理方式。作为框架的一部分，我们提供了辅助构建和使用调度的算法，特别是用于检验调度合法性、对齐调度以及为调度生成优化代码的算法。2）优化编译器会对语句的迭代进行重新排序，
[论文阅读] 系统架构 | 零售 IT 中的微服务与实时处理：开源工具链与部署策略综述张较瘦_ 前沿技术论文阅读大数据零售
零售IT中的微服务与实时处理：开源工具链与部署策略综述论文信息MicroservicesandReal-TimeProcessinginRetailIT:AReviewofOpen-SourceToolchainsandDeploymentStrategiesAaditaaVashisht(DepartmentofInformationScienceandEngineering,RVCollege
[论文阅读]人工智能 | CoMemo：给大视觉语言模型装个“图像记忆” 张较瘦_ 前沿技术人工智能论文阅读语言模型
【论文速览】CoMemo：给大视觉语言模型装个“图像记忆”论文信息Liu,S.,Su,W.,Zhu,X.,Wang,W.,&Dai,J.(2025).CoMemo:LVLMsNeedImageContextwithImageMemory.arXivpreprintarXiv:2506.06279.一、研究背景：当LVLMs遇到“视觉健忘症”想象一下，你在阅读一本图文并茂的小说时，随着文字篇幅越来越
[论文阅读] 人工智能+软件工程 | 结对编程中的知识转移新图景张较瘦_ 前沿技术人工智能软件工程结对编程
当AI成为编程搭档：结对编程中的知识转移新图景论文信息论文标题：FromDeveloperPairstoAICopilots:AComparativeStudyonKnowledgeTransfer（从开发者结对到AI副驾驶：知识转移的对比研究）作者及机构：AlisaWelter等来自德国萨尔兰大学，ChristofTinnes同时隶属于西门子公司发表平台：arXiv预印本平台发表时间：2025年
【论文阅读笔记】HaDes幻觉检测benchmark zsq 论文分享论文阅读笔记 NLP 大语言模型幻觉
0论文信息题目：AToken-levelReference-freeHallucinationDetectionBenchmarkforFree-formTextGeneration作者：TianyuLiu,YizheZhang,ChrisBrockett,YiMao,ZhifangSui,WeizhuChen,BillDolan会议：ACL，2022链接：https://arxiv.org/ab
论文阅读：Enhancing Retrieval and Managing Retrieval: A Four-Module Synergy for Improved Quality and Ef clvsit RAG 论文阅读 LLM
检索增强生成（RAG）技术利用大型语言模型（LLM）的上下文学习能力，生成更准确、更相关的响应。RAG框架起源于简单的“检索-阅读”方法，现已发展成为高度灵活的模块化范式。其中一个关键组件——查询重写模块，通过生成搜索友好的查询来增强知识检索。这种方法能使输入问题与知识库更紧密地结合起来。作者的研究发现了将QueryRewriter模块增强为QueryRewriter+的机会，即通过生成多个查询来
论文阅读：HySCDG生成式数据处理流程
论文地址:TheChangeYouWantToDetect:SemanticChangeDetectionInEarthObservationWithHybridDataGenerationAbstract摘要内容介绍问题背景“Bi-temporalchangedetectionatscalebasedonVeryHighResolution(VHR)imagesiscrucialforEarth
[论文阅读] 人工智能 | 搜索增强LLMs的用户偏好与性能分析张较瘦_ 前沿技术人工智能论文阅读
【论文解读】SearchArena：搜索增强LLMs的用户偏好与性能分析论文信息作者:MihranMiroyan,Tsung-HanWu,LoganKing等标题:SearchArena:AnalyzingSearch-AugmentedLLMs来源:arXivpreprintarXiv:2506.05334v1,2025一、研究背景：当LLMs需要“上网查资料”时，我们如何评估它？想象你在问AI
[论文阅读] 人工智能 | 如何快速检测LLM生成的代码？这篇论文提出了一个巧妙的方法张较瘦_ 前沿技术人工智能论文阅读
如何快速检测LLM生成的代码？这篇论文提出了一个巧妙的方法论文引文格式@misc{ashkenazi2025zero,title={Zero-ShotDetectionofLLM-GeneratedCodeviaApproximatedTaskConditioning},author={MaorAshkenaziandOfirBrennerandTalFurmanShohetandEranTrei
[论文阅读] 人工智能+软件工程 | 理解GitGoodBench：评估AI代理在Git中表现的新基准张较瘦_ 前沿技术论文阅读人工智能软件工程
理解GitGoodBench：评估AI代理在Git中表现的新基准论文信息GitGoodBench:ANovelBenchmarkForEvaluatingAgenticPerformanceOnGitTobiasLindenbauer,EgorBogomolov,YaroslavZharovCiteas:arXiv:2505.22583[cs.SE]研究背景：当AI走进开发者的协作工具箱在软件开发
[论文阅读] 人工智能+软件工程（软件测试） | 当大语言模型遇上APP测试：SCENGEN如何让手机应用更靠谱张较瘦_ 前沿技术人工智能论文阅读软件工程
当大语言模型遇上APP测试：SCENGEN如何让手机应用更靠谱？一、论文基础信息论文标题：LLM-GuidedScenario-basedGUITesting（《大语言模型引导的基于场景的GUI测试》）作者及机构：ShengchengYu等（德国慕尼黑工业大学、南京大学、同济大学等）发表来源：IEEETransactionsonSoftwareEngineering（IEEE软件工程汇刊）发表时间
[论文阅读] 人工智能+软件工程 | 用大模型优化软件性能张较瘦_ 前沿技术论文阅读人工智能软件工程
用大模型优化软件性能？这篇论文让代码跑出新速度！arXiv:2506.01249SysLLMatic:LargeLanguageModelsareSoftwareSystemOptimizersHuiyunPeng,ArjunGupte,RyanHasler,NicholasJohnEliopoulos,Chien-ChouHo,RishiMantri,LeoDeng,KonstantinLäuf
Enhanced Sparse Model for Blind Deblurring论文阅读青铜锁00 #退化论文阅读论文阅读图像处理
EnhancedSparseModelforBlindDeblurring1.研究目标与意义1.1研究目标1.2实际意义与产业价值2.论文提出的新思路、方法及模型2.1增强稀疏模型（EnhancedSparseModel,lel_ele）模型定义与数学表达闭式解与稀疏性增强机制2.2改进的噪声建模策略噪声拟合函数的构建空间随机性建模2.3整体优化框架与半二次分裂法目标函数设计优化步骤拆分参数设置与
[论文阅读] 人工智能+软件工程 | MemFL：给大模型装上“项目记忆”，让软件故障定位又快又准张较瘦_ 前沿技术论文阅读人工智能软件工程
【论文解读】MemFL：给大模型装上“项目记忆”，让软件故障定位又快又准论文信息arXiv:2506.03585ImprovingLLM-BasedFaultLocalizationwithExternalMemoryandProjectContextInseokYeo,DuksanRyu,JongmoonBaikSubjects:SoftwareEngineering(cs.SE)一、研究背景：
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu