Eastmount

[论文阅读] (10)基于溯源图的APT攻击检测安全顶会总结

《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座，并分享给大家，希望您喜欢。由于作者的英文水平和学术能力不高，需要不断提升，所以还请大家批评指正，非常欢迎大家给我留言评论，学术路上期待与您前行，加油。

前一篇文章分享了S&P2019《HOLMES: Real-time APT Detection through Correlation of Suspicious Information Flows》，基于可疑信息流的实时APT检测。这篇文章将详细介绍和总结基于溯源图的APT攻击检测安全顶会内容，花了作者一个多月时间。希望这篇文章对您有所帮助，这些大佬是真的值得我们去学习，献上小弟的膝盖~fighting！

本次分享主要是作者对APT攻击部分顶会论文阅读的阶段性总结，将从以下四个方面开展，包括APT攻击背景知识、APT攻击检测研究、基于溯源图的APT攻击检测方法对比、下一步工作及讨论。其重点是对基于溯源图的APT攻击检测进行总结。同时，由于作者科研能力和英文还较弱，写得不好或理解不到位的地方，还请各位老师和博友指正和批评，谢谢！

文章目录

一.背景知识
二.APT攻击检测研究
- 1.APT攻击检测相关研究
- 2.基于异常检测的方法
- 3.基于溯源图的方法
- - SLEUTH [USENIX’17]
  - Poirot [CCS’19]
  - HOLMES [S&P’19]
  - Extrator [EurS&P’21]
  - HINTI [RAID’20]
  - UNICORN [NDSS’20]
  - ProvDetector NDSS’20
  - RapSheet [S&P’20]
  - ATLAS [USENIX’21]
三.方法对比
- 1.基于溯源图的方法研究趋势分析
- 2.方法优缺点对比
- 3.数据集对比
四.总结

前文赏析：

[论文阅读] (01) 拿什么来拯救我的拖延症？初学者如何提升编程兴趣及LATEX入门详解
[论文阅读] (02) SP2019-Neural Cleanse: Identifying and Mitigating Backdoor Attacks in DNN
[论文阅读] (03) 清华张超老师 - GreyOne: Discover Vulnerabilities with Data Flow Sensitive Fuzzing
[论文阅读] (04) 人工智能真的安全吗？浙大团队外滩大会分享AI对抗样本技术
[论文阅读] (05) NLP知识总结及NLP论文撰写之道——Pvop老师
[论文阅读] (06) 万字详解什么是生成对抗网络GAN？经典论文及案例普及
[论文阅读] (07) RAID2020 Cyber Threat Intelligence Modeling Based on Heterogeneous GCN
[论文阅读] (08) NDSS2020 UNICORN: Runtime Provenance-Based Detector for Advanced Persistent Threats
[论文阅读] (09)S&P2019 HOLMES Real-time APT Detection through Correlation of Suspicious Information Flow
[论文阅读] (10)基于溯源图的APT攻击检测安全顶会总结

一.背景知识

1.什么是APT攻击？
APT攻击（Advanced Persistent Threat，高级持续性威胁） 是利用先进的攻击手段对特定目标进行长期持续性网络攻击的攻击形式。APT攻击也称为定向威胁攻击，指某组织对特定对象展开的持续有效的攻击活动。这种攻击活动具有极强的隐蔽性和针对性，通常会运用受感染的各种介质、供应链和社会工程学等多种手段实施先进的、持久的且有效的威胁和攻击。

2.APT攻击的特点
上图的表格展示了APT攻击和普通攻击的区别。可以简单地将APT攻击特点总结为：

隐蔽性
0-day漏洞、needle in a haystack（通常不到0.01%）、无文件攻击、加密流量
持续性
low-and-slow（潜伏时间长）、攻击时间跨度大
针对性
Stuxnet、SolarWinds
模块化（自适应）
Stuxnet、WannaCry

3.APT攻击检测存在的困难
下图展示了2016到2020年，亚太地区AP攻击事件的停留时间，可以看到其潜伏期很长，想要发现一起APT攻击极为困难。同时，传统APT攻击检测存在一定的缺陷，包括：

无法捕获长期运行的系统行为
0-day漏洞导致攻击艰难检测
实时攻击检测、真实场景检测效果不佳
容易遭受投毒攻击
注意，这里的投毒攻击是指因APT攻击持续时间长，导致ML模型学习攻击特征时，会将恶意行为逐渐训练学习为正常行为
…

接着补充下两个辅助APT攻击的经典知识框架，它们分别是 kill-chain Model 和 ATT&CK Model。它们既能帮助我们理解、检测和溯源APT攻击流程，又在论文中作了相应的贡献，现已被广泛用于APT攻击检测领域研究，后面会详细介绍。

kill-chain Model
洛克希德·马丁公司开发的“网络杀伤链”模型描述了网络攻击的各阶段流程，具体包括七个阶段，即目标侦查、武器构建、载荷投递、漏洞利用、安装植入、命令与控制、任务执行。

ATT&CK Model
ATT&CK（Adversarial Tactics, Techniques, and Common Knowledge ）是一个攻击行为知识库和模型，主要应用于评估攻防能力覆盖、APT情报分析、威胁狩猎及攻击模拟等领域。网址：https://attack.mitre.org/

最后展示了常见APT组织。

二.APT攻击检测研究

该部分从APT攻击检测相关研究、基于异常检测的方法和基于溯源图的方法三个方面介绍，重点以基于溯源图的方法为主。

1.APT攻击检测相关研究

APT攻击检测研究方法的分类很多，作者这里仅将其分成了两大块（不一定合适），主要和作者阅读的论文相关，也欢迎大家交流分类方法。即：

Anomaly-based detectors for APTs
– 主机日志（审计日志）
– 系统调用
– 网络流量 | 警报信息
– 恶意行为
Provenance graph-based detectors for APTs
– 溯源图
– +引入外部知识
– +融合ATT&CK框架
– 因果关系图+NLP

我们先看看图中下半部分基于 溯源图（Provenance Graph） 的APT检测方法。主要包括：

伊利诺伊大学芝加哥分校团队
首先，USENIX’17提出的 SLEUTH，将溯源图应用于APT攻击检测领域。然后，该团队紧接着在2019年CCS会议上提出 Poirot，在S&P’19上提出 Holmes，该方法融合了Kill Chain和ATT&CK框架。此外，在2021年EurS&P提出 Extrator，并引入外部知识。
伊利诺伊大学香槟分校团队
另一个研究溯源图的团队来自伊利诺伊大学香槟分校，他们分别在NDSS’20提出了 UNICORN 和 ProvDetector，同时在2020年的S&P上提出 RapSheet，它融合了ATT&CK框架。
普渡大学团队
第三个团队是来自普渡大学，当然各团队之间有很多合作团队。他们的核心成果包括NDSS’13提出的 BEEP，NDSS’16提出的 ProTracer 和USENIX’21提出的 ATLAS。

整个基于溯源图的APT检测方法是在Baseline的基础上不断优化，包括溯源图+引入外部知识、溯源图+融合ATT&CK框架、因果关系图+NLP等。后面的论文和框架图作者会更详细的介绍，从而梳理出溯源图方法的研究路线。另外，基于异常检测的方法图中也列举了部分方法。

2.基于异常检测的方法

基于异常检测的方法这里简单例举了利用C&C域名、数学模型、恶意流量和恶意行为实现APT攻击检测的框架图，如下图所示。

上述传统APT攻击检测方法主要存在的缺陷包括：

APT攻击时间跨度长，缺乏方法或工具有效将信息进行关联，还原攻击链
实时检测困难，较难高效地从百万条日志中筛选数据，并检测出最可能的攻击行为
较难让分析人员通过数据有效地进行推理，从而检测未知攻击
缺乏对真实场景的APT攻击进行检测，并且IDS和SIEM会产生大量的信息，传统方法识别真实的攻击更加困难
无法有效解决投毒攻击，即由于APT攻击时间跨度较长，深度学习会将恶意特征训练为正常特征

结合上述原因，产生了改进方法，即：

基于溯源图的APT攻击检测（Provenance graph-based detector for APTs）

接下来开始详细介绍基于溯源图的APT攻击检测方法。

3.基于溯源图的方法

SLEUTH [USENIX’17]

第一篇论文是USENIX’17的 SLEUTH。

Md Nahid Hossain, et al. SLEUTH: Real-time Attack Scenario Reconstruction from COTS Audit Data. USENIX’17

https://www.usenix.org/system/files/conference/usenixsecurity17/sec17-hossain.pdf

石溪大学、伊利诺伊大学芝加哥分校

这篇文章的主要贡献如下：

首次利用溯源图重构APT攻击，即利用因果关系跟踪和溯源图构造模型
提出一种可以在企业主机上实时重构攻击场景的方法和系统
开发一种平台无关、基于主存的审计日志数据依赖图抽象

整个SLEUTH的框架图如下图所示，核心内容如下：

(1) 输入的是Linux、Windows和FreeBSD平台的审计日志信息
(2) 构建并标记依赖关系图，标签将提供重要的上下文信息，对应论文中良性可信、良性和未知三种类型
(3) 实现基于标签和策略的攻击检测，并定制的策略，根据审计日志的秘密性分为公开、隐私、敏感和秘密，通过引入标签和策略实现对依赖关系图赋予不同的权重
(4) 经过依赖图反复构建后，会到达警报计算阶段，通过定义规则来匹配更高的威胁攻击，生成对应的分数，基于标签的分析后会生成并还原场景图（Scenario Graph）

同时，依赖关系图中的节点和关系表示如下：

节点：表示subjects（进程）和objects（文件、sockets）
关系：表示审计事件（读、写、执行、连接等操作）

接着介绍它的警报（Alarms）计算策略，以下四个会引发警报，包括：

不受信任的代码执行：高等级标签去执行低等级时触发
被低等级标签修改：修改文件权限时产生
秘密文件泄露：不可信对象执行写的操作
执行不可信的数据：比如执行command等指令操作

下图是攻击场景的重构，它是对FireFox浏览器漏洞的场景还原。

审计数据还原fireFox后门攻击场景
– Backdoor insertion
– Clean-up

整个场景还原如下：它的入口点是在firefox.exe位置，首先它会去接收IP地址，然后fork下载器（dropper），接着它会发送请求到443端口；接下来会多次调用cmd执行命令，如whoami、netstat、hostname等，并将数据写入到指定路径的thumbs.db文件中；然后执行git.exe实现数据过滤操作；最后执行burnout.bat批处理文件清除场景的痕迹。

整个实验采用 DARPA TC 数据集实验，它有8个攻击场景重构及攻击阶段映射，该论文对每个场景进行了图还原，涉及阶段如下图所示：

实验统计了APT攻击场景每个阶段的实体数量：关键文件、网络连接、执行程序等，如下图所示。

其他实验效果如下，建议读者阅读原文。

最后，简单总结SLEUTH与传统方法的区别：

Sleuth方法
– Sleuth实时检测、运行效率更高
– Sleuth基于标签的检测方法更精确（规则+策略+警报）
传统方法，如Bactracker [SOSP’03]
– 无法实时且效率低
– Bactracker依赖外部工具生成警报，无法剪枝和溯源

补充：DARPA TC是经典的APT攻击检测数据集
美国国防高级研究计划局（Defense Advanced Research Projects Agency, DARPA）运营了多个重量级的网络空间安全研究项目，召集了诸多美国顶级研究机构参与，可谓是集中力量办大事。其中，透明计算（Transparent Computing, TC）项目正是期望通过基于终端数据的采集与分析增强终端上系统细粒度行为的可视能力，以实现企业级网络空间APT检测、取证等关键任务。

现代操作系统的功能逻辑越来越复杂，计算系统的低透明度成为精细化记录、分析、预测系统级别行为的重要限制，而封闭的系统黑盒为具有高隐蔽性、高对抗性的APT攻击者提供了绝佳的潜伏场所。为了打开系统行为黑盒，实现在较低开销下提供系统各层级软件模块行为可见性，DAPRA组织了Transparent Computing项目。该项目的目标技术及系统需实现：

采集、保存系统组件（输入、软件模块、进程等）的溯源数据；

动态追踪网路系统组件的交互与因果依赖关系；

整合数据依赖，测绘端到端的系统行为；

从取证和实时检测的角度，实现对系统行为的推理。

基于以上能力的实现，TC项目旨在完成细粒度系统级行为的关联，实现在大规模行为中识别异常与恶意意图，发现潜在的APT或其他高级威胁，并提供完整的溯源分析与相关损失评估。同时，TC项目能够实现网络推理能力与企业规模网络监控和管控系统的整合，以增强关键节点的安全策略有效性。

从2016年10月到2019年5月，DARPA TC项目共组织了5次较大规模的红蓝对抗交战演习（Engagement）。在每次对抗中，TC总共划分为5个技术域（Technical Areas, TAs），其时间跨度超过20天。TA5.1实现了包括Carbanak、Uroburos、DustySky、OceanLotus、njRAT、HawkEye、DeputyDog等多种恶意软件在攻防平台中的投放。DARPA TC的攻击模拟展现了参与团队在APT技战术的深厚积累。

参考绿盟的文章并强烈推荐：https://www.nsfocus.com.cn/html/2020/21_0824/605.html

Poirot [CCS’19]

第二篇论文是来自CCS’19的 Poirot。

Sadegh M, et al. Poirot: Aligning Attack Behavior with Kernel Audit Records for Cyber Threat Hunting. CCS’19

https://dl.acm.org/doi/pdf/10.1145/3319535.3363217

伊利诺伊大学芝加哥分校、密歇根大学迪尔伯恩分校

这篇文章的主要贡献如下：

利用网络威胁情报(CTI)关联性检测APT攻击
使用审计日志，将威胁检测建模为一个非精确的图模式匹配（Graph Pattern Matching, GPM）问题
– 在大图中搜索与某个特定图相匹配的子图
相似性度量，攻击行为与内核审计日志对齐
– 内核审计日志构建溯源图（provenance graph）
– CTI关联构建查询图（query graph）

整个Poirot的框架图如下图所示，核心内容如下：

(1) 该图右边部分是上篇论文的基本流程，即从三个操作系统（BSD、Linux、Windows）审计日志信息中构建 溯源图（Provenance Graph），然后还原攻击场景
(2) 左边引入了外部IOC关系信息，提取并构建攻击行为的查询图（Query Graph），这里引入了图对齐或图匹配
(3) 最后通过对齐和阈值计算算法生成对应的分数，实现最终的分析取证并生成警报
– 图中顶点表示实体，边表示信息流和因果关系

接下来补充查询图（Query Graph）构建的过程。相当于给你一篇APT分析报告，它会自动生成对应的查询图，如下图所示，A执行B的exe程序，并写入C，然后写入D注册表，再想E发送请求。

椭圆-进程
菱形-套接字
矩形-文件
五边形-注册表

对应的匹配过程如下图所示，Gq表示查询图，Gp表示溯源图。个人理解，DARPA TC数据会生成溯源图，然后和查询图匹配出来两个对应的结果子图，如最右边所示。从而更好地发现那部分子图是在实施APT攻击。

该方法还包括两种类型的对齐：node alignment和graph alignment。

由于作者能力有限且理解不够，一些细节未能很好地表达，还请见谅。建议大家去阅读原文，这些公式及算法非常重要，当然我也会继续努力提升自己的阅读能力，多向这些大佬学习并力争撰写好的论文，共勉。

实验结果如下图所示，比如不同恶意软件（如海莲花OcenLotus）对应的查询图以及对其过程。

其他的实验结果如下，比如选择阈值的对比结果，这也将决定对齐算法的分数。

实验结果表明：

CTI相关性可用于威胁猎杀，并且具有较好的鲁棒性和可靠性
Poirot方法能有效从溯源图中实现APT组织查询图（攻击链）匹配及对齐

本文方法与传统方法对比如下：

不同于基于符号执行的方法，Poirot不依赖于符号表达式，而是寻找系统的相关性和信息流
传统方法的网络威胁情报相关性被完全忽视，未被用于威胁检测
本文方法引入图匹配算法，这与之前的方法不同

HOLMES [S&P’19]

第三篇论文是S&P’19经典的 HOLMES。

Sadegh M. Milajerdi, et al. HOLMES: Real-time APT Detection through Correlation of Suspicious Information Flows. S&P’19

https://arxiv.org/pdf/1810.01594.pdf

伊利诺伊大学芝加哥分校、密歇根大学迪尔伯恩分校、石溪大学

这篇文章的主要贡献如下：

构建一种可以实时检测APT攻击的系统，有效利用攻击活动可疑信息流的相关性
将APT活动信息映射到杀伤链，设计高级场景图（high-level scenario graph，HSG）实现低层次（日志、警报）信息到高层次的映射（语义鸿沟），从而使得HOLMES能有检测良性或攻击场景
系统和实验完整性：虚假依赖关系剪枝、降噪处理（紧密性）、HSG排序

其框架图如下所示，前面基本类似，但右端增加了一个高级场景图（high-level scenario graph，HSG），从而实现低层次（日志、警报）信息到高层次的映射，解决论文中提到的语义鸿沟。该方法能够实时检测系统，产生APT报警；并能实时产生高级别的攻击图来描述攻击者的行为，协助防御者进行实时地安全响应。

HSG对应如下图所示，传统比如是审计日志信息，直接到上层的APT攻击阶段（杀伤链）会存在语义损失，即：低级别审计数据与攻击目标意图与高级杀伤链（kill-chain）视角之间存在巨大的语义差距。因此引入TTPs和HSG，通过ATT&CK框架映射的中间层来提升实验效果。

APT攻击检测存在的难点可以概括如下三点，该方法能有效解决这些困难。

攻击隐蔽（Stealthy Attacks）
大海捞针（Needle in a haystack）
实时检测（Real-time detection）

下面简单介绍一个运行时APT攻击溯源图（Provenance Graph）示例。如下图所示，可以看到攻击行为是从初始入侵到C&C通信，再到内部侦查、数据读取、权限提升，以及内部侦查、清除痕迹、窃取信息等。这其实就是一个溯源图，通过数据之间的因果关系生成这样的图，比如C&C通讯、提权、文件操作等进行关联。而上面是正常操作行为。

椭圆、菱形、矩形、五边形、七边形、圆柱

实验结果表明，HOLMES能有效区分良性场景和攻击场景。下图是攻击场景所涉及流程（七维对应杀伤链）及阈值分数，能有效识别APT攻击。

下图展示了APT攻击和良性事件的有效区分。

传统方法存在的缺点如下：

基于统计特征的方法对时间跨度长、执行缓慢攻击的检测不佳
基于系统调用日志的方法对实时攻击检测效果不佳
对比方法：ProTracer[NDSS’16]、MPI[USENIX’17]、SLEUTH [USENIX’17]、PrioTracker[NDSS’18]

本文HOLMES的优点如下：

攻击粒度更细
从溯源图到攻击链的映射引入了HSG解决语义鸿沟问题
能有效检测长期潜伏实时的APT攻击
通过引入降噪算法解决HSG紧密性问题

正是综合各种优点，论文的故事叙述非常棒，并结合之前的成果，所以他们能发到S&P，非常值得我学习。

Extrator [EurS&P’21]

第四篇论文是EurS&P’21的 Extrator。

Kiavash Satvat, et al. EXTRACTOR: Extracting Attack Behavior from Threat Reports. EurS&P’21

https://arxiv.org/pdf/2104.08618.pdf

伊利诺伊大学芝加哥分校

由于CTI报告海量且非结构化，安全人员很难从文本中提取出真正有效的信息，本文提出了融合自然语言处理的Extrator方法。其主要贡献如下：

提出一个自动化工具Extrator，用于自动从网络威胁情报（CTI）报告中提取出攻击行为信息
利用自然语言处理（NLP）从CTI报告中精确地提取攻击行为
使用语义角色标注（SRL）进行语义分析，理解攻击行为关系，并将非结构化文本转化为溯源图

其框架图如下图所示，包括：

标准化
拆分、同义词、主动语态
消歧
主语省略句消除或补齐、带刺消除、同义词消除
文本归纳
去除语句冗余、去掉单词冗余
溯源图构建
语义角色标注、溯源图构建

实体识别和实体消歧示例如下图所示：

实验表明Extrator可以有效提取CTI报告的攻击信息，并以溯源图形式展现。同时，生成的溯源图与人工生成的溯源图能够进行匹配，验证了方法的有效性，并且溯源图可以进一步作为威胁情报检测系统的输入。下图展示了不同攻击场景的精确率、召回率和F1值。

方法对比：

与iACE等方法不同，本文专注于提取攻击行为，并以溯源图的形式捕获系统级因果关系

本文仍然存在一些缺陷。

由于NLP复杂性，提取精度会损失，某些未知实体无法有效识别
受到CTI报告作者的风格影响，需要专家协作
审计日志提取的信息限制了细粒度攻击建模

简单总结
写到这里，作者简单总结下伊利诺伊大学芝加哥分校的五个工作，可以很好地看到他们逐年的优化和改进。分别对应：SLEUTH[USENIX’17]、NODOZE[NDSS’19]、Poirot[CCS’19]、HOLMES[S&P’19]、Extrator[EurS&P’21]。

SLEUTH[USENIX’17]
引入溯源图检测APT攻击
NODOZE[NDSS’19]
增加了威胁检测和异构图构建
Poirot[CCS’19]
融合IOC信息，增加了查询图和溯源图的对齐算法
HOLMES[S&P’19]
融合HSG和ATT&CK框架解决语义损失问题，增加去噪剪枝等操作
Extrator[EurS&P’21]
结合NLP方法（消歧）和外部APT分析报告抽取知识，并构建溯源图

欢迎大家继续补充作者写得的不足，因为阅读有限，也可能漏掉一些重要论文和方法。这里简单补充几个作者分享不足之处和疑惑。

问题1：实验怎么评价它的精确率、召回率和F1值呢？是算APT攻击正确识别数量，还是实体识别数量，还是溯源图中子图匹配数量呢？
问题2：如何去鉴别一个APT攻击，这点也非常重要。是将进程、文件、通信等不同对象标注成不同类别，构建相互之间的关联呢？
问题3：如何生成溯源图，并且代码细节如何实现呢？
问题4：论文中算法核心实现过程需要秀璋进一步精读和理解，有机会复现文中的论文。
问题5：DARPA TC数据集是否开源，我们能否继续优化方法。

PS：下面的论文由于阅读还存在一些疑惑，作者就进行简单介绍，还请读者见谅。

HINTI [RAID’20]

第五篇论文是RAID’20的 HINTI。

Jun Zhao, et al. Cyber Threat Intelligence Modeling Based on Heterogeneous Graph Convolutional Network. RAID’20

https://www.usenix.org/system/files/raid20-zhao.pdf

北京航天航空大学、密西根州立大学

这篇文章的主要贡献如下：

提出一种基于异构图卷积网络的威胁情报模型，建模IOC之间的依赖关系
从非结构化威胁描述中自动提取网络威胁对象，多粒度注意力机制学习特征的重要性
攻击偏好建模：将具有相同偏好的攻击聚集（DBSCAN算法）

与现有的CTI框架不同，HINTI旨在实现一个CTI计算框架，它不仅可以有效提取IOC，而且还可以建模和量化它们之间的关系。下表展示了17种元路径关系。

HINTI能有效挖掘隐藏在IOCs之间相互依赖关系和安全知识，并应用于威胁模型，其核心四个步骤如下。

(1) 首先，通过B-I-O序列标注方法对安全相关帖子进行标注，用于构建IOC提取模型。
(2) 然后将标记的训练样本输入我们提出的神经网络，以训练提出的IOC提取模型。
(3) HINTI利用句法依赖性解析器（e.g.，主-谓-宾，定语从句等）提取IOC之间的关联关系，每个关系都表示为三元组。
(4) 最后，HINTI集成了基于异构图卷积网络的CTI计算框架，以有效量化IOC之间的关系并进行知识发现。

本文提取的13种主要的IOC性能如表3所示。总的来说，我们的IOC提取方法在精确率、召回率、平均F1值都表现出了优异的性能。然而，我们观察到在识别软件和恶意软件时的性能下降，这是因为大多数软件和恶意软件是由随机字符串命名，如md5。

图8显示了不同类型元路径下的前3个聚类结果，其中元路径 AVDPDTVTAT(P17) 在紧凑和分离良好的集群中性能最好，这表明它比其他元路径在描述攻击偏好方面具有更丰富的语义关系。

与之前的方法对比，本文也存在一些缺陷：

未在真实攻击场景实现
未实现对未知攻击的预测（知识推理）
未实现运行时检测及长期潜伏的APT攻击检测
没有和主流的知识框架融合

UNICORN [NDSS’20]

第六篇论文是NDSS’20的 UNICORN。

Xueyuan Han, et al. Unicorn: Runtime Provenance-Based Detector for Advanced Persistent Threats. NDSS’20

https://arxiv.org/pdf/2001.01525.pdf

哈佛大学、布里斯托大学、伊利诺伊大学香槟分校、不列颠哥伦比亚大学

这篇文章的主要贡献如下：

针对APT特性设计一种基于溯源图（Provenance Graph）的运行时APT检测方法（直方图和概要图）
UNICORN能在没有先验攻击知识的前提下实现APT攻击检测，且准确率高和误报率低
第一个对本地完整系统进行运行分析的APT入侵检测系统，概要图能对抗长时间潜伏的投毒攻击

其框架如下图所示，包括四个核心步骤：

①构建溯源图
②建立运行时直方图
③计算概要图
④聚类

直方图生成算法如下，建议读者精读原文。

实验结果如下图所示：

同时包括一些详细的性能对比。

UNICORN与之前的方法对比结果如下：

Holmes[S&P’19]和Poirot[CCS’19]：需要先验专家知识（先决条件-结果模式）
基于系统调用和日志事件的检测方法：由于数据过于密集，难以对长时间的攻击行为进行建模
由于APT潜伏时间长且持久化，攻击行为会缓慢改变传统模型以逃避检测系统（投毒攻击）

UNICORN的局限性和改进如下：

需要定期重新训练
正常行为改变可能会产生误报
未考虑异质性行为
更大的实验评估(IDS数据集)

ProvDetector NDSS’20

第七篇论文是NDSS’20的 ProvDetector。

Qi Wang, et al. You Are What You Do: Hunting Stealthy Malware via Data Provenance Analysis. NDSS’20

https://www.ndss-symposium.org/wp-content/uploads/2020/02/24167-paper.pdf

伊利诺伊大学香槟分校、NEC实验室、德克萨斯州大学达拉斯分校

首先，我们先介绍下离地攻击。

只使用预安装的软件并且攻击者没有在系统上安装额外的二进制可执行文件。带有宏、VB脚本、Powershell脚本或者使用系统命令（如netsh命令）的文档属于离地攻击的范围。

由于现有反病毒软件和方法很难检测到该类攻击，本文提出一种ProvDetector方法，它需要依赖内核级的溯源监控来捕获目标程序的动态行为。

这篇文章的主要贡献如下：

提出一种基于溯源图的系统，用于检测伪装技术的隐蔽恶意软件（离地攻击 | 无文件攻击）
提出一种新的路径选择算法来识别溯源图中潜在的恶意部分（恶意行为与底层操作系统交互）
设计一个新的神经嵌入和机器学习管道，自动为每个程序建立一个轮廓并识别异常进程

ProvDetector的核心ProvDetector分为四部分：图构建、特征提取、嵌入和异常检测。部署监控代理，按照定义收集系统数据放入数据库。定期扫描数据库检查是否有新添加的进程被劫持。对于每个进程，先构建起起源图（图构建）。然后从源点图中选择路径子集（特征提取）并将路径转换为数值向量（嵌入）使用一个新颖的检测器来获得嵌入向量的预测并报告最终决定（异常检测）。

实验结果如下图所示：

你可能会疑惑为什么分享这篇文章呢？一方面由于它也用到了溯源图概念，另一方面同样来自于伊利诺伊大学香槟分校团队（同UNICORN），并且将溯源图应用于其他领域，即检测伪装技术的隐蔽恶意软件。这也是我们探索论文idea的一个思路，可能其他领域或方法也会给我们带来灵感喔。当然，目前作者科研能力太弱，需要不断提升，学习嘛，一辈子的事情。加油！

RapSheet [S&P’20]

第八篇论文是S&P’20的 RapSheet。

Wajih Ul Hassan, et al. Tactical Provenance Analysis for Endpoint Detection and Response Systems. S&P’20

https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9152771

伊利诺伊大学香槟分校、NortonLifeLock

本文首先指出已有的EDR（端点检测和响应）工具存在的三个主要弊端：

(1) EDR工具会产生大量的虚假警报，从而为分析人员积压了调查任务；
(2) 确定这些威胁警报的准确性需要大量的低级系统日志，人工任务繁琐；
(3) 由于日志占用巨大资源，系统日志通常在进行调查之前就被删除。

因此，本文提出了战术源图（Tactical Provenance Graphs, TPGs）的概念，个人感觉TTPs+溯源图，并研发了RapSheet系统，直接推理EDR系统生成的威胁警报之间因果关系。其主要贡献如下：

首次将溯源图引入商业EDR（Endpoint Detection and Response）
提出战术溯源图(Tactical Provenance Graphs, TPGs)表示EDR生成威胁警报间的因果依赖关系
引入一种威胁评分方法：根据TPGs中存在的单个威胁警报之间的时间顺序来评估风险

本文是用商业赛门铁克EDR软件进行真实检测和实验。其实验结果表明：

提升商业EDR效果，检测未知攻击行为
减少系统日志降低系统存储开销
提高赛门铁克EDR的威胁检测精确度
保留警报之间的因果关联性

RapSheet与传统方法对比：

Holmes商业EDR部署复杂(保留100%日志)
holmes16条TTP匹配规则 vs RapSheet增加至67条
实践中EDR工具会限制日志缓冲区
NoDoze防止投毒攻击假设(正常行为数据库)
未跟踪ALPC消息（Windows），会断开溯源图
利用DTaP高效分布式存储提高查询响应时间

ATLAS [USENIX’21]

最后一篇是2021年USENIX的论文，作者仅作了简单的阅读。即 ATLAS。该文章来自普度大学团队，针对APT研究成果还包括NDSS’13的BEEP、NDSS’16的ProTracer等。此外，CCS21也发现了新的溯源图研究成果，说明基于溯源图的研究仍然是一个值得探索的方向。

Abdulellah Alsaheel, et al. ATLAS: A Sequence-based Learning Approach for Attack Investigation. USENIX’21

https://www.usenix.org/system/files/sec21-alsaheel.pdf

普度大学

本文提出一种基于序列的攻击调查学习方法ATLAS。其主要观察结果是：无论所利用的漏洞和执行的有效载荷如何，不同的攻击可能共享相似的抽象攻击策略。ATLAS是利用因果关系分析、自然语言处理和机器学习技术的新颖组合来构建基于序列的模型，该模型从因果图建立攻击和非攻击行为的关键模式。在推断时间，给定威胁警报事件，确定因果图中的攻击症状节点。然后，ATLAS构造一组与攻击症状节点关联的候选序列，使用基于序列的模型来识别顺序中有助于攻击的节点，并将识别出的攻击节点统一起来构建攻击记录。

参考Serendipity老师的文章：https://zhuanlan.zhihu.com/p/393375355

本文的主要贡献如下：

利用审计日志生成端到端攻击故事（end-to-end attack story）的框架
构建一个基于序列的模型：因果关系图（causal graph）+自然语言处理+深度学习
真实APT攻击事件（10个）进行实验，并能恢复攻击关键步骤及还原攻击故事
研究发现不同的攻击可能共享相似的抽象攻击策略

个人感觉生成Attack Story还原攻击故事是本文的一大亮点。

实验结果如下图所示，建议阅读原文。

ATLAS 主要涉及支持审计日志溯源追踪的三个子主题，包括：溯源图的因果关系分析、基于异常的分析以及 ML 技术在攻击调查中的应用。当然也存在一定的缺陷，即：

当前工作仅限制于Windows平台
无法检测到使用类似正常事件序列的隐藏攻击行为，比如模拟攻击
模型性能很大程度上取决于所收集的训练日志条目的质量

三.方法对比

写到这里，上述方法已经介绍完毕，接下来我们对所有文章进行简单的研究趋势梳理和方法对比研究。

1.基于溯源图的方法研究趋势分析

研究趋势如下，还原各位老师和读者指正及补充。

2.方法优缺点对比

方法对比主要从溯源图、知识框架、先验知识和优缺点进行比较，得出如下表所示结果。个人感觉，溯源图、是否引入知识框架（ATT&CK）、是否有先验知识、是否融入NLP（消歧 | 对齐 | 去噪合真实场景应用是该方向研究的重要进步补充。

3.数据集对比

数据集的对比如下图所示，主要以DARPA TC、公开威胁情报文本和真实场景攻击数据为主。

四.总结

最后秀璋做一个简单总结，写得不足之处还请批评和指正。写这篇文章只希望帮助更多的APT攻击研究者和初学者，同时也是对自己阶段知识的总结，虽然很少有人分享类似正在研究或未发表的总结，但还是想先分享出来，与大家一起探讨和进步，真诚地希望对您有帮助吧！感恩遇见，不负青春，读博路上相互鼓励着前行。

基于溯源图的APT攻击检测是APT检测领域中一个非常重要的分支，由于APT攻击的隐蔽性、威胁性、实时性、针对性，传统的方法艰难检测，因此提出了溯源图的方法。当前的研究趋势主要表现在：

基于溯源图和知识图谱的APT攻击检测
结合APT攻击阶段特点，融合ATT&CK知识框架进行中间层特征表示，解决语义损失
全系统真实场景的细粒度APT攻击检测
引入外部威胁情报知识（NLP消歧对齐）来辅助APT检测
无先验专家知识
对未知APT攻击实现预测

未来的研究趋势，个人感觉如下，不喜勿喷，哈哈！

基于图神经网络的APT攻击检测，图可能更好地表达攻击之间的关系
从NLP角度分析APT攻击以揭示其特性（融合恶意代码分析）
检测并定位APT攻击样本中0-day漏洞是否存在及位置，感觉很难
场景迁移：EDR、无文件攻击、在线场景
加密、混淆、对抗样本、无文件

这篇文章就写到这里了，希望对您有所帮助。由于作者英语实在太差，论文的水平也很低，写得不好的地方还请海涵和批评。同时，也欢迎大家讨论。学安全两年，认识了很多安全大佬和朋友，希望大家一起进步。同时非常感谢参考文献中的大佬们，感谢老师、实验室小伙伴们的教导和交流，深知自己很菜，得努力前行。感恩遇见，且行且珍惜，小珞珞太可爱了，哈哈。

《珈国情》
明月千里两相思，
清风缕缕寄离愁。
燕归珞珈花已谢，
情满景逸映深秋。

(By:Eastmount 2021-10-11 周一夜于武汉 http://blog.csdn.net/eastmount/ )

你可能感兴趣的:(娜璋带你读论文,APT攻击检测,安全顶会论文,溯源图,网络安全,深度学习)

云原生API Gateway：连接微服务的桥梁 AI云原生与云计算技术学院云原生 gateway 微服务 ai
云原生APIGateway：连接微服务的桥梁关键词：云原生、API网关、微服务架构、服务治理、流量管理、服务网格、DevOps摘要：本文深入探讨云原生环境下API网关的核心原理与实践应用，解析其在微服务架构中作为统一入口的关键作用。通过详细阐述API网关的核心功能、技术架构、算法原理及数学模型，结合Kubernetes实战案例演示流量管理、安全防护、服务编排等核心能力。同时分析典型应用场景，推荐前
Android导入compile 'com.roughike:bottom-bar:2.3.1'会导致V7包报错
出现问题Error:Executionfailedfortask':app:transformDexArchiveWithExternalLibsDexMergerForDebug'.>java.lang.RuntimeException:java.lang.RuntimeException:com.android.builder.dexing.DexArchiveMergerException:
筑牢 AIGC 安全防线：警惕提示词注入攻击 CS创新实验室 AIGC AIGC 安全大模型提示词提示词注入
在AIGC（生成式人工智能）技术蓬勃发展的当下，其在各个领域的应用日益广泛。然而，随着AIGC技术的深入应用，安全问题也逐渐凸显，提示词注入攻击便是其中不容忽视的一大威胁。对于AIGC开发者而言，深入了解提示词注入攻击并做好防范工作，是保障AIGC系统安全稳定运行的关键。提示词注入攻击的基本知识提示词注入攻击是指攻击者通过精心设计和构造提示词，利用AIGC模型对输入文本的处理机制，干扰模型的正常运
iOS Widget 开发-1：什么是 iOS Widget？开发前的基本认知技术拾光 iOS Widget 技术手册 ios swift swiftui widget
随着iOS系统的不断演进，Widget（小组件）已经成为提升用户体验的重要组成部分。从iOS14开始，Apple引入了全新的WidgetKit框架，允许开发者使用SwiftUI创建高度可定制、灵活展示的Widget，并可添加到主屏幕、锁屏界面甚至待机模式中。本篇博客将从基础概念出发，带你了解iOSWidget的作用、类型、开发架构以及常见误区，为后续深入开发打下坚实基础。Widget是什么？Wid
Python 异步爬虫（aiohttp）高效抓取新闻数据小白学大数据 python 爬虫开发语言
一、异步爬虫的优势在传统的同步爬虫中，爬虫在发送请求后会阻塞等待服务器响应，直到收到响应后才会继续执行后续操作。这种模式在面对大量请求时，会导致大量的时间浪费在等待响应上，爬取效率较低。而异步爬虫则等待可以在服务器响应的同时，继续执行其他任务，大大提高了爬取效率。aiohttp是一个支持异步请求的Python库，它基于asyncio框架，可以实现高效的异步网络请求。使用aiohttp构建异步爬虫，
大语言模型与增强现实：空间计算时代的AI原生应用 Agentic AI人工智能与大数据 CS 语言模型 ar 空间计算 ai
大语言模型与增强现实：空间计算时代的AI原生应用关键词：大语言模型（LLM）、增强现实（AR）、空间计算、AI原生应用、多模态交互、具身智能、虚实融合摘要：当“能对话的AI大脑”（大语言模型）遇到“能叠加虚拟世界的魔法眼镜”（增强现实），一场空间计算时代的革命正在发生。本文将带你一步步拆解大语言模型与AR的“强强联合”：从基础概念到技术原理，从真实案例到未来趋势，用“给小学生讲故事”的方式，讲清这
Claude 最新功能解读：2024 年 AI 技术的前沿发展 AI原生应用开发人工智能 ai
Claude最新功能解读：2024年AI技术的前沿发展关键词：Claude3.5Sonnet、多模态增强、长上下文理解、工具调用进化、个性化AI、伦理安全机制、2024AI前沿摘要：2024年，Anthropic推出的Claude3.5Sonnet成为AI领域的“现象级更新”——它不仅能同时处理文字、图片、音频等多种信息（多模态），还能记住长达100万字的上下文（相当于一本《哈利波特》），甚至能像
AI人工智能领域，Stable Diffusion掀起的技术风暴 AI大模型应用工坊人工智能 stable diffusion ai
AI人工智能领域，StableDiffusion掀起的技术风暴关键词：AI人工智能、StableDiffusion、技术风暴、图像生成、扩散模型摘要：本文深入探讨了AI人工智能领域中StableDiffusion所掀起的技术风暴。首先介绍了StableDiffusion的背景，包括其目的、预期读者和文档结构等。详细阐述了核心概念与联系，通过文本示意图和Mermaid流程图进行清晰展示。对核心算法原
AI人工智能浪潮中，GPT的技术优势凸显 AI学长带你学AI 人工智能 gpt ai
AI人工智能浪潮中，GPT的技术优势凸显关键词：人工智能、GPT、自然语言处理、深度学习、Transformer、大语言模型、技术优势摘要：本文深入探讨了在人工智能浪潮中GPT(GenerativePre-trainedTransformer)系列模型的技术优势。我们将从GPT的核心架构出发，分析其独特的技术特点，包括自注意力机制、预训练-微调范式、零样本学习能力等。通过与传统NLP方法的对比，揭
PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第1-11个视频笔记）胡说八道的Dr. Zhu 深度学习 pytorch 学习
本学习笔记源自于B站up主【我是土堆】的视频教程：PyTorch深度学习快速入门教程（绝对通俗易懂！）【小土堆】本博客是该视频教程中第1-11个视频的详细学习笔记，第12-22个视频、第23-33个视频的详细学习笔记链接如下：PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第12-22个视频笔记）PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第23-33个视频笔记）目录1、P
AI伦理与安全之-哥斯拉与缰绳：如何让“哥斯拉”听懂人类的“悄悄话”？众链网络 AI伦理与安全 AI 人工智能 AI工具 AI智能体
相关文章:AI伦理与安全AI伦理与安全之-镜子与偏见：我们教给它的，究竟是智慧还是偏见？AI伦理与安全之-哥斯拉与缰绳：如何让“哥斯拉”听懂人类的“悄悄话”？AI伦理与安全之-梦境与幻觉：它为何会一本正经地胡说八道？在上一篇中，我们谈到AI像一面“镜子”，会映照出我们数据中的偏见。但那只是AI伦理问题中的“序章”。一个更深邃、更终极的挑战，正横亘在人类与超人工智能（ASI）的未来之间。这个挑战，就
ipmitool使用手册刺痛小白开发语言 linux
一、安装#安装ipmitoolyuminstallipmitool–y#检测ipmitool是否安装成功rpm-qaipmitool三、使用命令及参数二、报错处理：Couldnotopendeviceat/dev/ipmi0or/dev/ipmi/0or/dev/ipmidev/0:Nosuchfileordirectory解决办法：需要加载相关模块查看先关模块是否加载（可以看出模块未加载）lsm
HYTop.mdb解压工具：MDB文件自动化处理
本文还有配套的精品资源，点击获取简介：HYTop.mdb解压工具是一款处理MicrosoftAccess默认格式MDB数据库文件的实用工具。它能够帮助用户在空间压缩后进行解压操作，并支持网站打包流程的自动化启动。工具的主要功能是恢复压缩数据至原始状态，确保文件的完整性和安全性，在网络传输和服务器存储过程中发挥作用。此外，它还能自动化进行文件解压、配置调整和数据库连接验证等部署步骤，简化网站部署流程
9款免费毕业论文工具推荐：AI写作神器助你高效完成论文
在完成毕业论文的过程中，学生群体往往会遭遇时间紧张、内容创作受阻等多重挑战。而随着科技进步，各类AI写作工具陆续涌现，这些工具能够有效提升写作效率、优化论文质量。接下来将为大家详细介绍9款免费的毕业论文辅助工具，借助这些AI写作利器，助力你更高效地完成论文撰写。图灵论文AI写作助手——专注于论文领域的神级工具工具链接:图灵论文AI写作助手快速初稿生成：用户仅需输入论文标题，平台即可在30分钟内生成
max open files mysql_MySQL性能优化之open_files_limit，table_open_cache和max_connections配置关系... Moriarty K max open files mysql
MySQL的变量open_files_limit，table_open_cache和max_connections是相互关联的。如果对有些变量进行了设置，有的变量没有设置，mysql会根据一定的计算公式进行计算得出其他的，当然有些时候会触发mysql的一些警告来。本文探讨的均基于Linux系统首先，mysql会基于max_connections和table_open_cache的值计算最低需要的文
TeamT5-ThreatSonar 解决方案：构建智能动态的 APT 与勒索软件防御体系江苏思维驱动智能研究院有限公司自动化网络大数据
一、核心功能深度解析：从威胁狩猎到自动化响应的闭环能力（一）威胁狩猎：主动挖掘潜伏性攻击的“数字侦探”多层级威胁识别引擎：静态特征匹配：内置超1000种APT后门签名（如Regin、Duqu等高级工具包特征），实时扫描端点文件、注册表与进程，比对全球威胁情报库（每日更新超50万条IOC）；动态行为分析：通过内核级监控技术，捕捉异常操作（如非预期的进程注入、加密API高频调用），例如某银行端点出现“
深度学习Pytorch(一) Bgemini 深度学习 pytorch 深度学习 python
深度学习Pytorch(一)前言：必须使用英伟达显卡才能使用cuda（显卡加速）！移除环境：condaremove-npytorch--all一、安装Pytorch下载Anaconda打开AnacondaPrompt创建一个Pytorch环境：condacreate-npytorchpython=3.9激活Pytorch环境：condaactivatepytorch查看当前包：piplist安装P
关于 Linux中系统调优的一些笔记山河已无恙 Linux笔记 Linux 性能调优 1024程序员节 linux 运维
写在前面推送的的邮件里看到有大佬讲的公共课，听了之后这里整理学习笔记。因为是公开课，所以讲的很浅，没接触过，这里做为了解，长长见识。博文内容包括系统调优原理概述如何检测系统的性能瓶颈如何进行内核参数调优如何限制服务的资源占用自定义tuned调优配置集我突然又明白，死亡是聪明的兄长，我们可以放心地把自己托付给他，他会知道在我们有所准备的适当时刻前来。我也突然懂得，原来痛苦、失望和悲愁不是为了惹恼我们
PyTorch深度学习优化实战：从理论到实践的现代化技能指南智算菩萨深度学习 pytorch 人工智能
引言：现代PyTorch开发的核心思维在深度学习技术日新月异的今天，掌握PyTorch不仅仅意味着能够搭建和训练神经网络，更重要的是理解如何高效地利用现代硬件资源、优化模型性能并构建可扩展的AI系统。随着PyTorch2.x系列的成熟，特别是最新2.7版本的发布，框架为开发者提供了前所未有的优化工具和性能潜力。本文将深入探讨现代PyTorch开发中的核心优化技能，从编译器优化到注意力机制革新，从内
双系统如何做接口认证-V2 CATTLECODE python 开发语言
现有A系统，B系统，A系统启动的时候调用B系统的注册接口API1（把A系统配置信息注册到B系统），A系统定时向B系统接口AP2发送心跳信息，B系统根据业务情况，调用A系统的业务接口AP3，请设计两系统的接口认证方式。以下是为A系统（Python）与B系统（SpringBoot）设计的双向安全认证方案及关键代码实现，结合JWT、数字签名和HTTPS加密，确保注册、心跳、业务调用的安全可靠。整体认证方
AI原生应用：多模态交互技术的5大核心应用场景解析 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AI-native ai
#AI原生应用：多模态交互技术的5大核心应用场景解析>关键词：多模态交互、AI原生应用、人机交互、深度学习、应用场景>摘要：本文将深入解析多模态交互技术的核心原理，通过智能家居、医疗诊断、自动驾驶、教育创新和虚拟助手五大应用场景，揭示AI如何像人类感官协同工作般理解世界。文章包含技术原理图解、真实案例代码和未来趋势预测。##背景介绍###目的和范围解析多模态交互技术在AI原生应用中的落地实践，涵盖
ArrayList的扩容机制(源码解析) Exclusive_Cat ArrayList java 开发语言
我们会从ArrayList的源码进行讲起，一点点的解析各种细节，首先我们要在idea中创建一个ArrayList的集合，调用它的add方法，然后摁住CTRL键，鼠标点击add方法查看其中的源码部分。packagecollection;importjava.util.ArrayList;publicclassArrayListTest{publicstaticvoidmain(String[]arg
PyTorch 2.7深度技术解析：新一代深度学习框架的革命性演进智算菩萨深度学习 pytorch 人工智能
引言：站在AI基础设施变革的历史节点在2025年这个充满变革的年份，PyTorch团队于4月23日正式发布了2.7.0版本，随后在6月4日推出了2.7.1补丁版本，标志着这个深度学习领域最具影响力的框架再次迎来了重大突破。这不仅仅是一次常规的版本更新，而是一次面向未来计算架构和AI应用场景的全面重构。从底层硬件支持到上层API设计，从编译器优化到注意力机制革新，PyTorch2.7展现出了前所未有
Bash Shell面试题高级汇总002 韩公子的Linux大集市 Bash入门 bash 开发语言
文章目录一、Shell原理进阶二、性能与资源管理三、并发控制与IPC四、安全与防御五、调试与追踪六、文本处理黑科技七、系统级深入题八、容器化环境九、综合场景题十、面试官深度追问方向以下是一份深度梳理的LinuxShell高级面试题汇总，涵盖脚本优化、系统原理、故障排查、安全实践等高频考点，适用于中高级开发/运维岗位：一、Shell原理进阶exec3<>file的作用是什么？文件描述符0-2的默认指
Boltz-2：革命性生物分子模型，加速药物发现的新引擎花生糖@ AIGC学习资料库 Boltz-2 生物模型 AI
在药物研发领域，预测蛋白质与其他分子间的结合强度（BindingAffinity）始终是核心挑战之一。传统方法如自由能微扰法（FEP）虽然精确，但计算成本极高，难以大规模应用。如今，Boltz-2的诞生打破了这一瓶颈——这是首个开源的深度学习模型，其结合强度预测准确度接近FEP方法，却将速度提升了1000倍，成为药物早期筛选的“加速器”。项目简介Boltz-2是由jwohlwend团队开发的生物分
android webview confilm,Android-WebView(四) 实现一个安全的webView 王诗沐 android webview confilm
正如文章Androidwebview(三)addJavascriptInterface的安全问题中所展示的那样,Androidapi17(Android4.2)版本之前,通过WebView.addJavascriptInterface()方法添加的JavaBridge存在安全性风险,那么该怎么避免呢?js向java通信的渠道--prompt我们知道js中常用的方法:alert,console.lo
【高频考点精讲】前端性能监控中的安全隐患：如何安全地收集用户数据全栈老李技术面试前端高频考点精讲前端 javascript html css 面试题 react vue
前端性能监控中的安全隐患：如何安全地收集用户数据‍作者：全栈老李更新时间：2025年7月‍适合人群：前端初学者、进阶开发者版权：本文由全栈老李原创，转载请注明出处。最近有个粉丝在后台问我："老李啊，我们公司要做性能监控，但法务部门死活不让收集用户数据，说会踩红线，这活儿还怎么干？"这问题问得好，今天咱们就来聊聊这个前端工程师的必修课——如何在性能监控中安全地收集数据。（全栈老李友情提示：本文代码示
ace.js在线代码编辑器实战明月566 js 在线代码编辑器 js代码编辑器语法检测 ace.js ace.js在线代码编辑器
背景ACE简介：功能实现1、引入js2、添加控件3、初始化组件4、保存时代码语法检测5、效果图及完整示例代码：6、官网在线测试：7、遇到的一些问题：背景项目需要，在一些场景，用户需要手动编写一些js脚本来实现自己的功能；前期一直用文本框显示，不便于编辑和查看。因此需要引入一个在线代码编辑器。效果如下：ACE简介：ACE是一个开源的、独立的、基于浏览器的代码编辑器，可以嵌入到任何web页面或Java
WebView 安全之 addJavascriptInterface
WebView安全之addJavascriptInterface不会写代码的IT男关注2016.01.0318:14*字数474阅读5668评论0喜欢30x00addJavascriptInterface介绍WebView是Android平台下的一个重要组件，通常用来在Activity中嵌入一个简单的浏览器，实现在线网页浏览的功能。比如下面代码实现访问Google页面：WebViewwebView
算法题目记录 iamwiam java
数据空间研究院-后端试题题目一：线程安全的链表描述：实现题目二：自定义注解与反射描述：实现题目三：简化的消息队列描述实现题目一：线程安全的链表描述：实现一个线程安全的链表类ThreadSafeLinkedList，支持以下操作：add(Telement)-在链表末尾添加元素。remove(Telement)-移除链表中的指定元素。contains(Telement)-检查链表中是否包含指定元素。要
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s