bsauce

phasar LLVM静态分析框架介绍

一、简介

简介：PhASAR是一个基于LLVM的静态分析框架，用户可以进行数据流分析，框架会帮助进行指向分析、调用图构建。

安装：ubuntu下运行如下脚本。

# 安装
$ git clone https://github.com/secure-software-engineering/phasar.git
$ sudo ./bootstrap.sh
# 测试：若能获取正常输出，则表示安装正确。
$ phasar-llvm --module test/build_systems_tests/installation_tests/module.ll -D ifds-solvertest

架构：PhASAR调用LLVM API实现，可扩展性强，可以编写插件来增加功能。提供了命令行接口，也提供了封装的API来开发新工具。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WNYmbFvn-1595854253757)(./picture/1-phasar-architecture.png)]

二、实现

（1）IFDS分析

要解决IFDS（Inter-procedural Finite Distributive Subset）问题，开发者需要定义一个类型，实现FlowFunctions接口。

template  struct FlowFunctions{
    virtual ~FlowFunctions() = default;
    // 用于处理所有的过程间流
    virtual FlowFunction *getnormalFlowFunction(N curr, N succ) = 0;
    // 用于处理调用站点（call-site）上的过程间流，通常，这个流函数工厂的任务是将位于给定调用站点的数据流映射到调用方法的作用域
    virtual FlowFunction *getCallFlowFunction (N callStmt, M destMthd) = 0;
    // 处理函数退出时候的过程间流（如Return）。这将被调用方的返回值以及可能通过引用或指针参数离开函数的数据流事实映射回调用方的上下文/范围。
    virtual FlowFunction *getRetFlowFunction (N callSite, M calleeMthd, N exitStmt, N retSite) = 0;
    // 沿调用站点传播调用中未涉及的所有数据流事实，通常是堆栈未被参数引用的本地数据。
    virtual FlowFunction *getCallToRetFlowFunction (N callSite, N retSite, set callees) = 0;
}

这些函数会由解决器（Solver）自动调用，根据过程间控制流图。

上面展示是函数工厂，他们会返回FlowFunction类型的小函数对象，而FlowFunction本身就是一个接口，开发人员必须提供一个适当的实现，其成员函数computeTargets接受类型为D的数据流值，并计算一组相同类型的新数据流事实。它指定了表示控制流的语句的二部图是如何构造的，并且回答了图中哪些边必须绘制这一问题。

template  struct FlowFunction{    virtual ~FlowFunction() = default;    virtual set computeTargets(D source) = 0;}

很多常用的流函数，像Gen，GenIf，Kill，KillAll和Identity已经被实现了，可以直接使用。

IDE分析

（过段时间更新

Monotone分析

（过段时间更新

内部函数和Libc函数调用的处理

LLVM目前有大约130个内部函数。这些函数用于描述分析和优化阶段的语义，没有实际的实现。稍后在编译器管道中，后端可以自由地用软件或硬件实现替换对内部函数的调用（如果目标体系结构存在这样的实现）。在LLVM中引入新的内部函数比引入新的指令更可取，因为在引入一条新指令时，必须重新审视构建在LLVM之上的所有优化、分析和工具，以使它们了解新指令。对内部函数的调用可以作为普通函数调用来处理。

LIBC标准库中包含的函数代表特殊的目标，这些函数实际上是所有实际的C和C++程序使用的。此外，标准库中包含的函数不能自己分析，因为它们大多是围绕系统调用的非常薄的包装器，通常无法用于分析。然而，在许多情况下，在执行数据流分析时不必分析这些函数。PhASAR将所有这些都建模为同一函数。分析开发人员可以通过使用特殊的摘要函数来更改默认行为并为不同的效果建模。SpecialSummaries类可用于注册除标识外的流和边缘函数。这个类知道所有的内在函数和libc函数。

三、phasar使用

3.1 使用示例——Example uses

（1）clang编译程序

// 示例程序 main.cpp
int main() {
    int i = 1;
    int j = 2;
    int k = i + j;
    return 0;
}

编译为LLVM IR：

$ clang++ -emit-llvm -S main.cpp

生成main.ll：

; ModuleID = 'main.cpp'
source_filename = "main.cpp"
target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-unknown-linux-gnu"

; Function Attrs: noinline norecurse nounwind optnone uwtable
define i32 @main() #0 {
     
  %1 = alloca i32, align 4
  %2 = alloca i32, align 4
  %3 = alloca i32, align 4
  %4 = alloca i32, align 4
  store i32 0, i32* %1, align 4
  store i32 1, i32* %2, align 4
  store i32 2, i32* %3, align 4
  %5 = load i32, i32* %2, align 4
  %6 = load i32, i32* %3, align 4
  %7 = add nsw i32 %5, %6
  store i32 %7, i32* %4, align 4
  ret i32 0
}

attributes #0 = { noinline norecurse nounwind optnone uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }

!llvm.module.flags = !{
     !0}
!llvm.ident = !{
     !1}

!0 = !{
     i32 1, !"wchar_size", i32 4}
!1 = !{
     !"clang version 5.0.1 (tags/RELEASE_501/final 332326)"}

（2）phasar分析与`mem2reg`优化

使用phasar进行IFDS分析时加-m选项，就会默认从main()第一条指令开始分析。

$ phasar-llvm -m path/to/your/main.ll -D ifds-solvertest

使用mem2reg pass来优化以上中间码，目标是尽可能多使用寄存器、少使用内存，少使用alloc：

$ opt -mem2reg -S main.ll

; ModuleID = 'main-mem2reg.ll'
source_filename = "main.cpp"
target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-unknown-linux-gnu"

; Function Attrs: noinline norecurse nounwind uwtable
define dso_local i32 @main() #0 {
     
  %1 = add nsw i32 1, 2
  ret i32 0
}

attributes #0 = { noinline norecurse nounwind uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "min-legal-vector-width"="0" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }

!llvm.module.flags = !{
     !0}
!llvm.ident = !{
     !1}

!0 = !{
     i32 1, !"wchar_size", i32 4}
!1 = !{
     !"clang version 8.0.0 "}

（3）复杂程序（函数调用）

int function(int x) {
	return x + 1;
}

int main() {
	int i = 42;
	int j = function(i);
	return 0;
}

IR（无mem2reg优化）：

; ModuleID = 'main.cpp'
source_filename = "main.cpp"
target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-unknown-linux-gnu"

; Function Attrs: noinline nounwind optnone uwtable
define i32 @_Z8functioni(i32) #0 {
     
  %2 = alloca i32, align 4
  store i32 %0, i32* %2, align 4
  %3 = load i32, i32* %2, align 4
  %4 = add nsw i32 %3, 1
  ret i32 %4
}

; Function Attrs: noinline norecurse nounwind optnone uwtable
define i32 @main() #1 {
     
  %1 = alloca i32, align 4
  %2 = alloca i32, align 4
  %3 = alloca i32, align 4
  store i32 0, i32* %1, align 4
  store i32 42, i32* %2, align 4
  %4 = load i32, i32* %2, align 4
  %5 = call i32 @_Z8functioni(i32 %4)
  store i32 %5, i32* %3, align 4
  ret i32 0
}

attributes #0 = { noinline nounwind optnone uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }
attributes #1 = { noinline norecurse nounwind optnone uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }

!llvm.module.flags = !{
     !0}
!llvm.ident = !{
     !1}

!0 = !{
     i32 1, !"wchar_size", i32 4}
!1 = !{
     !"clang version 5.0.1 (tags/RELEASE_501/final 332326)"}

运行IFDSSolverTest分析，生成IFDS/IDE结果，和intra/inter monotone framework结果不同。

IFDS/IDE结果中，每个语句N处，都保存所有的data-flow facts D。

3.2 运行分析

使用phasar进行数据流分析

（1）选择phasar自带的分析

# 使用-D选项
$ phasar-llvm -m module.ll -D IFDSSolverTest 
$ phasar-llvm -m module.ll -D IFDSUninitializedVariables

如果未指定分析，则只生成调用图和其他数据结构。目前phasar支持的分析如下：

DataFlowAnalysisType	Parameter
DataFlowAnalysisType::IFDSConstAnalysis	“IFDSConstAnalysis”
DataFlowAnalysisType::IFDSLinearConstantAnalysis	“IFDSLinearConstantAnalysis”
DataFlowAnalysisType::IFDSSolverTest	“IFDSSolverTest”
DataFlowAnalysisType::IFDSTaintAnalysis	“IFDSTaintAnalysis”
DataFlowAnalysisType::IFDSTypeAnalysis	“IFDSTypeAnalysis”
DataFlowAnalysisType::IFDSUninitializedVariables	“IFDSUninitializedVariables”
DataFlowAnalysisType::IDELinearConstantAnalysis	“IDELinearConstantAnalysis”
DataFlowAnalysisType::IDESolverTest	“IDESolverTest”
DataFlowAnalysisType::IDETaintAnalysis	“IDETaintAnalysis”
DataFlowAnalysisType::IDETypeStateAnalysis	“IDETypeStateAnalysis”
DataFlowAnalysisType::IntraMonoFullConstantPropagation	“IntraMonoFullConstantPropagation”
DataFlowAnalysisType::IntraMonoSolverTest	“IntraMonoSolverTest”
DataFlowAnalysisType::InterMonoSolverTest	“InterMonoSolverTest”
DataFlowAnalysisType::InterMonoTaintAnalysis	“InterMonoTaintAnalysis”
DataFlowAnalysisType::Plugin	“Plugin”
DataFlowAnalysisType::None	“None”

（2）命令行接口

$ phasar-llvm --help 
PhASAR v0120
A LLVM-based static analysis framework

Allowed options:

Command-line options:
  -v [ --version ]                      Print PhASAR version
  -h [ --help ]                         Print help message
  --more-help                           Print more help
  -c [ --config ] arg                   Path to the configuration file, options
                                        can be specified as 'parameter = 
                                        option'
  -s [ --silent ]                       Suppress any non-result output

Configuration file options:
  -m [ --module ] arg                   Path to the module(s) under analysis
  -E [ --entry-points ] arg             Set the entry point(s) to be used
  -O [ --output ] arg (=results.json)   Filename for the results
  -D [ --data-flow-analysis ] arg       Set the analysis to be run
  --analysis-strategy arg (=WPA)
  --analysis-config arg                 Set the analysis's configuration (if 
                                        required)
  -P [ --pointer-analysis ] arg (=CFLAnders)
                                        Set the points-to analysis to be used 
                                        (CFLSteens, CFLAnders)
  -C [ --call-graph-analysis ] arg (=OTF)
                                        Set the call-graph algorithm to be used
                                        (NORESOLVE, CHA, RTA, DTA, VTA, OTF)
  -H [ --classhierarchy-analysis ]      Class-hierarchy analysis
  -S [ --statistical-analysis ]         Statistics
  -M [ --mwa ]                          Enable Modulewise-program analysis mode
  -R [ --printedgerec ]                 Print exploded-super-graph edge 
                                        recorder
  -L [ --log ]                          Enable logging
  --emit-ir                             Emit preprocessed and annotated IR of 
                                        analysis target
  --emit-raw-results                    Emit unprocessed/raw solver results
  --emit-text-report                    Emit textual report of solver results
  --emit-graphical-report               Emit graphical report of solver results
  --emit-esg-as-dot                     Emit the Exploded super-graph (ESG) as 
                                        DOT graph
  --emit-th-as-text                     Emit the type hierarchy as text
  --emit-th-as-dot                      Emit the type hierarchy as DOT graph
  --emit-cg-as-text                     Emit the call graph as text
  --emit-cg-as-dot                      Emit the call graph as DOT graph
  --emit-pta-as-text                    Emit the points-to information as text
  --emit-pta-as-dot                     Emit the points-to information as DOT 
                                        graph
  --right-to-ludicrous-speed            Uses ludicrous speed (shared memory 
                                        parallelism) whenever possible
  --analysis-plugin arg                 Analysis plugin(s) (absolute path to 
                                        the shared object file(s))
  --callgraph-plugin arg                ICFG plugin (absolute path to the 
                                        shared object file)
  -I [ --project-id ] arg (=default-phasar-project)
                                        Project Id used for the database
  -A [ --pamm-out ] arg (=PAMM_data.json)
                                        Filename for PAMM's gathered data

（3）运行分析

$ clang++ -emit-llvm -S main.cpp
$ phasar-llvm -m path/to/your/main.ll -D IFDSSolverTest

参考：

论文笔记：PhASAR: An Inter-procedural Static Analysis Framework for C/C++

PhASAR静态分析除零错误

Phasar-IFDS框架学习笔记

iOS安全和逆向系列教程第7篇：iOS应用静态分析实战自学不成才 iOS安全和逆向系列教程 ios cocoa macos
iOS安全和逆向系列教程第7篇：iOS应用静态分析实战作者：自学不成才在上一篇文章中，我们深入探讨了Mach-O文件格式的结构和分析方法。本篇文章将继续我们的iOS逆向工程之旅，重点介绍iOS应用的静态分析技术。静态分析是指在不运行程序的情况下，通过分析应用的二进制文件来理解其功能和行为。这是逆向工程过程中必不可少的一步，能够帮助我们发现应用的核心逻辑、安全机制和潜在漏洞。静态分析的意义与目标在开
无人机仿真XTDrone学习四：XTDrone键盘控制无人机程序分析（MAVRos）一狮城乐哥 XTDrone 学习硬件工程
在XTDrone安装完成后，运行一个键盘控制无人机程序测试XTDrone安装是否存在问题。通过分析该例程，理解ROS对无人机的控制方法与控制过程。XTDrone键盘控制无人机例程仿真XTDrone键盘控制无人机例程CSDN学习与转载仿真用键盘控制无人机飞行在一个终端运行（启动gazebo，出现了场景和飞机）cd~/PX4_Firmwareroslaunchpx4indoor1.launchGaze
STM32实时时钟（RTC）代码深度解析 | 零基础入门STM32第三十九步触角01010001 STM32 stm32 单片机嵌入式硬件
主题内容教学目的/扩展视频RTC时钟的使用重点课程RTC时钟的原理，电路原理分析，固件库分析，驱动程序分析。在超级终端上显示时钟。做可修改的超级终端显示RTC的项目。师从洋桃电子，杜洋老师文章目录一、RTC初始化流程分析1.1时钟与备份域配置1.2初始化检测机制二、时间处理核心算法2.1闰年判断算法2.2时间戳转换（Unix时间）三、时间读取与转换3.1读取计数器值3.2星期计算算法四、中断处理机
[网络安全提高篇] 一二八.恶意软件分析之利用MS Defender实现恶意样本家族批量标注（含学术探讨） Eastmount 网络安全自学篇 web安全恶意软件分析恶意样本家族标注 MS Defender
2024新的战场，继续奋斗。“网络安全提高班”新的100篇文章即将开启，包括Web渗透、内网渗透、靶场搭建、CVE复现、攻击溯源、实战及CTF总结，它将更加聚焦，更加深入，也是作者的慢慢成长史。换专业确实挺难的，Web渗透也是块硬骨头，但我也试试，看看自己未来四年究竟能将它学到什么程度，漫漫长征路，偏向虎山行。享受过程，一起加油~前文介绍了IDAPython配置过程和基础用法，然后尝试提取恶意软件
iOS安全和逆向系列教程第13篇：iOS动态分析基础自学不成才 iOS安全和逆向系列教程 ios cocoa macos
iOS逆向工程专栏第13篇：iOS动态分析基础引言在前面的文章中，我们详细探讨了iOS系统架构、逆向开发环境搭建、Mach-O文件格式分析，以及各种静态分析工具和技术。通过静态分析，我们可以了解应用的结构、类和方法定义，以及基本的控制流程。然而，静态分析也存在明显的局限性：我们无法观察应用的实际运行状态，难以分析加密算法的实现细节，也无法直接查看网络请求的完整内容。这就是为什么我们需要动态分析技术
[系统安全] 五十七.恶意软件分析 (9)利用MS Defender实现恶意样本家族批量标注（含学术探讨） Eastmount 系统安全与恶意代码分析系统安全恶意样本分析恶意家族标注 Defender 病毒分析
您可能之前看到过我写的类似文章，为什么还要重复撰写呢？只是想更好地帮助初学者了解病毒逆向分析和系统安全，更加成体系且不破坏之前的系列。因此，我重新开设了这个专栏，准备系统整理和深入学习系统安全、逆向分析和恶意代码检测，“系统安全”系列文章会更加聚焦，更加系统，更加深入，也是作者的慢慢成长史。换专业确实挺难的，逆向分析也是块硬骨头，但我也试试，看看自己未来四年究竟能将它学到什么程度，漫漫长征路，偏向
【真题笔记】09-12年系统架构设计师要点总结傻傻虎虎系统架构设计精编笔记系统架构
【真题笔记】09-12年系统架构设计师要点总结4+1视图UML4+1视图架构4+1视图场景DSSA（特定领域架构）从功能覆盖的范围角度理解DSSA中领域的含义集成系统数据库管理设计模式操作符运算符综合布线备份数据库集成工作流技术软件质量保证需求管理+需求开发结构化方法企业战略数据模型事务数据库+主题数据库系统设计原型开发静态分析架构风格+设计模式+软件架构设计软件架构评估SNMPV3软件开发集成机
汽车电子软件开发需知嵌入式知行车载通信汽车嵌入式硬件单片机 c++
目录一、嵌入式1.1什么是嵌入式系统1.2什么是汽车ECU1.3如何了解一款MCU1.4谈谈代码静态分析二、汽车软件2.1什么是“域控制器”2.2为什么是ARXML2.3SOA：面向服务的架构2.4下一代的EEA（电子电气架构）2.5ADAS的八大系统（汽车高级辅助驾驶系统）三、流程类3.1什么是软件定义汽车3.2汽车软件开发V模型3.3谈谈ASPICE3.4ISO262623.5功能安全一、嵌入
iOS逆向工程专栏第8篇：iOS应用动态分析与Hook技术自学不成才 iOS逆向工程专栏 -揭秘苹果的封闭花园 ios cocoa macos
iOS逆向工程专栏第8篇：iOS应用动态分析与Hook技术作者：自学不成才在前两篇文章中，我们深入探讨了Mach-O文件格式和静态分析方法。尽管静态分析能够提供应用结构的全景视图，但仍有许多问题无法仅通过静态分析解决，例如运行时行为、动态加载的代码和复杂的加密逻辑。这就是动态分析发挥作用的地方。本文将详细介绍iOS应用的动态分析技术和Hook方法，帮助您在应用运行时观察和修改其行为。动态分析与静态
STM32超级终端RTC日历系统开发实战 | 零基础入门STM32第四十步触角01010001 STM32 stm32 单片机嵌入式硬件交互
主题内容教学目的/扩展视频RTC时钟的使用重点课程RTC时钟的原理，电路原理分析，固件库分析，驱动程序分析。在超级终端上显示时钟。做可修改的超级终端显示RTC的项目。师从洋桃电子，杜洋老师文章目录一、系统功能概述二、硬件系统架构2.1核心硬件组成2.2经典电路设计三、软件核心逻辑解析3.1主程序流程图3.2多任务处理机制四、RTC核心操作详解4.1时钟初始化流程4.2时间设置算法五、时间显示格式定
C/C++程序员为什么要了解汇编？了解汇编有哪些好处？如何学习汇编？ dvlinker C/C++实战专栏 C/C++软件开发从入门到实战 C/C++汇编为什么要了解汇编了解汇编有哪些好处如何学习汇编 IDA反汇编工具汇编指令
目录1、概述2、从汇编的角度去理解问题的若干实例说明2.1、使用空指针去访问类的数据成员或调用类的虚函数为什么会引发崩溃？2.2、从汇编代码的角度去理解多线程的执行细节，去理解多线程在访问共享资源时为什么要加锁2.3、使用Windbg静态分析dump时先从崩溃的那条汇编指令中得到初步的线索3、了解汇编有哪些具体的好处？3.1、在代码中插入汇编代码块，提升代码的执行效率3.2、在分析C++软件异常时
android系统使用哪些工具可以分析组件间的依赖人民的石头 Aosp12 System UI android
在Android系统裁剪和优化过程中，分析组件间的依赖关系是至关重要的一步。以下是一些常用的工具和方法，可以帮助你分析Android系统中的组件依赖关系：1.静态分析工具1.1ldd用途：查看可执行文件或共享库的依赖关系。使用方法：ldd/system/bin/toolbox#查看toolbox的依赖库输出示例：libc.so=>/system/lib/libc.solibm.so=>/syste
USART串口接收双雄争霸：查询法与中断法深度解析 | 零基础入门STM32第三十五步触角01010001 STM32 stm32 嵌入式硬件单片机
主题内容教学目的/扩展视频串口通信重点课程什么是USART串口，电路原理，单片机内部寄存器，固件库说明。加载相关文件，驱动程序分析，printf的使用。什么是中断，中断的程序设计，还有哪些中断。熟悉串口的使用，熟练使用printf函数。介绍printf函数的高级使用方法，介绍各中断。师从洋桃电子，杜洋老师文章目录一、USART接收原理速览1.核心寄存器说明2.数据接收三要素二、查询接收法实战教学1
Rust 中的内部可变性与 `RefCell＜T＞` Hello.Reader rust rust 开发语言后端
一、为什么需要内部可变性？通常，Rust编译器通过静态分析确保：同一时刻只能存在一个可变引用，或任意多个不可变引用；引用始终保持有效。这种严格的借用规则使得许多内存错误在编译阶段就能被捕获，但也因此在某些场景下过于保守。例如，当我们需要在不可变对象的内部修改状态时（比如记录日志、计数等），就需要借助内部可变性。通过内部可变性，我们可以在外部保持不可变的同时，通过封装的方式实现内部数据的变更，而这些
Python基础训练100题（带答案）乔代码嘚 python 开发语言算法
文末有彩蛋！！！Python3100例实例001：数字组合题目有四个数字：1、2、3、4，能组成多少个互不相同且无重复数字的三位数？各是多少？程序分析遍历全部可能，把有重复的剃掉。total=0foriinrange(1,5):forjinrange(1,5):forkinrange(1,5):if((i!=j)and(j!=k)and(k!=i)):print(i,j,k)total+=1pri
编程助手-1-融合RAG技术愚昧之山绝望之谷开悟之坡大模型笔记笔记
结合RAG（Retrieval-AugmentedGeneration）技术开发编程助手时，代码知识的抽取和结构提取是关键步骤。以下是分阶段的实现方案：1.代码知识抽取目标：从代码库中提取语义信息（如函数、类、API用法、文档等），构建可检索的知识库。实现方法：代码解析与静态分析：抽象语法树（AST）：使用解析工具（如Python的ast模块、Tree-sitter）提取代码结构，遍历AST识别函
Tree Shaking 海盗强 javascript 前端框架前端
TreeShaking是一种优化技术，用于去除JavaScript中未使用的代码，从而减小最终打包文件的体积。它的核心思想是“摇树”，通过分析代码的引用关系，将没有被使用到的代码（即死代码）从最终的输出中移除。这个术语来源于“摇晃树木”的比喻：把树上的不必要的枝叶（即未使用的代码）摇掉，只留下需要的部分。TreeShaking工作原理：静态分析：TreeShaking依赖于JavaScript的E
第五届计算机网络安全与软件工程（CNSSE 2025）禁小默 web安全大数据安全软件工程计算机网络
重要信息官网：www.cnsse.org时间：2025年2月21-23日地点：中国-青岛简介第五届计算机网络安全与软件工程（CNSSE2025）将于2025年2月21-23日在中国-青岛举行。CNSSE2025专注于计算机网络安全、软件工程、信号处理、程序分析等领域，致力于搭建计算机领域学术资源共享平台，扩大国际科研学术合作交流渠道；加强计算机网络安全建设，探索建设强壮的端点安全生态系统，增强防护
零基础被迫参加CTF比赛？CTF高频解题技巧与经验分享网络安全宇哥经验分享 web安全安全网络安全架构
CTF（CaptureTheFlag）比赛中的高频解题技巧通常涵盖了以下几类技术，涉及从逆向工程、二进制漏洞利用到Web安全、密码学等多个领域。以下是一些高频解题技巧：1.逆向工程（ReverseEngineering）静态分析：通过阅读二进制文件的源代码或反编译代码（如使用IDAPro、Ghidra、Radare2）来理解程序的逻辑。检查程序的函数、字符串和常量，寻找可能的线索。动态调试：使用g
C语言【基础篇】之简单语法——构建程序大厦的基石解析 EnigmaCoder c c语言开发语言
简单语法前言第一个程序分析✍️注释常量与变量强制类型转换️标识符与关键字scanf与printf介绍⚙️转义字符总结前言大家好！我是EnigmaCoder。本文收录于我的专栏C，希望能帮助到您！前文我们讲解了该如何搭建环境。链接:C语言【基础篇】之搭建环境——从新手到实战的必备前奏本文我们介绍一下C语言最基础的一些知识，为构建程序大厦打好基石。第一个程序分析HelloWorld程序分析#inclu
如何选择科研院所项目管理工具？7款热门软件分析
本文介绍了以下7款科研院所常用的项目管理工具：1.PingCode；2.Worktile；3.Colloa；4.云课题组管理系统；5.智方科研管理系统；6.Wrike；7.Basecamp。做科研，项目管理是绕不开的难题。项目周期长、任务复杂、人员分工精细，稍不注意就容易混乱，影响进度。本文总结了7款科研院所常用的主流项目管理系统，每款都有自己的独特优势，适用于不同的科研需求。一、7大科研所主流项
c语言编写：打印楼梯，同时在楼梯上方打印两个笑脸。年*D-清仁 c语言开发语言
题目要求：打印楼梯，同时在楼梯上方打印两个笑脸。程序分析：用i控制行，j来控制列，j根据i的变化来控制输出黑方格的个数。#include#include#includeintmain(){SetConsoleOutputCP(437);chara=219;printf("^_^^_^\n");for(inti=0;i<=9;i++){for(intj=0;j<=i;j++)printf("%c",
软件工程-软件需求规格说明（SRS）夏旭泽软件工程需求分析
基本介绍目标便于用户、分析人员、设计人员进行交流支持目标软件系统的确认（验收）控制系统进化过程（追加需求）：拥有版本记录表需要在软件分析完成后，编写完成软件需求说明书。具体标准可参考GB856T-88
分享升级spotbugs-maven-plugin 4.8.6.0遇到的坑（内附稳定运行的jdk和maven版本）测试开发Kevin 白盒测试 java 单元测试
SpotBugs介绍SpotBugs是Findbugs的继任者（Findbugs已经不再维护），用于对Java代码进行静态分析，查找相关的漏洞，SpotBugs比Findbugs拥有更多的校验规则。静态分析会检查Java字节码（.class文件）是否存在错误模式（错误模式是一种经常容易出错的代码表达式/习惯用法，其中主要包括：错误使用编程语言的某些特性、误用的API方法、在维护期间修改代码时误解变
Ruff：Python圈的最快代码分析工具！ BbflNim python macos 前端
随着后端开发的不断发展，代码分析工具成为了开发者们必备的利器之一。在Python圈中，Ruff已经崭露头角，成为了性能最快的代码分析工具。本文将介绍Ruff的特点以及如何使用它来优化Python代码。Ruff是一个基于Python的代码分析工具，它专注于提供快速而准确的代码分析和性能优化。Ruff的设计目标是通过静态分析和动态追踪相结合的方式，帮助开发者发现代码中的瓶颈，并提供针对性的优化建议。下
python的ruff简单使用 golemon. Python python 开发语言
Ruff是一个用Rust编写的高性能Python静态分析工具和代码格式化工具。它旨在提供快速的代码检查和格式化功能，同时支持丰富的配置选项和与现有工具的兼容性。ruff是用rust实现的pythonLinter&Formatter。安装：condainstall-cconda-forgeruff#pippipinstallruff它可以作为代码检查工具和代码格式化工具使用运行代码检查ruffche
c语言计算一个三位数的个十百位之和_C语言的那些经典程序 weixin_39821378
戳“在看”一起来充电吧!C语言的那些经典程序第十七期本期小C给大家带来三个用C语言解决实际问题的典例。如果全都理解，相信肯定能给大家带来收获！接下来让我们看看是哪些程序吧！1求数字组合题目：有1、2、3、4个数字，能组成多少个互不相同且无重复数字的三位数？都是多少？源程序：运行结果：程序分析:关键是计算
[系统安全] 六十一.恶意软件分析 (12)LLM赋能Lark工具提取XLM代码的抽象语法树（初探） Eastmount 系统安全与恶意代码分析系统安全抽象语法树 Lark 大模型 XLM
您可能之前看到过我写的类似文章，为什么还要重复撰写呢？只是想更好地帮助初学者了解病毒逆向分析和系统安全，更加成体系且不破坏之前的系列。因此，我重新开设了这个专栏，准备系统整理和深入学习系统安全、逆向分析和恶意代码检测，“系统安全”系列文章会更加聚焦，更加系统，更加深入，也是作者的慢慢成长史。换专业确实挺难的，逆向分析也是块硬骨头，但我也试试，看看自己未来四年究竟能将它学到什么程度，漫漫长征路，偏向
【Rust自学】19.1. 摆脱安全性限制的unsafe Rust SomeB1oody Rust自学 rust 开发语言后端
喜欢的话别忘了点赞、收藏加关注哦（加关注即可阅读全文），对接下来的教程有兴趣的可以关注专栏。谢谢喵！(=･ω･=)19.1.1.匹配命名变量到目前为止我们讨论的所有代码都在编译时强制执行Rust的内存安全保证。然而，Rust内部隐藏着第二种语言，它不强制执行这些内存安全保证，被称为unsafeRust。它和普通Rust一样，但给了我们额外的“超能力”。unsafeRust之所以存在是因为：静态分析
前端工程化都有哪些及优化方案光影少年前端前端框架基带工程
一、前端工程化的主要组成部分1.模块化模块化是将复杂的程序分解为若干小的独立模块，每个模块负责一个功能。常用的模块化方案包括：ES6模块（import/export）CommonJS（require/module.exports，Node.js中常用）AMD（define/require，如RequireJS）优化方案：尽量使用ES6模块，因为它是JavaScript的标准，支持更好的静态分析和T
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin