soot代码分析框架的基础知识(二)_soot 代码分析_小作坊中搬砖的博客-CSDN博客
Soot中的结构
本篇内容简单概括一下:soot中存在的主要对象、soot的执行流。
Soot中提供了几种对象,分别是:Scene、SootClass、SootMethod、SootField、Body。表示的意义如下所示:
Scene:Scene表示完整的分析环境,可以通过Scene.v()调用设置Options的API,也可以获取一些过程间分析的信息,如call graphs和points-to information(指向性分析)。如果分析的是Java工程,可以获取待分析的工程中存在哪些类。
SootClass:表示soot加载的待分析的类或者soot创建的类。如果分析的是Java源码,可以理解为SootClass对象代表Java源码中的某个类。
SootMethod:表示SootClass中的单个方法。
SootField:表示SootClass中的某个字段。
Body:表示方法主体,由Locals链(body.getLoclas())、Units链(body.getUnits())、Traps链(body.getTraps())组成。Locals链存储方法中的变量定义、Units链存储方法中的句子、Traps链存储方法中发生异常的语句。如下代码片段:
public int bar(){
Foo r0;
int i0,$i1;
r0:=@this:Foo;//IdentityStmt
i0:=@parameter():int;//IdentityStmt
$i1=i0+21;//AssignStmt
Return $i1;//ReturnStmt
}
Body.getLocals()得到的链存储的内容就是:Foor0;int i0,$i1;
Body.getUnits()得到的链存储的内容就是:r0:=…;…Return$i1;
Stmt与Unit
Stmt与Unit都表示方法中的一个句子。interface Unit继承于interface Stmt;同样AssignStmt、IdentityStmt、IfStmt、RetrunVoidStmt、NopStmt等也继承于interface Stmt。它们的不同在于:Unit注重于句子的构成、而AssignStmt这些则注重于是哪种句式。需要注意的是:AssignStmt表示赋值语句;而IdentityStmt表示将参数赋值给Local这样的语句。
下面是Unit对象提供的一些关键API:
public List getUseBoxes();//返回Unit中使用的Value的引用
public List getDefBoxes();//返回Unit中定义的Value的引用
public List getUseAndDefBox();//返回Unit中定义并使用的Value的引用
public List geUnitBoxes();//获得被这个unit跳转到的UnitxBox的List
public List getBoxesPointingTothis();//获得该unit作为跳转对象时,所有跳转本身的UnitBox
public boolean fallsThrough();//如果接下来执行后面挨着的unit,则为true
public boolean branches();//如果执行时会跳转到其他别的unit,则返回true。如:IfStmt、GotoStmt
public void rediectJumpsToThisTo(Unit newLocation);//该方法把跳转到该unit重定向到newLocation
注:一般Value指的是Local(变量)、Expr(表达式)、Constant(常量)。
Soot的中间语言:
soot可以生成四种不同的中间语言:grimple、shimple、jimple、baf。其中一般采用的过程内/过程间分析都在在jimple中间语言上进行的。中间语言的特点灯具体信息可以查看A Survivor’s Guide to Java Program Analysis with Soot第8-15页内容。
Soot的执行流
Soot执行被分成几个阶段,这些阶段被称为packs。第一步是生成Jimple代码,然后将Jimple代码输入到其他packs中。这个步骤是通过解析class、jimple或java文件再通过Jimple Body(jb)传递它们的结果而完成的。
Soot根据分析问题是过程内分析还是过程间分析,会有不同的执行流。
过程内分析的执行流
过程内分析简单的说就是被分析的程序中不存在函数调用。
这些Pack的命名规则非常简单:第一个字母表示采用哪种中间语言,如:s表示shimple,j表示jimple,b表示baf,g表示grimp;第二个字母表示进行的pack的哪一步,如:b表示body creation,t表示transformation,o表示optimizations,a表示annotion。例如:jap表示jimple annotations pack。(注:命名规则在过程内分析、过程间分析都适用)
如上图所示:一般每种语言都有:transformation(转换)、optimizations(优化)、annotion(注释)三步。注意上图应该省略了jb(jimple bodycreation)这个阶段。
其中,在jtp和stp阶段是允许我们插入自定义的transformation(指的并不是添加jtp,而是jtp阶段中的某一步)。
PackManager.v().getPack("jtp").add(new Transform("jtp.myTransform", new BodyTransformer(){
@Override
protected void internalTransform(Body b, String phaseName,
Map options) {
// TODO Auto-generated method stub
...
}
}
上述代码就是在jtp pack中插入小步骤myTransform,但soot的执行流执行完自定义的myTransform后,将继续沿着执行流执行,自定义的小步骤就像soot的一个插件,并不影响其他的执行流顺序。
过程间分析的执行流
过程间分析简单的说就是存在函数调用。
在过程间分析中,soot的执行流会有所不同。在过程间分析时,需要指定soot运行在whole-program mode下。此时,soot会增加三个阶段:cg(call-graph generation)、wjtp(whole jimple transformation pack)、wjap(whole jimple annotation pack)。
jb:指的是jimple body creation。Soot会对所有的method body执行jimple body creation,不可改变,与jimple生成有关。
其中,可以向此执行流中添加自定义的wjtp(此处指的并不是添加wjtp,而是在wjtp这个阶段中的添加某一步)。
PackManager.v().getPack("wjtp").add(
new Transform("wjtp.myTransform", new SceneTransformer() {
@Override
protected void internalTransform(String arg0,
Map arg1) {
// TODO Auto-generated method stub
...
}
}));
上述代码就是在wjtp pack中插入一个小步骤myTransform。 但soot的执行流执行完自定义的myTransform后,将继续沿着执行流执行,自定义的小步骤就像soot的一个插件,并不影响其他的执行流顺序。
注意:上述的过程内soot执行流和过程间soot执行流都只是列出了pack,而在每个pack中仍然存在数个小步骤。
如果需要查看可用的pack信息,可以使用下述命令:
java –cp soot-trunk.jar soot.Main -pl
如果想查看某个pack的帮助信息,可以使用下述命令:
java –cp soot-trunk.jar soot.Main -ph PACK
下面则是使用第一条命令时,得到的可用的pack信息
jb Creates a JimpleBody for each method
jb.ls Local splitter: one local per DU-UD web
jb.a Aggregator: removes some unnecessary copies
jb.ule Unused local eliminator
jb.tr Assigns types to locals
jb.ulp Local packer: minimizes number of locals
jb.lns Local name standardizer
jb.cp Copy propagator
jb.dae Dead assignment eliminator
jb.cp-ule Post-copy propagation unused local eliminator
jb.lp Local packer: minimizes number of locals
jb.ne Nop eliminator
jb.uce Unreachable code eliminator
jb.tt Trap Tightener
jj Creates a JimpleBody for each method directly
from source
jj.ls Local splitter: one local per DU-UD web
jj.a Aggregator: removes some unnecessary copies
jj.ule Unused local eliminator
jj.tr Assigns types to locals
jj.ulp Local packer: minimizes number of locals
jj.lns Local name standardizer
jj.cp Copy propagator
jj.dae Dead assignment eliminator
jj.cp-ule Post-copy propagation unused local eliminator
jj.lp Local packer: minimizes number of locals
jj.ne Nop eliminator
jj.uce Unreachable code eliminator
wjpp Whole Jimple Pre-processing Pack
wspp Whole Shimple Pre-processing Pack
cg Call graph constructor
cg.cha Builds call graph using Class Hierarchy
Analysis
cg.spark Spark points-to analysis framework
cg.paddle Paddle points-to analysis framework
wstp Whole-shimple transformation pack
wsop Whole-shimple optimization pack
wjtp Whole-jimple transformation pack
wjtp.mhp Determines what statements may be run
concurrently
wjtp.tn Finds critical sections, allocates locks
wjtp.rdc Rename duplicated classes when the file
system is not case sensitive
wjop Whole-jimple optimization pack
wjop.smb Static method binder: Devirtualizes
monomorphic calls
wjop.si Static inliner: inlines monomorphic calls
wjap Whole-jimple annotation pack: adds
interprocedural tags
wjap.ra Rectangular array finder
wjap.umt Tags all unreachable methods
wjap.uft Tags all unreachable fields
wjap.tqt Tags all qualifiers that could be tighter
wjap.cgg Creates graphical call graph.
wjap.purity Emit purity attributes
shimple Sets parameters for Shimple SSA form
stp Shimple transformation pack
sop Shimple optimization pack
sop.cpf Shimple constant propagator and folder
jtp Jimple transformation pack: intraprocedural
analyses added to Soot
jop Jimple optimization pack (intraprocedural)
jop.cse Common subexpression eliminator
jop.bcm Busy code motion: unaggressive partial
redundancy elimination
jop.lcm Lazy code motion: aggressive partial
redundancy elimination
jop.cp Copy propagator
jop.cpf Constant propagator and folder
jop.cbf Conditional branch folder
jop.dae Dead assignment eliminator
jop.nce Null Check Eliminator
jop.uce1 Unreachable code eliminator, pass 1
jop.ubf1 Unconditional branch folder, pass 1
jop.uce2 Unreachable code eliminator, pass 2
jop.ubf2 Unconditional branch folder, pass 2
jop.ule Unused local eliminator
jap Jimple annotation pack: adds intraprocedural
tags
jap.npc Null pointer checker
jap.npcolorer Null pointer colourer: tags references for
eclipse
jap.abc Array bound checker
jap.profiling Instruments null pointer and array checks
jap.sea Side effect tagger
jap.fieldrw Field read/write tagger
jap.cgtagger Call graph tagger
jap.parity Parity tagger
jap.pat Colour-codes method parameters that may be
aliased
jap.lvtagger Creates color tags for live variables
jap.rdtagger Creates link tags for reaching defs
jap.che Indicates whether cast checks can be
eliminated
jap.umt Inserts assertions into unreachable methods
jap.lit Tags loop invariants
jap.aet Tags statements with sets of available
expressions
jap.dmt Tags dominators of statement
gb Creates a GrimpBody for each method
gb.a1 Aggregator: removes some copies, pre-folding
gb.cf Constructor folder
gb.a2 Aggregator: removes some copies, post-folding
gb.ule Unused local eliminator
gop Grimp optimization pack
bb Creates Baf bodies
bb.lso Load store optimizer
bb.pho Peephole optimizer
bb.ule Unused local eliminator
bb.lp Local packer: minimizes number of locals
bop Baf optimization pack
tag Tag aggregator: turns tags into attributes
tag.ln Line number aggregator
tag.an Array bounds and null pointer check
aggregator
tag.dep Dependence aggregator
tag.fieldrw Field read/write aggregator
db Dummy phase to store options for Dava
db.transformations The Dava back-end with all its
transformations
db.renamer Apply heuristics based naming of local
variables
db.deobfuscate Apply de-obfuscation analyses
db.force-recompile Try to get recompilable code.