从设计角度理解Apk打包过程

Apk的打包,大致就是把代码打成包、把资源打成包、最后对整个Apk文件做一下安全处理和优化操作,Andriod提供了Android Asset Packaging Tool工具aapt来做这些事。
我们从代码处理、资源处理和包处理分别来看。

代码处理

对于软件来说,提供给用户的代码需要完整、精简、快速、安全。
完整
android中的代码,除了我们编写的业务代码,还有R.java文件、aidl文件,和jar包。
精简
代码量会影响到apk的体积大小,所以需要尽量省略不需要的代码和文件。
快速
java作为解释型语言,执行速度并不占优,android用dex替换了java的class字节码。
安全
任何产品都有反逆向和反破解的需要,android主要采用了签名和混淆的机制。

具体处理过程包括:

  1. 生成R.java文件和aidl文件,并检查是否缺少jar包。
  2. 编译源码,生成class字节码。
    这个过程中,可以处理精简和安全的问题,Android使用了开源项目Proguard进行处理,把臃肿危险的源码信息净化并混淆为失去可读性的代码,主要原理是先定义不需要混淆的EntryPoint(keep关键字),然后从这些EntryPoint出发,递归优化和混淆被引用的类成员,抛弃未使用的类文件,达到压缩和混淆源码的目的。
    (代码混淆后日志也会混淆,为了方便开发者读日志,需要配置proguard输出映射文件-printmapping build/outputs/mapping/release/mapping.txt,在需要的时候,使用sdk中的proguardgui.bat工具导入这个映射文件,就可以把日志内容逆向转换为源码)
  3. 用smali把所有class字节码转换为dex文件。
    JVM是基于栈的,指令很多,Dalvik改为基于寄存器,能用更少的内存支持多个虚拟机。
    Android的Dalvik和ART虚拟机,执行的是dex字节码而不是class字节码,Dalvik虚拟机内部执行的核心代码是smali。
    dex相对class字节码更加紧凑,IO更快、文件更小、采用了解析速度更快的操作码。
    (在安装时,Android系统会根据所在的系统,把dex进一步优化为odex,odex重新整理了dex和相关的类,分离了程序资源和可执行文件,并做预编译处理。但这就是安装过程PMS的行为了,ART更进一步,安装时会编译为机器码的OAT文件,节省了解释字节码的时间)

资源处理

所有的资源文件都会在代码中映射为R文件以便查找,而资源文件本身需要处理。
对于apk安装包来说,资源需要全局统一、压缩体积、快速读取。
统一
其实在生成R.java的过程中,android会把所有的资源统一管理起来,以便索引。
压缩
在android的竞争中,体积小的apk更具优势。
提速
为了提高运行速度,寻找和加载资源文件的过程需要加速。

具体来说,处理资源的手段包括:

  1. 全局资源表,根据manifest定义的包名,创建资源表ResourceTable,aapt收集所有的资源文件,添加到这个表。
  2. 二进制化,就是把xml文件全部从文本文件转换为二进制文件,app运行时用native工具直接处理二进制文件,解析和IO速度更快。
  3. 去重,xml资源文件用字符串来定义标签和属性,这就会造成大量重复字符串,aapt把这些字段全部整合进字符串资源池,xml中改用对应的整数索引值,这能大大降低体积。
  4. 资源索引,用R.java和resources.arsc建立资源索引表,这样可以根据代码中的资源ID迅速找到资源文件的物理地址。
  5. 原文件,某些资源文件不能被改动,就需要放在assets或res/raw文件夹中,android只会为这些文件建立R和索引,不会做二进制化处理。

包处理

apk安装包发布前,其实主要面临两个问题,一个是尽量优化,另一个就是可能会面临残酷的攻击,需要有基本的安全措施。
优化
优化其实还是从运行效率上、从体积上寻找可以优化的点。
安全
安全性上比照CA解决的问题,需要防泄露、防冒充、防篡改、防抵赖。

具体的操作包括:

  1. 对齐
    速度优化的一个重要方式是提高对数据的寻址速度,android采用了对齐的方式,其实就是每个数据占用同等大小的空间,这样CPU读取数据时可以跳跃寻找,减少内存访问次数。
  2. 压缩
    在处理代码时,会从代码级别清除无用的代码
    在处理资源时,会对资源文件包括图片等进行压缩,还可以shrinkResource去除不使用的资源文件。
  3. 混淆
    在处理代码时进行混淆,可以防泄露,能防止泄露有意义的代码。
  4. 加壳等其他操作
    有一些附加的安全操作可以更好地防泄露,比如加壳加固,其实就是把写一个新的dex文件,把旧的dex加密后,写进这个新的dex里面,加载时再反过来解密出原始dex并加载,这样在反编译时就无法读到原始dex文件的内容,这样除非在运行时把整个app都dump到内存,否则app还是很安全的,安全门槛能提高不少。
  5. 签名
    对apk签名是最后做的事情,具体都在META-INF文件夹中的三个文件里,有两个使用SHA-1摘要防篡改,确保apk包中的文件没有被修改;有一个使用RSA和签名文件加密防冒充,防止他人冒充我们的apk。

参考

Android应用程序资源的编译和打包过程分析
Android系统ODEX文件格式解析
手把手教你解析Resources.arsc

你可能感兴趣的:(从设计角度理解Apk打包过程)