AXML即Android Binary XML,是Android应用程序APK包中保存xml文件数据的一种方式,可以减小xml文件的大小。本文章与我的另一篇文章手把手教你解析Resources.arsc是相关联的,resources.arsc文件是apk的资源索引文件,而xml文件是apk的资源文件,resources.arsc保存了xml中需要用到的资源的索引,它们之间有非常强的依赖关系,apk在执行的时候缺一不可。另外大家在用AXMLPrinter去解码AXML文件时会看见输出中有很多属性的值都是一串数字,很难明白是什么意思,实际上这串数字就是资源的索引id值,需要用这个id去resources.arsc中查找才能得到具体的字符串,知道这个属性的值是@string/XXXX或者@drawable/XXXX等等。
在上面的文章中我介绍了Resources.arsc文件的解析方式,本文我来介绍怎样来解析AXML文件。
AXML文件的格式与resources.arsc的文件格式有点类似,如果你清楚resources.arsc文件格式的话,那学习AXML文件格式就更方便了。AXML文件格式所需要的数据结构和resources.arsc的数据结构在同一个文件中定义,都在系统源码的/frameworks/base/include/androidfw/ResourceType.h中,也用到了chunk的概念,文件是以chunk为单位划分的,每个chunk都有chunk header和chunk body。chunk的类型在ResourceType.h文件中有定义:
struct ResChunk_header { enum { RES_NULL_TYPE = 0x0000, RES_STRING_POOL_TYPE = 0x0001, RES_TABLE_TYPE = 0x0002, // Chunk types in RES_XML_TYPE RES_XML_TYPE = 0x0003, RES_XML_FIRST_CHUNK_TYPE = 0x0100, RES_XML_START_NAMESPACE_TYPE= 0x0100, RES_XML_END_NAMESPACE_TYPE = 0x0101, RES_XML_START_ELEMENT_TYPE = 0x0102, RES_XML_END_ELEMENT_TYPE = 0x0103, RES_XML_CDATA_TYPE = 0x0104, RES_XML_LAST_CHUNK_TYPE = 0x017f, // This contains a uint32_t array mapping strings in the string // pool back to resource identifiers. It is optional. RES_XML_RESOURCE_MAP_TYPE = 0x0180, // Chunk types in RES_TABLE_TYPE RES_TABLE_PACKAGE_TYPE = 0x0200, RES_TABLE_TYPE_TYPE = 0x0201, RES_TABLE_TYPE_SPEC_TYPE = 0x0202 }; //当前这个chunk的类型 uint16_t type; //当前这个chunk的头部大小 uint16_t headerSize; //当前这个chunk的大小 uint32_t size; };
具体格式如下图:
图1
可以看到和resources.arsc一样,在文件的头部后面紧接着是一个string pool,存放着文件中需要用到的字符串。后面是一个XMLResourceMap,它的作用是:This contains a uint32_t array mapping strings in the string pool back to resource identifiers. It is optional.由于我对应用中使用资源文件不太熟悉,所以没看明白,以后明白了再更新,但这个chunk是optional的。
再往后是一个Namespace,个人理解和C里面的namespace一个意思吧,类型是RES_XML_START_NAMESPACE_TYPE,Namespace里面是一个个的Element,类型是RES_XML_START_ELEMENT_TYPE,实际上对应着xml中的一个个tag,每个Element里面还有attribute,每个Element里面还可以有子Element,和xml文件中的标签结构是对应的,后面还有结束标签End Element和End Namespace,后面会举例具体说明。每个tag被描述为一个ResXMLTree_node结构体,定义如下:
struct ResXMLTree_node { struct ResChunk_header header; // Line number in original source file at which this element appeared. uint32_t lineNumber; // Optional XML comment that was associated with this element; -1 if none. struct ResStringPool_ref comment; };
举例就和手把手教你解析Resources.arsc用同一个工程的例子吧,以工程中的AndroidManifest.xml的二进制文件作为分析目标,其原始的内容如下:
<?xml version="1.0" encoding="utf-8"?> <manifest xmlns:android="http://schemas.android.com/apk/res/android" package="com.example.cert" android:versionCode="1" android:versionName="1.0" > <uses-sdk android:minSdkVersion="8" android:targetSdkVersion="21" /> <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/> <application android:allowBackup="true" android:icon="@drawable/ic_launcher" android:label="@string/app_name" android:theme="@style/AppTheme" android:name="myApplication" > <activity android:name=".MainActivity" android:label="@string/app_name" > <intent-filter> <action android:name="android.intent.action.MAIN" /> <category android:name="android.intent.category.LAUNCHER" /> </intent-filter> </activity> <service android:name="com.example.services.TestService1" android:process="com.example.services.TestService1"> <intent-filter> <action android:name="com.example.services.TestService1" /> </intent-filter> </service> </application> </manifest>
/res/values/strings.xml内容:
<?xml version="1.0" encoding="utf-8"?> <resources> <string name="app_name">Cert</string> <string name="hello_world">Hello world!</string> <string name="action_settings">Settings</string> </resources>
public final class R { ... public static final class string { ... /** Description of the choose target button in a ShareActionProvider (share UI). [CHAR LIMIT=NONE] */ public static final int abc_shareactionprovider_share_with=0x7f0a000c; /** Description of a share target (both in the list of such or the default share button) in a ShareActionProvider (share UI). [CHAR LIMIT=NONE] */ public static final int abc_shareactionprovider_share_with_application=0x7f0a000b; public static final int action_settings=0x7f0a000f; public static final int app_name=0x7f0a000d; public static final int hello_world=0x7f0a000e; } ... }
AXML文件的头部格式如下:
struct ResXMLTree_header { struct ResChunk_header header; };
图2
字符串池与resources.arsc的字符串池的结构什么的是完全一样的,现实一个ResStringPool_header结构体,然后跟着n个字符串偏移数组,然后是字符串,这里就不多说了。
图3
可以看到类型是RES_XML_RESOURCE_MAP_TYPE(0x180),ResChunk_header后面跟着11个四字节的id值,这些id值对应Android源码中/frameworks/base/core/res/res/values/public.xml文件中的值,看代码段3的例子中所有tag下用到的属性名在public.xml对应的id都会出现在这个数组里面,比如versionCode、versionName、name、label、icon、theme这些,这里可能表明需要用到系统资源文件,这些id是系统资源的id值,但是具体为什么我还不太清楚。
图4
可以看到chunk的类型是RES_XML_START_NAMESPACE_TYPE(0x0100),在原始AndroidManifest.xml文件中的line number是0x2,ResXMLTree_namespaceExt结构体定义如下:
struct ResXMLTree_namespaceExt { // The prefix of the namespace. struct ResStringPool_ref prefix; // The URI of the namespace. struct ResStringPool_ref uri; };
XML文件中的每个tag在这里被描述为Element,同样有起始tag和结束tag,这里对应Start Element和End Element,Start Element这个chunk的header是ResXMLTree_node来描述,chunk的body是一个ResXMLTree_attrExt,后面跟若干个ResXMLTree_attribute,定义如下:
struct ResXMLTree_attrExt { // String of the full namespace of this element. struct ResStringPool_ref ns; // String name of this node if it is an ELEMENT; the raw // character data if this is a CDATA node. struct ResStringPool_ref name; // Byte offset from the start of this structure where the attributes start. uint16_t attributeStart; // Size of the ResXMLTree_attribute structures that follow. uint16_t attributeSize; // Number of attributes associated with an ELEMENT. These are // available as an array of ResXMLTree_attribute structures // immediately following this node. uint16_t attributeCount; // Index (1-based) of the "id" attribute. 0 if none. uint16_t idIndex; // Index (1-based) of the "class" attribute. 0 if none. uint16_t classIndex; // Index (1-based) of the "style" attribute. 0 if none. uint16_t styleIndex; }; struct ResXMLTree_attribute { // Namespace of this attribute. struct ResStringPool_ref ns; // Name of this attribute. struct ResStringPool_ref name; // The original raw string value of this attribute. struct ResStringPool_ref rawValue; // Processesd typed value of this attribute. struct Res_value typedValue; };
这里看二进制内容:
图5
chunk的类型是RES_XML_START_ELEMENT_TYPE(0x0102),attribute的个数是3,offset是0x14,0xFFFFFFFF表示null。后面跟着三个ResXMLTree_attribute结构体,第一个name是0x0,从string pool中查找是versionCode,Res_value的类型是TYPE_FIRST_INT,值是0x01,与代码段3中原始内容的android:versionCode="1"是对应的。第二和第三个ResXMLTree_attribute就不分析了。
下面找一个与resources.arsc有关的Element分析一下,二进制内容如下:
图6
这个Element的line number是0x0C,name是0x15对应string pool中“application”,与代码段3中我们的例子对应。后面有6个ResXMLTree_attribute,我们看第二个,内容是:0C000000 07000000 FFFFFFFF 08000001 0D000A7F,name是0x07,对应string pool中”label“,Res_value的类型是TYPE_FIRST_INT,值是0x7F0A000D,看过手把手教你解析Resources.arsc这篇文章的人会发现很眼熟,这不就是R.java中为每个资源分配的id值吗?对了,系统会根据这个id值去resources.arsc文件中去找具体的资源内容,方法这里就不说了,可以到我的那篇文章中去看。我们直接到代码段5的R.java中去找这个id,对应的是app_name,再看代码段3中原始的内容是<application android:label="@string/app_name",这样就对应起来了。
也就是说在APK中某个AXML文件如果引用到其它AXML文件的资源时,都是通过id来引用的,在解析的时候都需要通过resources.arsc去索引。
每个tag都有Start Element和End Element来标识这个tag的范围,End Element Chunk的header是由一个ResXMLTree_node来描述,它的body是由一个ResXMLTree_endElementExt来描述,定义如下:
struct ResXMLTree_endElementExt { // String of the full namespace of this element. struct ResStringPool_ref ns; // String name of this node if it is an ELEMENT; the raw // character data if this is a CDATA node. struct ResStringPool_ref name; };
参考文章:
1. https://justanapplication.wordpress.com/category/android/android-binary-xml/
2. http://bbs.pediy.com/showthread.php?t=194206
3. http://blog.csdn.net/mldxs/article/details/44956931