最近(终于)转Android了,2011年著名的zergrush是接触的第一个ROOT漏洞。虽然它已经过气了,只影响Android 2.2 - 2.3.6,但觉得还是有必要记录一下分析所得。
市面上各种ROOT工具基本都包含zergrush,大多是开源的zergRush.c直接编译而来。已有的分析文章:
tomken_zhang,漏洞 — zergRush,漏洞 — zergRush (补充)
Claud, Android提权代码zergRush分析
分析内容集中在zergRush.c的代码结构上,对漏洞原理没有解析,或者错误地认为是栈溢出。其实CVE-2011-3874已经描述得很明白,这个漏洞的本质是"use after free"。
1. 栈溢出?No.
漏洞存在于/system/bin/vold这个root身份的系统程序。具体地,vold调用了libsysutils.so,真正有问题的是这个so。再具体地,问题出在/system/core/libsysutils/src/FrameworkListener.cpp的FrameworkListener::dispatchCommand方法。
它在栈上分配了一个固定大小的数组argv,
void FrameworkListener::dispatchCommand(SocketClient *cli, char *data) { FrameworkCommandCollection::iterator i; int argc = 0; char *argv[FrameworkListener::CMD_ARGS_MAX]; char tmp[255]; char *p = data; char *q = tmp; bool esc = false; bool quote = false; int k;
FrameworkListener::CMD_ARGS_MAX = 16。但后面填充argv数组时,代码并没有检查是否发生了越界。
if (!quote && *q == ' ') { *q = '\0'; argv[argc++] = strdup(tmp); memset(tmp, 0, sizeof(tmp)); q = tmp; continue; }
让argv越界是很容易的,越界的数据会被写入argv下面的tmp数组中。zergRush实际上只是向argv中填充了CMD_ARGS_MAX + 2个char *,越界了8字节而已,255字节的tmp数组完全接得住,并没有破坏dispatchCommand的栈。其实,就算dispatchCommand的栈溢出了,也没什么事,因为它被编译进了__stack_chk,一旦返回地址改变,会异常结束。所以,这个漏洞不是“栈溢出”。
2. free(任意地址)
用户程序向system/bin/vold发送的数据会到达FrameworkListener::onDataAvailable。onDataAvailable会从数据中提取命令字符串,并调用dispatchCommand处理命令。用户数据可能包含多条命令,每条命令是一个以'\0'结尾的字符串,由名称和若干参数构成,名称和参数由空格分隔。例如,
"cmd1 arg11 arg12\0cmd2 arg21 arg22 arg23\0"
这样的数据进入onDataAvailable后,会提取出2条命令字符串:"cmd1 arg11 arg12" 和 "cmd2 arg21 arg22 arg23",对每条命令调用一次dispatchCommand。dispatchCommand接收到命令字符串后,会进一步解析出命令名称和参数,并存入argv数组。比如,对于"cmd1 arg11 arg12",dispatchCommand完成解析后,
argv[0] == "cmd1"; argv[1] == "arg11"; argv[2] == "arg12";
名称和每个参数,最初都是解析到tmp中,argv的每个字符串指针都是strdup(tmp)出来的,在dispatchCommand返回前要free掉,
int j; for (j = 0; j < argc; j++) free(argv[j]);
这是一个很正常的逻辑,但在argv数组越界,与tmp发生交叠的情况下,有意思的事情就发生了。假设有一条命令带有17个参数,
"cmd p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 p13 p14 p15 p16 \x78\x56\x34\x12"
解析后,argv数组的内容是:
argv[0] == "cmd"; argv[1] == "p1"; argv[2] == "p2"; argv[3] == "p3"; argv[4] == "p4"; argv[5] == "p5"; argv[6] == "p6"; argv[7] == "p7"; argv[8] == "p8"; argv[9] == "p9"; argv[10] == "p10"; argv[11] == "p11"; argv[12] == "p12"; argv[13] == "p13"; argv[14] == "p14"; argv[15] == "p15"; argv[16] == 0x12345678; argv[17] == "\x78\x56\x34\x12";
argv数组大小只有16项,argv[16]实际上是tmp数组的前4个字节,而最后一个参数是"\x78\x56\x34\x12",它被解析出来后缓存到tmp里,这样tmp的前4字节就成了0x78,0x56, 0x34, 0x12 ,因此argv[16]==0x12345678。之后,argv[16]被free,即执行了free(0x12345678)。我们可以任意控制参数内容,即可实现:free(任意地址)。
3. 指针复用和vtable覆盖
能够free掉任意指针了,如何实现exploit呢?最简单的办法是free掉一个带vtable的C++对象指针,然后重用这个指针,从而控制vtable。很幸运的是,dispatchCommand的代码逻辑支持这么做。它会对比接收到的命令和已注册的FrameworkCommand,如果匹配,就去运行匹配的FrameworkCommand。
for (i = mCommands->begin(); i != mCommands->end(); ++i) { FrameworkCommand *c = *i; if (!strcmp(argv[0], c->getCommand())) { if (c->runCommand(cli, argc, argv)) { SLOGW("Handler '%s' error (%s)", c->getCommand(), strerror(errno)); } goto out; } }
runCommand是FrameworkCommand的virtual方法,FrameworkCommand对象指针就是要free掉然后复用的目标。mCommands是FrameworkListener的成员,它包含了若干FrameworkCommand对象指针,如果知道了FrameworkListener *this,寻址到FrameworkCommand不在话下,这也是zergRush.c的heap_oracle() 做的事情。
假设我们成功free掉了一个FrameworkCommand指针,怎样复用这个指针呢?只需要再调用dispatchCommand解析一条命令,在解析过程中,第一次strdup(tmp)返回的就是这个指针,并且已经把tmp字符串复制到这个地址了。即:命令的前4个字节已经成为这个FrameworkCommand对象的vtable,实现了vtable的任意指定。观察上面C++代码对应的汇编:
.text:000029F6 LDR.W R6, [R8] .text:000029FA MOV R0, R10 ; s1 .text:000029FC LDR R1, [R6,#4] ; s2 .text:000029FE BLX strcmp .text:00002A02 CBNZ R0, loc_2A38 .text:00002A04 LDR R0, [R6] ;R0 = vtable .text:00002A06 MOV R1, R5 .text:00002A08 MOV R2, R4 .text:00002A0A MOV R3, R7 .text:00002A0C LDR.W R12, [R0,#8] ;R12 = runCommand .text:00002A10 MOV R0, R6 .text:00002A12 BLX R12 ;Call runCommand .text:00002A14 CBZ R0, loc_2A50 .text:00002A16 LDR R5, [R6,#4] .text:00002A18 BLX __errno .text:00002A1C LDR R0, [R0] ; errnum .text:00002A1E BLX strerror .text:00002A22 LDR R2, =(aFrameworkliste - 0x2A2E) .text:00002A24 LDR R3, =(aHandlerSErrorS - 0x2A30) .text:00002A26 MOVS R1, #5 .text:00002A28 STR R5, [SP,#0x484+var_484] .text:00002A2A ADD R2, PC ; "FrameworkListener" .text:00002A2C ADD R3, PC ; "Handler '%s' error (%s)" .text:00002A2E STR R0, [SP,#0x484+var_480] .text:00002A30 MOVS R0, #3 .text:00002A32 BLX __android_log_buf_print .text:00002A36 B loc_2A50
调用runCommand,实际是调用了[vtable + 8]。比如第二次传给dispatchCommand的命令是"AAAA blablabla",vtable会被覆盖成0x41414141,PC将被指向 [0x41414149]。至此,已经成功的控制了指令流,剩下的就是构造攻击数据的奇淫技巧了,比如ROP等,和漏洞本身没有直接关系了。zergRush.c成功地调用system()执行任意命令,达到了ROOT的目的。
4. 总结
CVE-2011-3874这个漏洞源于栈上的数组越界,用户程序通过向/system/bin/vold发送一段包含2条特殊命令的数据,可以控制root身份的vold执行system(),借以提权。用户数据中的第1条命令会free掉一个FrameworkCommand对象;而第2条命令会重新占用对象地址,进而覆盖vtable实现控制指令流。
在Android 2.2-2.3.6没有ASLR的前提下,漏洞利用过程只有2个必要数据无法直接获取:dispatchCommand的this指针和栈地址SP。不幸(幸运)的是,强大的logcat填上了这个坑。有了logcat,即使有ASLR,对这个漏洞也没有防护能力。