深入Android源码系列(一)

首先,每天看到不断有新人关注着这个公众号,心情很是愉悦。一种认可,一种信任,也是我前进的动力。感谢大家的支持与鼓励。


深入Android源码系列(一)_第1张图片

本文讲解内容有
loadLibrary流程
linker
ELF
ndk开发以及配置调试版本
ndk-gdb --start调试so
gdb 调试bin文件
 gdb调试android apk方案

关于本文讲解使用的代码,都在网盘提供了,可以自行下载。
链接: https://pan.baidu.com/s/1hrIxJdq 密码: jfwz
00
开发android 应用,主要围绕着java语言,可是,如果我们需要追求性能,或者需要调用之前我们已经写好的c c++ so库的时候,或者和硬件打交道的时候,那么我们就会接触到JNI(java native interface)。
我们知道,java是在其虚拟机里面运行。我们简单举个例子吧。我让你使用任何一个语言,写一段代码:打开一个文件,读取每一行,如果这一行内容是1,我们就在窗口显示生活真美好。 想一下,是否都能写出来?
这里举的例子,简单的解释了虚拟机的动作,打开一个文件(输入),读取每一行(内容),如果这一行内容是1(解析),我们就在窗口显示生活真美好(输出),比起这个来说,java虚拟机比这个复杂,但是基础核心的原理就是这个了。
我们本节去讲一个内容,System.loadLibrary(XXXX) 的执行过程。此过程完成将so库加载进来,打通java和c c++本地库的桥梁,实现相互调用。(此文牵扯概念 javaVM JNI ELF 动态库静态库)

我们要做JNI,少不了使用



嗯,我们这节,就是展看loadLibrary,来看这个方法都做了哪些事情。


深入Android源码系列(一)_第2张图片

我们这里看下参数:libname 将加载的库名字,比如我们库为libtest_jni.so 这里则写为test_jni,其余的系统会帮我们拼接。
继续向下看,发现调用了Runtime类里面的loadLibrary0方法,我们看下:
深入Android源码系列(一)_第3张图片

深入Android源码系列(一)_第4张图片

我们看到有两个参数:第一个为Classloader,这个为我们的类加载器,我们这里的参数为VMStack.getCallingClassLoader(),于是我们看下这段代码。


深入Android源码系列(一)_第5张图片

看到这里为native,于是它本身是使用c或者c++本地语言编写的了,我们找下位置。通过搜索getCallingClassLoader,我们找到了本地实现的地方在dalvik_system_VMStack.cc里面,于是我们截图,来看下。
深入Android源码系列(一)_第6张图片

这里NATIVE_METHOD是个宏定义

于是

会转化为

这个就是jni编写中,需要配置的对应表,主要完成java和c语言函数对应,参数和返回值对应的关系,给了这些,虚拟机才会在java和c之间建立起来关系,知道哪个java函数调用的真正正确的c语言函数,同时c也是可以反向调用java的,更多可以百度jni的编写。

关于getCallingClassLoader这个是如何加入到系统的,就是上面的register_dalvik_system_VMStack方法了。


深入Android源码系列(一)_第7张图片


我们不对这里展开了,此方法是在runtime.cc的InitNativeMethods方法里面的RegisterRuntimeNativeMethods完成。有兴趣的可以去看看。我们继续跟踪system.loadLibrary,这里继续看VMStack.getCallingClassLoader()。
01
通过上面的展看,我们知道了这个对应的c方法为:VMStack_getCallingClassLoader,于是我们看到:
深入Android源码系列(一)_第8张图片

这里因为不熟悉,就不讲了。
loadLibrary0 里面主要调用的方法为:


深入Android源码系列(一)_第9张图片

loader.findLibrary(libraryName); 去查找是否存在此动态库,没有就报找不到异常。
然后我们调用doLoad去加载。

深入Android源码系列(一)_第10张图片

doLoad主要完成,传入设置的librarySearchPath,然后调用本地代码nativeLoad方法。搜索nativeLoad,我们找到了它对应的实现,在Runtime.c
里面


深入Android源码系列(一)_第11张图片

根据之前展开的方式,此函数为:Runtime_nativeLoad,于是我们看到:


在OpenjdkJvm.cc里面:


深入Android源码系列(一)_第12张图片

关键方法,通过拿到当前的虚拟机vm,调用对应的LoadNativeLibrary(java_vm_ext.cc)方法,去真正加载对应的so。

我们来到java_vm_ext.cc里面,去看下LoadNativeLibrary真正的执行过程:

深入Android源码系列(一)_第13张图片

这里我们关系的是高亮的几个函数:OpenNativeLibrary,完成加载so的过程。
FindSymbol("JNI_OnLoad")完成找出so里面的JNI_OnLoad方法,如果有,使用(*jni_on_load)(this, nullptr)调用,返回so使用的java版本。这个JNI_OnLoad就是我们加载so的时候,会主动触发的一个初始化方法了。在这里主要完成java和c的对应关系方法,然后使用RegisterNativeMethods将此关系注册进入vm,以便后续调用能够找到。
扩展:
用于Android ART虚拟机JNI调用的NativeBridge介绍,地址为:

http://www.aichengxu.com/android/1473706.htm

02

我们停一下,完成一个简单的测试demo代码,以便我们调试使用。
参考http://blog.csdn.net/a332324956/article/details/8703286 来写一个JNI搭配着eclipse去编译出来一个libtest_jni.so。(后续此工程会直接提供下载)

深入Android源码系列(一)_第14张图片

工程目录为:这里jni就是需要编出来so的地方。我们右键jnidemo选择properties,然后选择下Builders,点击new,创建一个编译规则。

深入Android源码系列(一)_第15张图片

编写一个调试:
深入Android源码系列(一)_第16张图片

这里Location指的是ndk-build脚本位置Working Directory 指的是当前项目的src/jni,我们要使用ndk-build将jni目录下的android.mk执行,完成生成so的动作。
最后生成出来libtest_jni.so我们在java工程使用下。(我们要在此基础上进行调试,所以我们使用的是自己load,不是写在static语句里面)
深入Android源码系列(一)_第17张图片

完整代码,文章最后提供,可以看着代码然后阅读。
我们在loadLibrary0上面打断点,然后看下流程:
深入Android源码系列(一)_第18张图片

我们可以看到看到,这里的loader为PathClassLoader.java,所以此处的findLibrary就是PathClassLoader.java文件里面的了。然后发现PathClassLoader继承自 BaseDexClassLoader,于是我们关心BaseDexClassLoader代码。
深入Android源码系列(一)_第19张图片

此段代码,完成在此app的本地so库的搜索路径下,查找我们的test_jni动态库,找到后path返回此so的绝对路径,以使后面的dlopen去动态打开此库。在此处,libname就是/data/app/com.example.jnidemo-2/lib/arm/libtest_jni.so,这个就是我们的jni动态库真正的位置了。
关于动态库dlopen dlsym 的用法,参照 http://blog.csdn.net/edonlii/article/details/8445239 主要就是打开so,然后找到对应函数,然后执行。
按照这个文档,去调试so(需要下载android的ndk)
http://blog.csdn.net/kaiqiangzhang001/article/details/21108857
打上断点的截图为:

我们这里提供一个Android 的加载/链接器linker 的讲解
http://blog.csdn.net/dinuliang/article/details/5509009
关于android linker的代码位置 bionic/linker,可以去阅读。

03

我们回到之前的讲解,来找下LoadNativeLibrary调用的OpenNativeLibrary方法。在native_loader.cpp文件内找到此文件。


深入Android源码系列(一)_第20张图片

这里android调用了android_dlopen_ext方法,来实现动态库的加载,返回dlextinfo,而非android的,则是调用dlopen加载的。
我们搜索android_dlopen_ext,发现在 /bionic/libdl/
里面的/bionic/libdl/libdl.c 里面有

深入Android源码系列(一)_第21张图片

看,是个空方法,没有实际动作,看到这里的注释,意思是我们的dynamic linker 实现了这个方法,我们找到linker(手机里面的/system/bin/linker),我们在linker的源码里面dlfcn.cpp找到android_dlopen_ext


但是在最终编译出来的linker里面是被修改成了__dl_android_dlopen_ext
找到linker文件里面的方法,具体的操作是:
将linker提取出来


然后运行,导出来内容



然后看到了__dl_android_dlopen_ext方法的实现体:

深入Android源码系列(一)_第22张图片

关于linker的启动,可以参考 http://www.myexception.cn/android/1930690.html 阅读。同时adnroid源码也是提供了一个简单解释:
在/development/ndk/platforms/下面的README.CRT.TXT文件,有如下内容:
深入Android源码系列(一)_第23张图片

完整的我提交网盘了,可以去下载阅读。

04

在bionic/linker里面的Android.mk文件,发现了一段注释,可以解释__dl_android_dlopen_ext和android_dlopen_ext 怎么变化的。

深入Android源码系列(一)_第24张图片

这里的--prefix-symbols=_ dl 就是给名字的符号上面加入一个前缀,于是我们的android_dlopen_ext 就变成了__dl_android_dlopen_ext。想找到编译linker的所有编译规则,参数,去mmm bionic/linker,就会在out下面生成一个-mmm-._bionic_linker_Android.mk.ninja文件,这个就是我们生成linker的所有规则,从里面去找--prefix-symbols,能看到


生成linker的时候,使用了objcopy修改了方法名。
我们调试linker的代码,我们因为加载的是__dl_android_dlopen_ext ,于是我们gdb下断点 b __dl_android_dlopen_ext ,这样子我们打断点,运行时候会在加载动态库时候,停下来:


可以看到,断点成功。
info sharedlibrary 查看当前需要的so。
info breakpoints 查看断点信息
bt 查看堆栈
b 方法 下断点
delete num 删除对应断点。
file XXX.so (有调试信息的库,然后我们调试,就会变成有效信息)

05

关于gdb的使用,可以参考
http://blog.csdn.net/ghostyu/article/details/8083228
关于solib-absolute-prefix 和solib-search-path的区别 ,可以参考:
http://blog.csdn.net/caspiansea/article/details/16798735
我们这里看到了一个地址信息,又没有显示出来,这里为0xaafceefa,我们想找到这个地址,对应的代码,该如何找呢?
adb shell
ps | grep demo (这里demo是我们包名)


我们关心的是10171(进程id),然后我们查找/proc/10171/maps
cat /proc/10171/maps ,找到aafc是在这个位置:
aada1000-ab1f4000 r-xp 00000000 103:08 1377 /system/lib/libart.so
于是我们file加载下这个libart.so
然后重新调试,看效果:
深入Android源码系列(一)_第25张图片

看#2,是不是出来了。
我们打断点,发现b android_dlopen_ext 和 b __dl_android_dlopen_ext 是一个位置(bionic/linker/dlfcn.cpp line 82).所以我们实际的android_dlopen_ext就是__dl_android_dlopen_ext,也就是dlfcn.cpp文件内容了。
我们将bionic放置到我们调试的ndk-gdb --start目录,再次调试,代码就检索出来了。


漫漫长路,我们又可以启程了,我们当前需要阅读的代码,就围绕着android_dlopen_ext(dlfcn.cpp)函数开展了。先开心看一个内容,这里我将编译出来的所有so加载进来了,我们看到调试栈就会变成:

深入Android源码系列(一)_第26张图片

看到没,调用信息一目了然。
我们看下追踪这条代码线,可以找到我们的调用关系:
android::OpenNativeLibrary -->dlopen_ext-->do_dlopen-->find_library-->find_libraries.再追下去就没完没了了,这些方法,都是有源码的,于是我们从源码去看看吧。



从这里开始。我们主要关注find_libraries函数,这里此方法完成扫描此so需要依赖的其他so,加入到tasklist里面,然后依据每个task,完成load的动作。



我们去看下task,这个类型为LoadTask:看下load方法:
深入Android源码系列(一)_第27张图片

再看个ElfReader的load即可(更深层次的自行学习了),参考链接器与加载器那本书
深入Android源码系列(一)_第28张图片

主要就是找空间(mmap)解析出来的ELF的格式,加载load段到内存空间。关于FindPhdr的方法含义,看下它本身的注释

嗯,我们就讲到这里,主要就是学习如何开发ndk,跟踪loadlibrary的流程,调试so,linker的具体含义。

06

我们延伸一个内容:
我们加载nativehelper库,这个是在手机/system/lib下的一个核心库。我们测试下:



运行报错,错误为:



意思就是这个动态库是系统核心的,不能单独加载起来,系统不允许。这段代码位置在:linker.cc里面的 load_library函数:
深入Android源码系列(一)_第29张图片

于是我们看下is_greylisted,便是判断灰名单的方法:


深入Android源码系列(一)_第30张图片

这里更详细的不看,只需要关注我们>23之后,直接返回出错,禁止调用系统这些库。
07
如何使用gdb调试android c可执行文件方案呢?
其中hello-jni是测试代码,操作如下:


深入Android源码系列(一)_第31张图片

可以看到调试结果如下:
深入Android源码系列(一)_第32张图片

调试成功。

08

如何使用gdb调试android apk方案呢?
手机端adb shell切入
ps | grep demo   找到我们的进程号
gdbserver :1234 --attach 8481 这里8481为进程号


电脑端输入:
**shell adb forward tcp:1234 tcp:1234******
target**** remote localhost:1234
然后我们需要加载下app_process32程序,这个是从你手机/system/bin 下面导出来的。
adb pull /system/bin/app_process32 ~/
file ~/app_process32
set solib-search-path /home/user/workspace/jnidemo/obj/local/armeabi
将符号表导入。可以多次操作set solib-search-path
然后我们看下当前符号信息
info sharedlib
缺少某个库的符号,使用set solib-search-path继续导入
深入Android源码系列(一)_第33张图片

当没有打上断点的时候,使用set solib-search-path将对应的so加载上来,然后就可以了。************

更多精彩,敬请期待。

更多内容,关注微信公众号:code_gg_home。
加微信 code_gg_boy 进入代码GG交流群

你可能感兴趣的:(深入Android源码系列(一))