携程ANR 优化实践 - Binder开辟线程数过多导致主线程ANR异常

了解携程ANR前,我们一起了解 binder 线程池的前生今世

在android系统中,通过binder进行IPC时,服务端总是会起一些Binder线程来响应客户端的请求。这里面就涉及到通过BInder线程池 开辟binder线程

那这些Binder线程又是如何创建,如何管理的呢?

在APP进程创建或者AIDL服务进程在创建的时候,AMS就会通知Zygote进程fork一个APP进程,在Zygote进程中初始化该APP进程的时候,会调用到Native层的app_main.cpp中的onZygoteInit()

在frameworks/base/cmds/app_process/app_main.cpp中

  virtual void onZygoteInit()
  {
      sp proc = ProcessState::self();
      ALOGV("App process: starting thread pool.\n");
      proc->startThreadPool(); //开启了线程池
  }

对于Binder线程池的     在为当前进程创建ProcessState的时候,通过mMaxThread传入了Binder驱动可创建的最大Binder线程数,默认为15个。

携程ANR 优化实践 - Binder开辟线程数过多导致主线程ANR异常_第1张图片

这个变量的第一  在 最前面已经定义死了

native/libs/binder/ProcessState.cpp

#define DEFAULT_MAX_BINDER_THREADS 15 //线程池 最大的个数

binder线程数目最大为15个

携程实战案例分析。

一起来看这个日志

携程ANR 优化实践 - Binder开辟线程数过多导致主线程ANR异常_第2张图片

很明显当时在做Binder通信,ANR发生在transcatNative函数中, transcatNative 函数式客户端发起端的函数

说明这个anr中的   客户端即有可能是在等Binder对端响应,我们知道Binder通信对于调用端来说是默认是阻塞等待响应,只有有了返回结果后才会继续执行下去,

这里就有两种情况

1.服务端调用方法时  发生了阻塞,导致客户端挂起
2.Binder线程池超出了15个,导致无法继续分配,客户端挂起

通过分析 发生anr的时候  cpu的状态,可以确定但是binder线程数是超过了15个,既可以确定是binder线程池导致

为什么Binder线程池会造成ANR呢

我们来设想下这种情况,A进程同时发起第16个binder请求后,由于没有C进程能够处理,因为此时线程池已经满了,

客户端发起的第16个binder请求此时就位阻塞状态

携程ANR 优化实践 - Binder开辟线程数过多导致主线程ANR异常_第3张图片

更深层次一点讲 是其他进程给systemserver发送Binder消息时是会被阻塞,且没有对端binder线程的。导致调用端需要等待结果,造成了ANR

**故问题的焦点, 在binder线程分配完毕,没有新线程分配,导致调用端在主线程挂起。**那还会有Binder造成ANR或异常的其他情况吗?答案是有的

  • Activity 传递数据 传1M时,造成了异常
  • Activity在异步时  传512k时 造成了异常
  • Binder Server服务端 复杂对象虚拟化造成ANR

这些问题都需要了解binder的底层原理及机制, 然后Binder也是面试最喜欢问的,如:

  • Binder 线程池数量是多少,
  • Binder一次拷贝原理
  • Binder线程池满了为什么会造成ANR

想要搞清楚这些,那么必须对Binder底层原理有着深度了解,

如果你还没有掌握Framework,现在想要在最短的时间里吃透它,可以参考一下《Android Framework核心知识点》,里面内容包含了:Init、Zygote、SystemServer、Binder、Handler、AMS、PMS、Launcher……等知识点记录。

《Framework 核心知识点汇总手册》:https://qr18.cn/AQpN4J

Handler 机制实现原理部分:
1.宏观理论分析与Message源码分析
2.MessageQueue的源码分析
3.Looper的源码分析
4.handler的源码分析
5.总结

携程ANR 优化实践 - Binder开辟线程数过多导致主线程ANR异常_第4张图片

Binder 原理:
1.学习Binder前必须要了解的知识点
2.ServiceManager中的Binder机制
3.系统服务的注册过程
4.ServiceManager的启动过程
5.系统服务的获取过程
6.Java Binder的初始化
7.Java Binder中系统服务的注册过程

携程ANR 优化实践 - Binder开辟线程数过多导致主线程ANR异常_第5张图片

Zygote :

  1. Android系统的启动过程及Zygote的启动过程
  2. 应用进程的启动过程

携程ANR 优化实践 - Binder开辟线程数过多导致主线程ANR异常_第6张图片

AMS源码分析 :

  1. Activity生命周期管理
  2. onActivityResult执行过程
  3. AMS中Activity栈管理详解

携程ANR 优化实践 - Binder开辟线程数过多导致主线程ANR异常_第7张图片

深入PMS源码:

1.PMS的启动过程和执行流程
2.APK的安装和卸载源码分析
3.PMS中intent-filter的匹配架构

携程ANR 优化实践 - Binder开辟线程数过多导致主线程ANR异常_第8张图片

WMS:
1.WMS的诞生
2.WMS的重要成员和Window的添加过程
3.Window的删除过程

携程ANR 优化实践 - Binder开辟线程数过多导致主线程ANR异常_第9张图片

《Android Framework学习手册》:https://qr18.cn/AQpN4J

  1. 开机Init 进程
  2. 开机启动 Zygote 进程
  3. 开机启动 SystemServer 进程
  4. Binder 驱动
  5. AMS 的启动过程
  6. PMS 的启动过程
  7. Launcher 的启动过程
  8. Android 四大组件
  9. Android 系统服务 - Input 事件的分发过程
  10. Android 底层渲染 - 屏幕刷新机制源码分析
  11. Android 源码分析实战

携程ANR 优化实践 - Binder开辟线程数过多导致主线程ANR异常_第10张图片

你可能感兴趣的:(Android,Framework,移动开发,binder,java,开发语言,Framework,移动开发,架构)