2018年3月8日,谷歌发布了Android P的预览版,预计今年的Q3季度发布final release版本,有不少文章从开发者角度介绍了Android P的新特征,初步来看给感觉这次大版本似乎并没有什么改变。接下来,将从系统Treble,System,Framework,Runtime, Security等多方面来解读一下Android P的变化。
这是我的微信公众号:Android达摩院(AndroidAcademy),出品的文章,欢迎大家关注,后续会有更多精彩内容。
Treble计划是一个非常重要的变革,对系统层面的影响很大。Google每发布一个Android大版本,到厂商和APP的适配,过程是漫长的,每一次大版本适配工作的艰难厂商最能体会,各种兼容性问题。正如去年发布的Android O,目前Android O机型用户量比较小,APP都没能快速跟进把targetSdk适配到O的情况下,Android P又即将到来,Android系统的碎片化一直是一个痛点。该计划的核心主旨是让系统与硬件相关的解耦,加快系统升级速度。Treble始于Android O,到Android P又得以进一步完善。
接下来,来看看Treble在整个Android系统的位置。
最中间Treble Interface组成成分,在Android O添加的接口:C++依赖(使用VNDK),IPC调用(使用HIDL),SELinux,通用Kernel接口,Android Verified Boot(AVB);到Android P新增接口:Java依赖(使用System SDK),系统Properties。从图中可以看出Treble计划是希望底层Vendor用旧版本,也能支持System层升级为新版本,从而保证Android大版本可快速升级。
这里需要注意,System Property兼容性对于treble来说是非常糟糕的,它允许平台和Vendor之间通过非稳定通道进行跨进程通信,这与treble的分离解耦背道而驰。
为此,treble计划通过分离properties到platform和vendor。platform进程只能访问平platform属性,vendor进程只能访问vendor属性, 当然也是允许platform属性去暴露给vendor进程。
VINTF(Vendor Interface)被分离成硬件无关(Framework)和硬件相关两部分。为了进一步规范化系统架构,定义了CKI(Common Kernel Interface)作为通用系统镜像必须依赖的内核接口集,并且对Kernel分支精简也进行了有效的精简。
VTS会测试HAL,Kernel, VNDK的可靠性,CTS测试通用系统接口,framework feature。从Android O以后就强制要求,通过CTS/VTS则会为system解耦合的适配提供了保障。
Treble语境中,Vendor是指片上系统的HAL层和外围设备,不依赖于硬件的软件则不属于Vendor;VNDK是指Vendor用于实现HAL层所提供的系统库。
这一切都是为系统库与Vendor库之间的解耦合,在Android P上采用该方案,则下一个大版本Android Q更新,可以直接将新的System Q加上老Vendor P,组成新版本Android。
其中VNDK + Framework libs组成system.img, Vendor libs组成vendor.img。
Android P新添加命名空间namespace:
FDE用于Android 6.0, FBE用于Android 7.0,并且会创建DE和CE两个目录,提供更好的用户体验和隐私安全。 FDE很快会被彻底移除。
另外,未来会有更快的加密算法。
文件系统
文件系统配额从Android 8.0开始支持,三个主要目标是
Fair cache策略:
分配cache配额给每个App(基于他们使用的频率),删除最老的cached文件,直到有足够的空闲空间;
最佳实践:定期调用新方法以保证系统有机会去删除缓存文件,可以follow PackageInstaller,DownloadManager和DocumentsUI。
限制滥用app:
设备应该卸载恶意app,或者删除大文件
避免设备卡在循环的重启过程
阻止app使用block90%, 或者inodes50%
exFAT:Google没有资源支持相关的更新工作,只有会部分补丁;
vold:跟fw通信方式,由socket调整为binder方式,用于提高性能;这是继installerd之后的再一次由socket转变成binder模块;
TRIM: 该过程会运行f2fs GC操作,并且在夜间空闲时间来被调度执行;
FUSE: 已被删除,采用sdcardfs, 后续会有esdfs用于更深远的优化
更快的文件拷贝: FileUtils.copy,比如纯userspace的方式快35~50%
FDE,FUSE, ASECs这些都被删除。
基于内核的LMK缺点:
替代方案:用户态LMKD + memory cgroups
用户态LMKD策略:
未来
sdcardfs和fuse才是一个层面的东西,sdcardfs比fuse的的性能更好,对同一文件的操作,fuse需要经历6次用户态与内核态的切换,而sdcardfs只需要两次。对于fuse可以使用各种文件系统,比如ext3, ext4, f2fs.
(F2FS,Flash-Friendly File System)文件系统重要特性
F2FS相比ext4在文件顺序写、随机写以及SQLite方面有较大幅度的提升。Google将持续调整F2FS的性能与稳定性方面的表现。
在Android O上将Binder大锁拆分为更细粒度的锁,便真正解决了binder锁竞争问题。
P上更加注重相同性能下如何改进功耗,EAS作为通用的基于功耗模型和性能数据的CPU调度算法,而非tuning的方式。
为什么Android采用EAS调度算法呢?需要一个标准的结合功耗和性能的调度器,能通过Framework来调整调度策略,这里需要考虑资源负载均衡、大小核、cpufreq、 governor、减少大核的使用、平衡功耗问题,2018.5完成EAS r1.6版本。
从Android P开始,只有当Intent flag中指定了FLAG_ACTIVITY_NEW_TASK,才允许在非Activity场景启动Activity。
APP必须拥有FOREGROUND_SERVICE权限,才允许使用前台服务,否则会抛出异常。
目前很多APP开发者们对Android O的一些后台限制行为不太了解这些变更,遇到问题可能误以为系统问题,所以这里说到这顺便提一下关于Android O对后台行为的一些管控。
后台服务(Background Service)限制
广播(Broadcast)限制:
重构Package Manger,减少核心服务的代码复杂度,将permission,intent等代码移到单独的类,
将user management,dex,shortcuts等不相关代码移到子包;尽可能操作本地数据,避免加锁;同时增加单元测试。
PMS在Android O主要改动是优化启动时间,将操作尽可能并行化执行,在Android P上主要改动是扫描过程scanPackageOnly(),
下一步提取更多的子组件和类,比如Intent resolution, package verification, dexopt等,减少修改对象成员的方法。
在Android O上,结构化窗口对象模型和容器层次结构, 提高CTS覆盖率并引入单元测试,SurfaceFlinger中引入层级结构用于SurfaceView,引入Task快照。在Android P上,继续提升创建对象模型,同步APP Transitions,WindowScope工具,
过度使用Stack ID, Stack管理着类似的task和activity,特定的窗口模式,例如HOME_STACK_ID,FULLSCREEN_STACK_ID,FREEFORM_STACK_ID,这就导致同一个Stack的task和activity不允许有不同的窗口模式。新的方案允许有多个WindowContainers,窗口模式不再受限于Stack ID。
采用同步的APP Transitions, animations的过程可不再需要WMS大锁。另外Transitions,WindowScope工具是一个类似于systrace的工具,可用于方便查看WindowManager和SurfaceFlinger,仅在userdebug版本开启,对性能影响较小。
之前关于续航方面,有JobScheduler, Doze, 限制隐式广播,后台服务和定位限制,缓存wakelock释放等功能,
一直以来Google在功耗方面没有从整体上的策略,不同OEM往往会有不同的策略针对功耗,比如Force stop app,
kill activity/service等。这次Android P在功耗方面也是重点,Google计划在Android P上采用机器学习的思路来预测用户使用习惯,来做省电优化。
从而把APP分为四类Active, working_set,frequent, rare,划分到不同bucket的app则采取对Jobs,Alarms,Network, FCM等限制策略。
目前很多应用为了后台存活,都挂fg-service,其实Google,包括厂商都非常不建议开发者一直这样使用的,应该尽量克制,只要需要的场景使用,比如后台导航、后台播放音乐。
这也是为什么fg-service一定要显示通知,为的是让用户可知应用的行为,对于不该后台活动的依然挂前台通知,那么用户可能会主动杀它,甚至卸载。
在Android 8.1中引入神经网络API,提供Android内置的机器学习,在Android P中又进一步扩展和改进TensorFlow.
在Android P上采用AI预测用户行为来进行更智能化的省电策略,在UI搜索界面也使用到机器学习,AI正在逐步强化Android系统
Dynamic App,需应用商店支持,资源文件,配置,语言,App内部基于版本格式的信息等都可以采用Dynamic App来精简APK尺寸。
Autofill:平台、插件、app、浏览器,一套完整的自动填充框架解决方案
电话体验
提升打电话的用户体验,扩展APIs从而支持不同APP的电话并发,Telecom可跟踪所有的活动来电,但只有一个应用可获取焦点。另外,
调整SIM状态改变的广播,SIM_STATE_CHANGED改为SIM_CARD_STATE_CHANGED和SIM_APPLICATION_STATE_CHANGED广播。
也同步调整了TelephonyManager。
活动检测
活动检测会结合传感器和声音数据,能识别走路、跑步、骑车、开车、上下楼梯,甚至要区分使用者是在汽车、地铁、火车,还是摩托车,也能识别睡眠模式,
当AR检测到处于开车模式,则停止通知以避免打扰开车人员。为系统提供使用者活动状态转换的API
室内导航
一直以来无法做到精准的WIFI室内定位,次次Android P系统支持了IEEE 802.11mc WiFi协议,室内导航功能即将到来,应用能使用室内定位,为定位服务提供便利。
CHRE
优化功耗就意味着需要尽可能少的唤醒AP,比如Doze模式,后台定位限制模式。定义一个Context Hub运行时环境,在该环境下的CPU不允许直接运行Java/Linux,只允许执行特殊的功能。
在Android P实现了Context Hub Service,使用起来更加简单。后续可以有always-on,低功耗模式
在安装、更新、OTA的时候ART需从APK里提取压缩过的dex并进行校验,这样既浪费空间,也浪费CPU时间。
为此,正在做的方案是采用未压缩的dex文件,商店将会对其进行Java校验并将校验结果直接在安装过程使用。
对于dex文件开始采用一个新的紧凑的格式,减少对内存和存储空间的使用,更加智能的布局优化,更少的闪存读取。
关于调试方面,使用JVMTI来替代ART debugger,提供更多的扩展功能,包括断点、异常等事件,本地变量审查,字段监测,类的重定义。
Backtraces使用Java上下文来显示,省去使用addr2line来转换的一个过程,方便调试分析问题。例如
Kotlin作为Android官方正式语言,其性能并不会比Java执行慢
Profiles in the Cloud:
从N开始使用profile方式编译,对于存储空间、内存、功耗、CPUs使用率都有益处,但目前profile只是本地的方式,
在优先之前仍需要等待获取profile。未来收集用户的profile,并上传到云端(Google play),在安装时从云端获取profile直接使用到新用户。
大概能提升20%的冷启动性能。
core lib
升级libcore代码到OpenJDK 9。APP弃用策略,Android将添加支持的最低版本,当targetVersionSdk<17的app则会弹出警告框。
从bootclasspath中移除Apache HTTP库、JUnit
采用Soong来编译Java,从GNU Make移植到Soong
跨版本构建过程:
Android P到底可见的Android.bp,所有依赖必须使用android.bp,androidmk工具可用于将make文件转换为Android.bp文件;
Android P在运行时强制限制应用通过反射方式来操作被标记为@hide的类、方法、属性。
将API分为4类:白名单、灰名单、深灰名单、黑名单;当API属于白名单则不限制,灰名单(targetSdk ≥P)则警告,黑名单则
抛出NoSuchFieldException/NoSuchMethodException异常。对于深灰名单,介于灰名单和黑名单之间,取决targetSdk,
当(targetSdk ≥P)按黑名单方式处理,当(targetSdk <P)按灰名单方式处理。
对于黑名单只允许平台APP使用,对于灰白名单的API虽然不会直接抛出异常,但不再保证跨版本的兼容性,这样限制是为了后续新版本能更快地完成适配。
Google之所以要设计灰白黑名单,也是为了给应用一个过渡时机,也给Android一个完善公开API的机会,对于某些很重要的@hide接口,可能也会考虑适当增加公开接口,另外那些API会被第一批加入黑名单,还需拭目以待。对于AOSP的黑名单和深灰名单将放入CTS测试,进而限制厂商不能轻易修改名单。
关于兼容性测试,Google目前有CTS/VTS/GTS,其中CTS主要测试API行为,VTS针对Treble计划以及测试HW实现,GTS针对GMS需求和分销协议,
很快Google还会推出STS,用于隐私测试。从Top应用的测试数据来看,目前国内大多数的APP都存在兼容性问题,问题主要集中在热修复、混淆、加固以及依赖internal API。
另外,@SystemApi不再向后兼容,另外几乎所有的系统API都需要权限。
/vendor/priv-app将在Android P上支持,权限会被限制有vendorPrivileged标识的权限。
将所有网络流量从明文转向TLS,更改网络安全性配置 (Network Security Configuration) 的默认值,以阻止所有明文流量。
为保护用户隐私,当应用UID空闲时,断开应用对摄像头、话筒、传感器的使用,如果应用强制使用则会产生错误,从而进一步防止流氓应用后台手机隐私数据。
FBE加密:FBE将会更容易支持高端元数据加密的设备,以及对sdcard的支持。对于OEMs能够更简单地移植。对于低端设备,更快速的算法,适合所有机型的移植。
总之,Google一方面从系统层面不断优化Android系统;另一方面致力于改善APP生态,不断加强对非友善APP的管控,减少其对系统性能与续航的影响。