Java 作为一种编程语言,具有许多良好的功能,使其成为应用程序开发的首选语言。它独立于平台(因为虚拟机执行)、JIT 编译、多线程支持以及为程序员提供的富有表现力的简单语法。由于其与平台无关的特性,Java 包可以跨 CPU 架构移植,这使得库开发变得更加容易,从而增强了插件、构建工具和实用程序包的整体生态系统。
功能数量与性能之间恰好存在权衡。像汇编这样的语言具有最少的内存和执行开销,但从程序员的角度来看,其功能数量也最少。在层次结构中向上移动,C 和 C++ 等语言提供了一组良好的功能,同时保持更接近底层硬件。在它们之上的是Java和Python等语言,它们选择通过使用虚拟机来完全消除平台依赖。用这些语言编写的程序有巨大的开销,但却是开发人员的天堂。
JVM 现在可以访问共享库中公开的函数,并且操作系统根据需要执行它们。
正如我们上面的讨论,在我们的系统中,性能比开发人员友好性更重要,这将我们的重点从 Java/Kotlin 转移到了“原生语言”(C/C++)。让我们通过一些示例来了解本机代码的作用及其性能改进,
图:TensorFlow 源代码片段,显示了 arg_max 操作的实现。图片参考:作者截图自GitHub上TensorFlow官方源代码
许多此类系统在牺牲可读性和其他一些因素的情况下维护性能。接下来,我们将简短讨论指令集架构 (ISA) 以及程序执行如何随着 CPU 架构的变化而变化。
图 1:Android 应用程序如何使用 C++ 源代码的描述。
如上图所示,描述了 Android 中 C/C++ 代码的使用,其中存在两个独立的构建过程,一个用于 C/C++ 代码,另一个用于 Java/Kotlin 代码。在本博客中,我们将重点关注 C/C++ 代码构建过程,并了解代码如何与 JVM 通信以进行函数调用。
我们首先简要概述一下 C/C++ 和 Java 程序的编译方式,主要强调 C/C++ 编译的平台特定性。接下来,我们讨论 JNI,它充当 C/C++ 和 Java 代码之间的粘合剂。我们结束对 CMake、共享库和 ABI 的讨论,它们是构建过程的最底层组件。
正如 Reddit 用户建议的那样
pjmlp
,Android 不使用 JVM 在设备上运行应用程序。它有自己的运行时,ART(Android RunTime)继承了 Dalvik 及其自定义字节码 DEX。
让我们开始吧
➡️ C++ 是一种编译语言,源代码被转换为可执行的二进制代码。可执行文件包含源程序的二进制版本、常量和库代码(如果需要)。
➡️ 该可执行文件由操作系统的一个组件(称为加载程序)解析,该组件为程序的执行分配内存并从可执行文件中读取指令。例如,如果一个hello-world C++ 程序是g++
在 Ubuntu 上编译的,那么它也可以在其他一些 Linux 发行版上运行,只要它们理解x86
或x86_64
指令集。
arm
➡️ 移动设备在指令集上运行arm64
,因此编译的程序x86
将无法工作,因为两个可执行文件都是用完全不同的语言编写的(如加载程序所见)。
图 2:C++ 和 Java 程序的编译。Java 编译器生成的类文件与平台无关,而 C++ 编译器(如 GCC)生成的可执行文件(或共享库)与平台相关。Java类文件需要目标机器上的JVM来执行程序,而C++可执行文件可以直接使用操作系统提供的链接器和加载器运行。
一个 Android 项目,包含四种不同平台/架构的库。(作者截图)
Android 设备主要可以在四种架构上运行- arm64-v8a
、armeabi-v7a
和x86
。x86_64
该arm-
架构还适用于大多数 Android 手机中使用的基于 ARM 的处理器,而x86-
基于 ARM 的处理器则用于 Intel 或 AMD 处理器,例如 Windows 模拟器和 Chromebook。
➡️ 如果您在某个时间点学习过 Java,视频和博客中经常强调的一个显着功能是平台独立性或构建一次,随处运行。Java 不是将源代码转换为机器相关的可执行格式,而是将代码转换为中间表示 (IR)。
x86
➡️ IR 与平台无关,这意味着无论指令集有何arm
差异,平台上生成的 IR都是相同的。IR 由一个依赖于平台的组件(称为 Java 虚拟机)进行解析,该组件从中读取指令并在底层 CPU 上执行它们。由于 JVM 一只手负责 IR,另一只手负责机器的 CPU,因此它与平台无关。
JVM 支持即时 (JIT) 编译,与纯解释性语言相比,这种技术可以提供巨大的性能提升。
➡️ JVM 可以在几乎所有 CPU 架构上运行,并执行在任何平台上编写的 Java 代码(因为生成的 IR 与平台无关),唯一的依赖项是我们需要在目标计算机上安装 JVM。
总而言之,Java 和 C++ 有不同的编译策略,关键是 C++ 执行依赖于体系结构,因此如果我们尝试将 C++ 与任何体系结构中立的语言(如 Java)一起使用,我们需要确保 C++ 依赖关系尊重不同的编译策略。他们将在其上运行的架构。
Android 作为一个操作系统,并不使用标准的 JVM 来执行 Java 代码。打包的应用程序 APK 包含 DEX 文件(类似于.class
文件)以及本机代码和资源。DEX 文件由操作系统提前(在执行之前)编译为本机可执行代码,当用户打开应用程序时,可以快速实例化这些代码。
JNI 或 Java 本机接口是一个允许 JVM 和本机代码(C、C++ 或汇编代码)之间轻松通信的框架。一般来说,它提供外部函数接口(FFI),允许用一种语言编写的代码与用另一种语言编写的代码进行通信,通常是通过函数调用的方式。Java 源代码可以搜索 C++ 模块中存在的函数定义,这些函数被标记为供 JVM 使用。
// C++ source file
extern "C" JNIEXPORT jstring JNICALL
Java_com_projects_ml_samplecppdemo_MainActivity_compute(
JNIEnv* env,
jobject instance ,
jstring message ,
jlong length
) {
// Method block goes here
}
compute
将在 中具有等效的 Kotlin 函数MainActivity
,
// Kotlin source file
external fun compute( message: String , length: Long ): String
在编译时,JVM 需要找到我们在代码中声明的MainActivity.kt
函数的定义。compute
我们知道,定义包含在C++源文件中,那么我们如何将其提供给Java程序呢?我们编译 C++ 代码并将其打包为共享库,JVM 将在其中搜索 JNI 函数的定义。
CMake和Android NDK在C/C++源代码编译中的作用
我们在基于 Windows、macOS 或 Linux 的操作系统上开发 Android 应用程序。这些系统大多数没有 Android 特定的 ARM 架构,并且无法在 Android 设备上编译代码。那么我们如何为手机使用的Android特定ARM架构编译代码呢?
Android NDK 中存在的工具链概述。
我们使用 Android NDK(Android 本机开发套件),它提供编译器和链接器来从x86
甚至其他arm
设备(Apple Silicon 或 Raspberry Pi)构建 Android-ARM 库和可执行文件。在运行其他目标(例如 Android-ARM)的系统上为其他目标(例如 Android-ARM x86_64
)构建代码的过程称为交叉编译。因此,在 Windows 计算机上,使用 Android NDK 的编译器,我们可以为应用程序构建共享库,该应用程序可以在移动设备(即 ARM 设备)上完美运行。
Android NDK 中有一个CMAKE_TOOLCHAIN_FILE
,它通知 CMake 使用哪个编译器。正如维基百科所说,工具链是一组编程工具,用于执行复杂的软件开发任务或创建软件产品,Android NDK为不同的Android API级别提供了各种工具链来构建和编译C/C++程序。
g++
如果我们要编译一个简单的 C++ hello-world 程序,我们将使用大多数 Linux 发行版中预安装的GNU编译器,
g++ main.cpp -o main
➡️ 对于单个源文件,main.cpp
单个命令即可完成工作。较大的代码库可能具有多个模块和大量 C/C++ 源文件,这些文件必须编译或构建到共享/静态库中。此类代码库(其他 C++ 项目)的依赖关系需要很好地集成。如此庞大的代码库也需要大量的编译时间。
➡️为了解决这些问题,Make
可以使用GNU的工具,它提供了管理多个目标、增量构建、包含头文件的能力以及支持多种语言的功能。因此,单个Make
脚本将有效地执行编译,而不是运行多个命令进行编译。
cmake_minimum_required(VERSION 3.22.1)
project("samplecppdemo")
# Tell CMake to build a shared library (.so) for the given
# source file native-lib.cpp.
# native-lib.cpp also contains the JNI functions
add_library(
${CMAKE_PROJECT_NAME}
SHARED
native-lib.cpp)
# CMake can also link other libraries to the current build
# android and log are used to provide android-specific routines
# and logging respectively
target_link_libraries(
${CMAKE_PROJECT_NAME}
android
log)
➡️ CMake 可以Make
以独立于编译器的方法生成脚本,并具有自己的语法,允许开发人员添加依赖项、标头和其他必须在编译时链接的库。CMake 类似于 Gradle,因为两者都是构建系统。
➡️ C/C++ 代码的编译可以生成可执行文件或库,两者都包含源代码的二进制表示形式。main
可执行文件具有其他详细信息,例如执行开始处的函数地址并遵循 ELF 格式。库通过将库与程序的目标代码链接来提供可由其他程序调用的函数。
Android 应用程序中每个目标架构的 .so 库
➡️ 在 Android 中,C/C++ 文件被编译为共享库,以.so
(共享对象)扩展名结尾。这些库公开了我们在 (2) 中编写的 JNI 函数,正如它们extern
在原型中所标记的那样。JVM 可以查看.so
文件的代码并使用函数的二进制代码在设备上执行它。
➡️ 这种发生在二进制级别的源代码和库代码之间的交互通常是通过应用程序二进制接口 (ABI) 发生的。相反,应用程序编程接口 (API) 在编译发生之前促进源代码级别的此类交互。