IPA后缀的文件是iOS系统的软件包,全称为iPhone application archive。通常情况下,IPA文件都是使用苹果公司的FairPlayDRM技术进行加密保护的。每个IPA文件都是ARM架构的可执行文件以及该应用的资源文件的打包文件,只能安装在iPhone,iPod Touch,iPad以及使用Apple Silicon平台的Mac上。该文件可以通过修改后缀名为zip后,进行解压缩,查看其软件包中的内容。
数字版权管理(英语: Digital rights management, 缩写为DRM)是一系列访问控制技术,通常用于控制数字内容和设备在被销售之后的使用过程。DRM有时也称为拷贝保护、复制控制、技术保护措施等,但这些称呼存在争议。许多数字出版社和软件厂商都使用了DRM, 例如亚马逊、AT&T、AOL、Apple Inc.、Netflix、Google[7]、BBC、微软、Sony、Valve Corporation 等。
解压 .ipa 文件查看其内容并引出 Mach-O 格式
作为iOS开发者都进行过打包测试,当我们把Ad Hoc或者App Store Connect的包导出到本地时会看到一个xxx.ipa文件,ipa是iPhone Application 的缩写。实际上xxx.ipa只是一个变相的zip压缩包,我们可以把xxx.ipa文件直接通过unzip命令进行解压。
我们直接新建一个命名为Test_ipa_Simple的空白iOS App,直接进行Archive后并导出Test_ipa_Simple.ipa文件查看它的内部结构。在终端执行unzip Test_ipa_Simple.ipa解压之后,会有一个Payload目录,而Payload里则是一个看似是文件的Test_ipa_Simple.app,而实际上它又是一个目录,而Payload里则是一个看似是文件Test_ipa_Simple.app,而实际上它又是一个目录,或者说是一个完整的App Bundle。其中Base.lproj中是我们的Main.storyboard和LaunchScreen.storyboard的内容,然后是embedded.mobileprovision(描述文件)和pkgInfo、Info.plist、_CodeSignature用与描述App的一些信息,然后我们要重点关注的便是当前这个目录里面体积最大的文件Test_ipa_Simple,它是和我们的ipa包同名的一个二进制文件,然后用file命令查看它的文件类型是一个在arm64处理器架构下的可执行(executable)文件,格式则是Mach-O,(可直白的理解为胖的Mach-O文件),它们是支持多个架构的二进制文件的顺序组合,例如这里取路径下的系统文件作为示例,使用file命令对它进行查看,可看到它是一个FAT文件,它包含x86_64和arm64e两个架构(这里是m1 Mac下的文件),即这里的是一个支持x86_64和arm64e两种处理器架构的通用二进制文件,里面包含的两部分都是Mach-O格式的64-bit可执行文件。在了解了二进制文件的的数据结构以后,一切就都显得没有秘密了。(下面是终端执行记录,可大致浏览一下)
zhangbo@zhangbodeMacBook-Air Desktop % file ls
ls: Mach-O universal binary with 2 architectures: [x86_64:Mach-O 64-bit executable x86_64] [arm64e:Mach-O 64-bit executable arm64e]
ls (for architecture x86_64): Mach-O 64-bit executable x86_64
ls (for architecture arm64e): Mach-O 64-bit executable arm64e
hmc@HMdeMac-mini Desktop %
zhangbo@zhangbodeMacBook-Air Test_ipa_Simple 2021-04-09 08-10-25 % unzip Test_ipa_Simple.ipa
Archive: Test_ipa_Simple.ipa
creating: Payload/
creating: Payload/Test_ipa_Simple.app/
creating: Payload/Test_ipa_Simple.app/_CodeSignature/
inflating: Payload/Test_ipa_Simple.app/_CodeSignature/CodeResources
inflating: Payload/Test_ipa_Simple.app/Test_ipa_Simple
creating: Payload/Test_ipa_Simple.app/Base.lproj/
creating: Payload/Test_ipa_Simple.app/Base.lproj/Main.storyboardc/
inflating: Payload/Test_ipa_Simple.app/Base.lproj/Main.storyboardc/UIViewController-BYZ-38-t0r.nib
inflating: Payload/Test_ipa_Simple.app/Base.lproj/Main.storyboardc/BYZ-38-t0r-view-8bC-Xf-vdC.nib
inflating: Payload/Test_ipa_Simple.app/Base.lproj/Main.storyboardc/Info.plist
creating: Payload/Test_ipa_Simple.app/Base.lproj/LaunchScreen.storyboardc/
inflating: Payload/Test_ipa_Simple.app/Base.lproj/LaunchScreen.storyboardc/01J-lp-oVM-view-Ze5-6b-2t3.nib
inflating: Payload/Test_ipa_Simple.app/Base.lproj/LaunchScreen.storyboardc/UIViewController-01J-lp-oVM.nib
inflating: Payload/Test_ipa_Simple.app/Base.lproj/LaunchScreen.storyboardc/Info.plist
inflating: Payload/Test_ipa_Simple.app/embedded.mobileprovision
inflating: Payload/Test_ipa_Simple.app/Info.plist
inflating: Payload/Test_ipa_Simple.app/PkgInfo
zhangbo@zhangbodeMacBook-Air Test_ipa_Simple 2021-04-09 08-10-25 % cd Payload
zhangbo@zhangbodeMacBook-Air Payload % ls
Test_ipa_Simple.app
zhangbo@zhangbodeMacBook-Air Payload % cd Test_ipa_Simple.app
zhangbo@zhangbodeMacBook-Air Test_ipa_Simple.app % ls -lht
total 240
drwxr-xr-x 4 hmc staff 128B 4 9 08:10 Base.lproj
-rw-r--r--@ 1 hmc staff 3.0K 4 9 08:10 Info.plist
-rw-r--r-- 1 hmc staff 8B 4 9 08:10 PkgInfo
-rwxr-xr-x 1 hmc staff 86K 4 9 08:10 Test_ipa_Simple
drwxr-xr-x 3 hmc staff 96B 4 9 08:10 _CodeSignature
-rw-r--r-- 1 hmc staff 20K 4 9 08:10 embedded.mobileprovision
zhangbo@zhangbodeMacBook-Air Test_ipa_Simple.app % file Test_ipa_Simple
Test_ipa_Simple: Mach-O 64-bit executable arm64
Mach-O 格式概述
Mach-O 为 Mach Object 文件格式的缩写,全称为 Mach Object File Format 它是一种用于可执行文件、目标代码、动态库、内核转储的文件格式。作为 a.out 格式的替代者,Mach-O 提供了更强的扩展性,并提升了符号表中信息的访问速度。
Mach-O-维基百科
在Xcode->Build Setting -> Mach-O type中,Xcode直接给我们列出了下面几种类型,看名字的话我们大概可以猜一下他们分别对应什么类型:
- executable (应用的主要二进制)
- Dynamic Library (动态链接库 (又称DSO或DLL) )
- Bundle (不能被链接的Dylib, 只能在运行时使用dlopen()加载,可当做macOS的插件)
- Static Library (静态链接库)
- Relocatable Object File (可重定向文件类型)
如果我们新建iOS App的话 Mach-O Type 默认就是 Executable, 如果新建 Framework 或 Static Library 则 Mach-O Type 分别默认是 Dynamic Library 和 Static Library,如果我们同时选中Include Tests,创建出的TARGETS 中的 Tests 和 UITests 的 Mach-O Type 默认是 Bundle。
实际上在 apple/darwin-xnu的 darwin-xnu/EXTERNAL_HEADERS/mach-o/loader.h中定义了一组宏来表示不同的Mach-O Type,如 #define MH_EXECUTE 0x2 /* demand paged executable file */、#define MH_DYLIB 0x6 /* dynamically bound shared library */、#define MH_BUNDLE 0x8 /* dynamically bound bundle file */、#define MH_OBJECT 0x1 /* relocatable object file */
等 (它们分别对应上面的Mach-O Type)。在数据结构层面这一组不同的宏正用于为struct mach_header_64的 filetype 字段赋值,来表示当前Mach-O的不同类型,下面具体分析Mach-O结构
的时候,详细分析这些宏值所代表的含义
。
在 Code Size Performance Guidelines 文档中的 Overview of the Mach-O Executable Format 章节提到了 Mach-O 格式,并描述了如何组织 Mach-O executable format 来提高代码的效率,下面我们先看下这一节的原文。
Mach-O是OS X中二进制文件的native可执行格式,是shipping code的首选格式。可执行格式决定二进制文件中的代码(code)和数据(data)读入内存的顺序。代码和数据的顺序会影响内存使用和分页活动(paging activity),因此会直接影响程序的性能。
Mach-O二进制文件被组织成段(segments)。每个段包含一个或多个sections。不同类型的代码或数据进入每个section。segments总是从页(page)边界开始,但sections不一定是页对齐的(page-aligned)。segment的大小由它包含的所有sections中的字节数来度量,并向上舍入到下一个虚拟内存页的边界(virtual memory page boundary)。因此,一个segment总是4096字节或4KB的倍数,其中4096字节是最小大小。
Mach-O可执行文件的segments和sections根据其预期用途名。Segment名称的约定是使用前有双下划线的所有大写字母组成(例如:__TEXT);Section名称的约定是使用前有双下划线的所有小写字母组成(例如: __text)。
Mach-O可执行文件中有几个可能的segments,但是只有两个与有关:__TEXT segment和__DATA segment。
- The __TEXT Segment:Read Only
__TEXT segment 是一个只读区域,包含可执行代码和常量数据。按照惯例,编译器工具创建的每个可执行文件至少有一个只读__TEXT Segment。由于该segment是只读的,内核可以将可执行文件中的__TEXT segment直接映射(map)到内存中一次。当segment映射到内存中时,它可以在对其内容感兴趣的所有进程之间共享。(这主要是frameworks和shared libraries的情况。)只读属性还意味着组成__TEXT segment的页不必保存到备份存储。如果内核需要释放物理内存,它可以丢弃一个或多个__TEXT页,并在需要时从磁盘重新读取它们。
表1列出了可以出现在__TEXT segment中的一些更重要的sections。有关segments的完整列表,请参阅Mach-O Runtime Architecture。