iOS:Tagged Pointer

提示

文中观点暂时只在 iOS 模拟器上针对 3 中情况进行测试,稳中观点在后期可能不断更新。因此,文中观点可能不够完整甚至是不正确,请自行验证,辩证看待。如有错误,烦请指正哦~~~

一、常量区

iOS 中,使用 @"" 生成的字符串都以常量的形式存储在常量区;

NSString *string = @"caoxk---123456789010101010101001hgsuwwehscas";
NSString *string2 = @"caoxk---123456789010101010101001hgsuwwehscas";

转换成 C/C++之后的代码:

// 直接取常量的内存地址
NSString *string = (NSString *)&__NSConstantStringImpl__var_folders_yx_cblctywx29jd6fz28m0w4kyc0000gn_T_main_3b8aa9_mi_0;
NSString *string2 = (NSString *)&__NSConstantStringImpl__var_folders_yx_cblctywx29jd6fz28m0w4kyc0000gn_T_main_3b8aa9_mi_1;

如上,直接将常量的内存地址赋值给了局部变量,打印内存也可以验证:

NSLog(@"局部变量内存地址:%p",&string);
NSLog(@"字符串常量在常量区的内存地址:%p",string);
NSLog(@"字符串常量在常量区的内存地址:%p",string2);

输出结果:

局部变量内存地址:0x7ffee495d358
字符串常量在常量区的内存地址:0x10b2a4030
字符串常量在常量区的内存地址:0x10b2a4030

另外,在 Mach-O 文件的 CFString 字段中,可以查看字符串常量:

Mach-O中的CFString

另外,提一嘴全局区的细化:

全局区如果划分的很细的话,可以分为全局已初始化区域、全局未初始化区域。其中全局已初始化区域又可以分为全局变量区、静态常量区。

即:

划分
int a = 10;
int b;
int c;
int d = 20;

int main(int argc, char * argv[]) {

    NSLog(@"%p",&a);
    NSLog(@"%p",&b);
    NSLog(@"%p",&c);
    NSLog(@"%p",&d);
}

结果:

2021-02-25 10:47:36.374 XKStringTest[58776:15939603] 0x100938e40
2021-02-25 10:47:36.374 XKStringTest[58776:15939603] 0x100938e48
2021-02-25 10:47:36.374 XKStringTest[58776:15939603] 0x100938e4c
2021-02-25 10:47:36.375 XKStringTest[58776:15939603] 0x100938e44

内存表现:

ViewMemory

结论:

  1. 内存中的常量区分为已初始化常量区和未初始化常量区;
  2. 已初始化常量区在内存段前面,未初始化的在内存段后面;
  3. 全局区三大区域内存地址顺序不变,声明顺序只影响变量所在区域的先后顺序;

二、Tagged Pointer

Tagged Pointer 使用 20 位的“类”内存地址来表示字符串:

Tagged Pointer

解释:

  1. 之所以说成 “类” 内存地址,是因为严格意义上而言,不存在这个内存地址。使用内存起始地址 a 来标志这不是一个真实的内存地址,而是一个用于表示字符串的 Tagged Pointer;
  2. 用了 18 个 16 进制位来表示 ASCII 码,因此,最多可以表示 9 个 ASCII 字符,这也是为什么超过 9 位的字符串将转为使用堆内存存储;
  3. 是用 1 个 16进制位来表示字符串的长度;

上代码:

NSString *string1 = [NSString stringWithFormat:@"%@",@"123"];
NSString *string2 = [NSString stringWithFormat:@"%@",@"124"];
NSString *string3 = [NSString stringWithFormat:@"%@",@"125"];
NSString *string4 = [NSString stringWithFormat:@"%@",@"1256"];
NSString *string5 = [NSString stringWithFormat:@"%@",@"2256"];
NSString *string6 = [NSString stringWithFormat:@"%@",@"abc"];

先看 string1 - string6 的内存地址:

2021-02-25 11:32:32.140 XKStringTest[59022:15957079] string1:0xa000000003332313
2021-02-25 11:32:32.143 XKStringTest[59022:15957079] string2:0xa000000003432313
2021-02-25 11:32:32.144 XKStringTest[59022:15957079] string3:0xa000000003532313
2021-02-25 11:32:32.145 XKStringTest[59022:15957079] string4:0xa000000363532314
2021-02-25 11:32:32.146 XKStringTest[59022:15957079] string5:0xa000000363532324
2021-02-25 11:32:32.147 XKStringTest[59022:15957079] string6:0xa000000006362613

就 string1 而言,最后一位 “3” 表示字符串的长度,而 33、32、31 转化成 10 进制依次为:51、50、49,查询 ASCII 表:

ASCII

所以,0xa000000003332313 即表示 123,再看 string6,同理,61,62,63 分别表示 a、b、c,其他的自行推证;

总结:

  • 18个进制位按照倒序方式,每两个 16 进制位表示一个字符串所对应的 ASCII 字符;

继续看代码:

NSString *string7 = [NSString stringWithFormat:@"%@",@"1234567"];
NSString *string8 = [NSString stringWithFormat:@"%@",@"12345678"];
NSString *string9 = [NSString stringWithFormat:@"%@",@"abcdefghi"];
NSString *string10 = [NSString stringWithFormat:@"%@",@"1234567890"];

打印结果:

2021-02-25 11:39:23.384 XKStringTest[59049:15960223] string7:0xa373635343332317
2021-02-25 11:39:23.388 XKStringTest[59049:15960223] string8:0xa007a87dcaecc2a8
2021-02-25 11:39:23.389 XKStringTest[59049:15960223] string9:0xa0880e28045a5419
2021-02-25 11:39:23.390 XKStringTest[59049:15960223] string10:0x60000002bee0

从上可以看到,当字符串长度为 10 时,内存地址发生了显著变化,而这个明显就是堆内存地址,可以打印内存地址验证:

NSString *constString = @"123";
NSLog(@"常量区地址:%p",constString);
NSLog(@"栈地址:%p",&string10);
NSLog(@"堆地址:%p",string10);
NSLog(@"Tagged Pointer:%p",string9);

输出结果:

2021-02-25 11:42:11.609 XKStringTest[59110:15962307] 常量区地址:0x1009db160
2021-02-25 11:42:11.610 XKStringTest[59110:15962307] 栈地址:0x7ffeef226340
2021-02-25 11:42:11.611 XKStringTest[59110:15962307] 堆地址:0x60800002d1c0
2021-02-25 11:42:11.611 XKStringTest[59110:15962307] Tagged Pointer:0xa0880e28045a5419

总结:

  • Tagger Pointer 最多表示长度为 9 的字符串;

三、堆内存

根据上面的示例,已经可以下结论:

  • 使用 init 方法生成的字符串,如果大于 9 位,则以堆内存的形式存储;

可能 NSString 的各种方法有潜规则,有可能有不使用 Tagged Pointer 的方法,此时即使是长度小于 9 的字符串,也可能是存在堆内存中,这里就不去深究了,遇到了再具体看就行。

还需要提一嘴的是:

NSString 对象在堆内存中不是从内存地址的一开始就是表示字符串的,比如 string10(@"1234567890") 查看堆内存的表现是:

堆内存图

这也很好理解,应为 NSString 为 NSObject,还有一些其他的属性需要表示,根据一些重排规则(比如struct 内存对齐、比如 Apple 的内存重排优化)排在前面也不可厚非;

四、总结

总结:

  1. iOS 中的字符串以常量、Tagged Pointer、堆内存的三种形式存在;
  2. Tagged Pointer 最多表示 9 个字符串;

你可能感兴趣的:(iOS:Tagged Pointer)