提示
文中观点暂时只在 iOS 模拟器上针对 3 中情况进行测试,稳中观点在后期可能不断更新。因此,文中观点可能不够完整甚至是不正确,请自行验证,辩证看待。如有错误,烦请指正哦~~~
一、常量区
iOS 中,使用 @"" 生成的字符串都以常量的形式存储在常量区;
NSString *string = @"caoxk---123456789010101010101001hgsuwwehscas";
NSString *string2 = @"caoxk---123456789010101010101001hgsuwwehscas";
转换成 C/C++之后的代码:
// 直接取常量的内存地址
NSString *string = (NSString *)&__NSConstantStringImpl__var_folders_yx_cblctywx29jd6fz28m0w4kyc0000gn_T_main_3b8aa9_mi_0;
NSString *string2 = (NSString *)&__NSConstantStringImpl__var_folders_yx_cblctywx29jd6fz28m0w4kyc0000gn_T_main_3b8aa9_mi_1;
如上,直接将常量的内存地址赋值给了局部变量,打印内存也可以验证:
NSLog(@"局部变量内存地址:%p",&string);
NSLog(@"字符串常量在常量区的内存地址:%p",string);
NSLog(@"字符串常量在常量区的内存地址:%p",string2);
输出结果:
局部变量内存地址:0x7ffee495d358
字符串常量在常量区的内存地址:0x10b2a4030
字符串常量在常量区的内存地址:0x10b2a4030
另外,在 Mach-O 文件的 CFString 字段中,可以查看字符串常量:
另外,提一嘴全局区的细化:
全局区如果划分的很细的话,可以分为全局已初始化区域、全局未初始化区域。其中全局已初始化区域又可以分为全局变量区、静态常量区。
即:
int a = 10;
int b;
int c;
int d = 20;
int main(int argc, char * argv[]) {
NSLog(@"%p",&a);
NSLog(@"%p",&b);
NSLog(@"%p",&c);
NSLog(@"%p",&d);
}
结果:
2021-02-25 10:47:36.374 XKStringTest[58776:15939603] 0x100938e40
2021-02-25 10:47:36.374 XKStringTest[58776:15939603] 0x100938e48
2021-02-25 10:47:36.374 XKStringTest[58776:15939603] 0x100938e4c
2021-02-25 10:47:36.375 XKStringTest[58776:15939603] 0x100938e44
内存表现:
结论:
- 内存中的常量区分为已初始化常量区和未初始化常量区;
- 已初始化常量区在内存段前面,未初始化的在内存段后面;
- 全局区三大区域内存地址顺序不变,声明顺序只影响变量所在区域的先后顺序;
二、Tagged Pointer
Tagged Pointer 使用 20 位的“类”内存地址来表示字符串:
解释:
- 之所以说成 “类” 内存地址,是因为严格意义上而言,不存在这个内存地址。使用内存起始地址 a 来标志这不是一个真实的内存地址,而是一个用于表示字符串的 Tagged Pointer;
- 用了 18 个 16 进制位来表示 ASCII 码,因此,最多可以表示 9 个 ASCII 字符,这也是为什么超过 9 位的字符串将转为使用堆内存存储;
- 是用 1 个 16进制位来表示字符串的长度;
上代码:
NSString *string1 = [NSString stringWithFormat:@"%@",@"123"];
NSString *string2 = [NSString stringWithFormat:@"%@",@"124"];
NSString *string3 = [NSString stringWithFormat:@"%@",@"125"];
NSString *string4 = [NSString stringWithFormat:@"%@",@"1256"];
NSString *string5 = [NSString stringWithFormat:@"%@",@"2256"];
NSString *string6 = [NSString stringWithFormat:@"%@",@"abc"];
先看 string1 - string6 的内存地址:
2021-02-25 11:32:32.140 XKStringTest[59022:15957079] string1:0xa000000003332313
2021-02-25 11:32:32.143 XKStringTest[59022:15957079] string2:0xa000000003432313
2021-02-25 11:32:32.144 XKStringTest[59022:15957079] string3:0xa000000003532313
2021-02-25 11:32:32.145 XKStringTest[59022:15957079] string4:0xa000000363532314
2021-02-25 11:32:32.146 XKStringTest[59022:15957079] string5:0xa000000363532324
2021-02-25 11:32:32.147 XKStringTest[59022:15957079] string6:0xa000000006362613
就 string1 而言,最后一位 “3” 表示字符串的长度,而 33、32、31 转化成 10 进制依次为:51、50、49,查询 ASCII 表:
所以,0xa000000003332313 即表示 123,再看 string6,同理,61,62,63 分别表示 a、b、c,其他的自行推证;
总结:
- 18个进制位按照倒序方式,每两个 16 进制位表示一个字符串所对应的 ASCII 字符;
继续看代码:
NSString *string7 = [NSString stringWithFormat:@"%@",@"1234567"];
NSString *string8 = [NSString stringWithFormat:@"%@",@"12345678"];
NSString *string9 = [NSString stringWithFormat:@"%@",@"abcdefghi"];
NSString *string10 = [NSString stringWithFormat:@"%@",@"1234567890"];
打印结果:
2021-02-25 11:39:23.384 XKStringTest[59049:15960223] string7:0xa373635343332317
2021-02-25 11:39:23.388 XKStringTest[59049:15960223] string8:0xa007a87dcaecc2a8
2021-02-25 11:39:23.389 XKStringTest[59049:15960223] string9:0xa0880e28045a5419
2021-02-25 11:39:23.390 XKStringTest[59049:15960223] string10:0x60000002bee0
从上可以看到,当字符串长度为 10 时,内存地址发生了显著变化,而这个明显就是堆内存地址,可以打印内存地址验证:
NSString *constString = @"123";
NSLog(@"常量区地址:%p",constString);
NSLog(@"栈地址:%p",&string10);
NSLog(@"堆地址:%p",string10);
NSLog(@"Tagged Pointer:%p",string9);
输出结果:
2021-02-25 11:42:11.609 XKStringTest[59110:15962307] 常量区地址:0x1009db160
2021-02-25 11:42:11.610 XKStringTest[59110:15962307] 栈地址:0x7ffeef226340
2021-02-25 11:42:11.611 XKStringTest[59110:15962307] 堆地址:0x60800002d1c0
2021-02-25 11:42:11.611 XKStringTest[59110:15962307] Tagged Pointer:0xa0880e28045a5419
总结:
- Tagger Pointer 最多表示长度为 9 的字符串;
三、堆内存
根据上面的示例,已经可以下结论:
- 使用 init 方法生成的字符串,如果大于 9 位,则以堆内存的形式存储;
可能 NSString 的各种方法有潜规则,有可能有不使用 Tagged Pointer 的方法,此时即使是长度小于 9 的字符串,也可能是存在堆内存中,这里就不去深究了,遇到了再具体看就行。
还需要提一嘴的是:
NSString 对象在堆内存中不是从内存地址的一开始就是表示字符串的,比如 string10(@"1234567890") 查看堆内存的表现是:
这也很好理解,应为 NSString 为 NSObject,还有一些其他的属性需要表示,根据一些重排规则(比如struct 内存对齐、比如 Apple 的内存重排优化)排在前面也不可厚非;
四、总结
总结:
- iOS 中的字符串以常量、Tagged Pointer、堆内存的三种形式存在;
- Tagged Pointer 最多表示 9 个字符串;