今天小伙伴问了一个问题,这两个变量地址是否相同?
NSString *a = @"a";
NSString *b = @"a";
输出如下:
(__NSCFConstantString *) $1 = 0x0000000109fdf9f8 @"a"
(__NSCFConstantString *) $2 = 0x0000000109fdf9f8 @"a"
可以看到这两个对象是常量,所以是存储在常量区,并且地址是一样的。接下来尝试其他创建方式:
NSString *c = [NSString stringWithString:a];
NSString *d = [NSString stringWithFormat:a];
NSString *e = [[NSString alloc] initWithFormat:a];
NSString *f = [NSString stringWithFormat:@"asdfhaksfhjkashkhfakskhf"];
NSString *g = [NSString stringWithFormat:@"asdfhaksfhjkashkhfakskhf"];
输出如下:
(__NSCFConstantString *) $0 = 0x000000010581b9f8 @"a"
(NSTaggedPointerString *) $1 = 0xa000000000000611 @"a"
(NSTaggedPointerString *) $2 = 0xa000000000000611 @"a"
(__NSCFString *) $3 = 0x0000604000249ab0 @"asdfhaksfhjkashkhfakskhf"
(__NSCFString *) $4 = 0x0000604000249ab0 @"asdfhaksfhjkashkhfakskhf"
可以看到创建方式不同地址也是不同的,initWithString和@“”创建的字符串是一样的都是常量,而initWithFormat和stringWthFormat创建的字符串为NSTaggedPointerString形式,也就是所谓的Tagged Pointer对象,在字符串特别长时生成的是__NSCFString对象,
查阅资料之后得知NSNumber的存储也有Tagged Pointer。
苹果创建Tagged Pointer的背景如下:
在2013年9月,苹果推出了iPhone5s,与此同时,iPhone5s配备了首 个采用64位架构的A7双核处理器,为了节省内存和提高执行效率,苹果提出了Tagged Pointer的概念。先看看原有的对象为什么会浪费内存。假设要存储一个NSNumber对象,其值是一个整数。正常情况下,如果这个整数只是一个NSInteger的普通变量,那么它所占用的内存是与CPU的位数有关,在32位CPU下占4个字节,在64位CPU下是占8个字节的。而指针类型的大小通常也是与CPU位数相关,一个指针所占用的内存在32位CPU下为4个字节,在64位CPU下也是8个字节。所以一个普通的iOS程序,如果没有Tagged Pointer对象,从32位机器迁移到64位机器中后,虽然逻辑没有任何变化,但这种NSNumber、NSDate一类的对象所占用的内存会翻倍。
为了存储和访问一个NSNumber对象,我们需要在堆上为其分配内存,另外还要维护它的引用计数,管理它的生命期。这些都给程序增加了额外的逻辑,造成运行效率上的损失。
为了改进上面提到的内存占用和效率问题,苹果提出了Tagged Pointer对象。由于NSNumber、NSDate一类的变量本身的值需要占用的内存大小常常不需要8个字节,拿整数来说,4个字节所能表示的有符号整数就可以达到20多亿。所以我们可以将一个对象的指针拆成两部分,一部分直接保存数据,另一部分作为特殊标记,表示这是一个特别的指针,不指向任何一个地址。
于是,简单来讲可以理解为把指针指向的内容直接放在了指针变量的内存地址中,因为在 64 位环境下指针变量的大小达到了 8 位足以容纳一些长度较小的内容。于是使用了标签指针这种方式来优化数据的存储方式。从引用计数可以看出,这个是一个释放不掉的单例常量对象。在运行时根据实际情况创建。
Tagged Pointer 示例
首先先看NSNumber数值对象
muStr2 = [NSMutableString stringWithString:@"1"];
for(int i=0; i<20; i+=1){
NSNumber *number = @([muStr2 longLongValue]);
NSLog(@"%@, %p", [number class], number);
[muStr2 appendString:@"1"];
}
// 输出结果
__NSCFNumber, 0xb000000000000013
__NSCFNumber, 0xb0000000000000b3
__NSCFNumber, 0xb0000000000006f3
__NSCFNumber, 0xb000000000004573
__NSCFNumber, 0xb00000000002b673
__NSCFNumber, 0xb0000000001b2073
__NSCFNumber, 0xb0000000010f4473
__NSCFNumber, 0xb00000000a98ac73
__NSCFNumber, 0xb000000069f6bc73
__NSCFNumber, 0xb000000423a35c73
__NSCFNumber, 0xb000002964619c73
__NSCFNumber, 0xb000019debd01c73
__NSCFNumber, 0xb000102b36211c73
__NSCFNumber, 0xb000a1b01d4b1c73
__NSCFNumber, 0xb00650e124ef1c73
__NSCFNumber, 0xb03f28cb71571c73
__NSCFNumber, 0xb27797f26d671c73
__NSCFNumber, 0x60000003d540
__NSCFNumber, 0x61000003cb40
__NSCFNumber, 0x61800003c760
数值是1、11、111、1111…..这样递增,可以从输出指针的地址看出最低4位一直为3,这个用于标记是long(float则为4,Int为2,double为5),而最高4位的“b”表示是NSNumber类型;其余56位则用来存储数值本身内容。当存储用的数值超过56位存储上限的时候,那么NSNumber才会用真正的64位内存地址存储数值,然后用指针指向该内存地址。(如果数值长度超过64位,那么就crash)。
以上的NSString类型也是和NSNumber一个道理,最低位表示字符串的长度,而其余的56位也是用来存储数组,这里需要注意的是,当字符串内存长度超过了56位的时候,Tagged Pointer并没有立即用指针转向,而是用了一种算法编码,把字符串长度进行压缩存储,当这个算法压缩的数据长度超过56位了才使用指针指向。
特点
我们也可以在WWDC2013的《Session 404 Advanced in Objective-C》视频中,看到苹果对于Tagged Pointer特点的介绍:
1.Tagged Pointer专门用来存储小的对象,例如NSNumber和NSDate,
2.Tagged Pointer指针的值不再是地址了,而是真正的值。所以,实际上它不再是一个对象了,它只是一个披着对象皮的普通变量而已。所以,它的内存并不存储在堆中,也不需要malloc和free。
3.在内存读取上有着3倍的效率,创建时比以前快106倍。
由此可见,苹果引入Tagged Pointer,不但减少了64位机器下程序的内存占用,还提高了运行效率。完美地解决了小内存对象在存储和访问效率上的问题。
因为Tagged Pointed不是一个真正的对象,所以其没有isa。不过只要避免在代码中直接访问对象的isa变量,就没问题。具体如Tagged Pointer 怎么访问类方法列表,之后再详细看下,也许是根据最够为的类型标记,然后调用对应的class方法列表。
总结
@“” 和 initWithString:方法生成的字符串分配在常量区,系统自动管理内存;
initWithFormat:和 stringWithFormat: 方法生成的字符串分配在堆区;
当数据内容超出Tagged Pointed能存储的内容时,就会像正常的创建对象一样创建指针和数据内容。
参考
iOS Tagged Pointer
i深入理解Tagged Pointer