『ios』TaggedPointer技术的思考

下面这两个循环如果运行会发生什么情况?
为什么会发生这种情况?
怎么去优化?

@interface ViewController ()
@property (strong, nonatomic) NSString *name;
@end
@implementation ViewController

- (void)viewDidLoad {
    [super viewDidLoad];
    
    dispatch_queue_t queue = dispatch_get_global_queue(0, 0);

    for (int i = 0; i < 1000; i++) {
        dispatch_async(queue, ^{
            self.name = [NSString stringWithFormat:@"abcdefghijk"];
        });
    }
    
//    dispatch_queue_t queue = dispatch_get_global_queue(0, 0);

    for (int i = 0; i < 1000; i++) {
        dispatch_async(queue, ^{
            self.name = [NSString stringWithFormat:@"abc"];
        });
    }
}
@end

**
其实这里面涉及苹果对数据存储的优化。用到了一种技术叫TaggedPointer技术。
那什么是TaggedPointer呢?
自2013年苹果推出iphone5s之后,iOS的寻址空间扩大到了64位。我们可以用63位来表示一个数字(一位做符号位)。那么这个数字的范围是2^63 ,很明显我们一般不会用到这么大的数字,那么在我们定义一个数字时NSNumber *num = @100,实际上内存中浪费了很多的内存空间。

当然苹果肯定也认识到了这个问题,于是就引入了tagged pointer,tagged pointer是一种特殊的“指针”,其特殊在于,其实它存储的并不是地址,而是真实的数据和一些附加的信息。
Tagged Pointer专门用来存储小的对象,例如NSNumber, NSDate, NSString。
Tagged Pointer指针的值不再是地址了,而是真正的值。所以,实际上它不再是一个对象了,它只是一个披着对象皮的普通变量而已。所以,它的内存并不存储在堆中,也不需要malloc和free。
在内存读取上有着3倍的效率,创建时比以前快106倍。
**
来看下面这种情况


int a = 10;
int b;

int main(int argc, char * argv[]) {
    @autoreleasepool {
        static int c = 20;
        static int d;
        int e;
        int f = 20;
        NSNumber * nsnumb = @1;
        NSNumber * nsnumb1 = @1734676342323322233;
        NSNumber *nsnumb2 = [NSNumber numberWithInt:2];
        NSNumber *nsnumb3 = [NSNumber numberWithInt:3];
        
        NSString *str = @"123";
        
        NSString *str1 = @"abdadffaddfaadfsadfsfadsfadsfaafd";
        
        NSString *str2 = [NSString stringWithFormat:@"uywewufaddfasadf"];
        
        NSObject *obj = [[NSObject alloc] init];
NSLog(@"\n&a=%p\n&b=%p\n&c=%p\n&d=%p\n&e=%p\n&f=%p\nstr=%p\nstr1=%p\nstr2=%p\nobj=%p\nnumb=%p\nnumb1=%p\nnumb2=%p\nnumb3=%p\n",
              &a, &b, &c, &d, &e, &f, str, str1,str2 ,obj,nsnumb,nsnumb1,nsnumb2,nsnumb3);
        
        return UIApplicationMain(argc, argv, nil, NSStringFromClass([AppDelegate class]));
    }
}

我们可以把地址信息打印出来

&a=0x104fc8d90
&b=0x104fc8e5c
&c=0x104fc8d94
&d=0x104fc8e58
&e=0x16ae3dbac
&f=0x16ae3dba8
str=0x104fc4008
str1=0x104fc4028
str2=0x6000005b0810
obj=0x6000009e4190
numb=0xad1a9945f49ac1fc
numb1=0x600000bffa80
numb2=0xad1a9945f49ac07c
numb3=0xad1a9945f49ac0fc

要区分这些地址,我们首先可以看一下下面的这张图


image.png
数据段
字符串常量:比如NSString *str = @"123"
已初始化数据:已初始化的全局变量、静态变量等
未初始化数据:未初始化的全局变量、静态变量等
int a = 10;
int b;
static int c = 20;
        static int d;
 NSString *str = @"123";
 NSString *str1 = @"abdadffaddfaadfsadfsfadsfadsfaafd";
栈:函数调用开销,比如局部变量。分配的内存空间地址越来越小
 int e;
 int f = 20;
NSNumber *nsnumb2 = [NSNumber numberWithInt:2];
        NSNumber *nsnumb3 = [NSNumber numberWithInt:3];
堆:通过alloc、malloc、calloc等动态分配的空间,分配的内存空间地址越来越大
  NSNumber * nsnumb1 = @1734676342323322233;
   
NSObject *obj = [[NSObject alloc] init];
image.png

我们可以去objc源码中去查看TaggedPointer相应的源码

static inline bool 
_objc_isTaggedPointer(const void * _Nullable ptr) 
{
    return ((uintptr_t)ptr & _OBJC_TAG_MASK) == _OBJC_TAG_MASK;
}

#if TARGET_OS_OSX && __x86_64__
    // 64-bit Mac - tag bit is LSB
#   define OBJC_MSB_TAGGED_POINTERS 0
#else
    // Everything else - tag bit is MSB
#   define OBJC_MSB_TAGGED_POINTERS 1
#endif

#if OBJC_MSB_TAGGED_POINTERS
#   define _OBJC_TAG_MASK (1UL<<63)
#   define _OBJC_TAG_INDEX_SHIFT 60
#   define _OBJC_TAG_SLOT_SHIFT 60
#   define _OBJC_TAG_PAYLOAD_LSHIFT 4
#   define _OBJC_TAG_PAYLOAD_RSHIFT 4
#   define _OBJC_TAG_EXT_MASK (0xfUL<<60)
#   define _OBJC_TAG_EXT_INDEX_SHIFT 52
#   define _OBJC_TAG_EXT_SLOT_SHIFT 52
#   define _OBJC_TAG_EXT_PAYLOAD_LSHIFT 12
#   define _OBJC_TAG_EXT_PAYLOAD_RSHIFT 12
#else
#   define _OBJC_TAG_MASK 1UL
#   define _OBJC_TAG_INDEX_SHIFT 1
#   define _OBJC_TAG_SLOT_SHIFT 0
#   define _OBJC_TAG_PAYLOAD_LSHIFT 0
#   define _OBJC_TAG_PAYLOAD_RSHIFT 4
#   define _OBJC_TAG_EXT_MASK 0xfUL
#   define _OBJC_TAG_EXT_INDEX_SHIFT 4
#   define _OBJC_TAG_EXT_SLOT_SHIFT 4
#   define _OBJC_TAG_EXT_PAYLOAD_LSHIFT 0
#   define _OBJC_TAG_EXT_PAYLOAD_RSHIFT 12
#endif

我们看到用到了位运算来判断是否是TaggedPointer。
我们都知道一个对象地址为64位二进制,它表明如果64位数据中,最高位是1的话,则表明当前是一个tagged pointer类型。
那么我们在看下上面打印出的地址,所有NSTaggedPointerString地址都是0xa开头,d转换为二进制1010,根据上面的结论,我们看到首位为1表示为NSTaggedPointerString类型。在这里得到验证。
注意:TaggedPointer类型在iOS和MacOS中标志位是不同的iOS为最高位而MacOS为最低位

p/t 6
(int) $0 = 0b00000000000000000000000000000110
p/t a
(int) $8 = 0b00000000000000000000000000001010

再回到最顶上的问题。我们分别打印两个name的地址

0xaad4ac6062a695e9    name = "123"
0x600003d404a0            name = "abcdefghijk"

通过地址我们可以发现,name = "123"采取的是TaggedPointer技术,name = "abcdefghijk"没有采用,他直接是一个对象。
通过上面的分析,我们来分析一下第一个段。

dispatch_queue_t queue = dispatch_get_global_queue(0, 0);

    for (int i = 0; i < 1000; i++) {
        dispatch_async(queue, ^{
            self.name = [NSString stringWithFormat:@"abcdefghijk"];
        });
    }
self.name是直接出发了set方法。那么set方法内部实际是怎么实现的呢?
- (void)setName:(NSString *)name
{
    if (_name != name) {
        [_name release];
        _name = [name retain];
    }
}
所以当多条线程同时访问set方法,就会出现野指针问题,上一个条线程release了name,另一条线程直接又访问了name。所以会崩溃。
如何解决这个问题呢?
我们可以把nonatomic改为atomic,可以保证set方法内部是加锁的。也可以在线程中给name赋值的地方加锁。

第二段

    dispatch_queue_t queue = dispatch_get_global_queue(0, 0);
    for (int i = 0; i < 1000; i++) {
        dispatch_async(queue, ^{
            self.name = [NSString stringWithFormat:@"abc"];
        });
    }
   因为self.name是值类型,并不是对象,所以不会出现name需要release的问题。所以不会崩溃

上面的就是TaggedPointer技术的一些思考和验证。
希望自己以后看到,还能补充更多东西。

你可能感兴趣的:(『ios』TaggedPointer技术的思考)