Block源码解析和深入理解

Block源码解析和深入理解

Block的本质

Block是"带有自动变量值的匿名函数".

我们通过Clang(LLVM编译器)来将OC的代码转换成C++源码的形式,通过如下命令:

clang -rewrite-objc 源代码文件名

下面,我们要转换的Block语法

int main(int argc, const char * argv[]) {
    void (^blk)(void) = ^{
        printf("Block\n");
    };
    blk();
    return 0;
}

该源代码通过Clang 可变换为以下形式:

/*
    __block_impl (block)结构体声明
*/
struct __block_impl {
  void *isa; // isa 指针,指向父类的实例。void * 相当于 id 是个实例。
  int Flags; // 
  int Reserved;
  void *FuncPtr; //函数指针 指向block代码块的实现函数
};
/*
    __main_block_impl_0 匿名的block 结构体声明和实现
*/
struct __main_block_impl_0 {
  struct __block_impl impl;//block 的结构体实例
  struct __main_block_desc_0* Desc; //block des的指针 指向block的详情
  /*
    __main_block_impl_0 结构体构造函数实现
  */
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
    impl.isa = &_NSConcreteStackBlock; // 初始化 block 实例属性 isa ,表示该block 是 _NSConcreteStackBlock (栈)类型的代码块
    impl.Flags = flags;
    impl.FuncPtr = fp;// block 具体的函数实现指针
    Desc = desc;//desc 指针
  }
};
/*
     匿名block 具体的函数实现
*/
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {

        printf("Block\n");
    }
/*
    匿名block desc 指针的具体函数实现,对block(__main_block_impl_0) 结构体实例的大小进行初始化
*/
static struct __main_block_desc_0 {
  size_t reserved; // 升级所需区域
  size_t Block_size;//block 实际内存大小
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};

/*
    把多余的转换去掉,看起来就比较清楚了:
    第一部分:block的初始化
    __main_block_func_0: 参数一 是block语法转换的C语言函数指针。
    __main_block_desc_0_DATA: 参数二 作为静态全局变量初始化的 __main_block_desc_0 结构体实例指针
    struct __main_block_impl_0 tmp = __main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA);
    struct __main_block_impl_0 *blk = &tmp;
    第二部分:
    block的执行: blk()
    去掉转化部分:
       (*blk -> imp.FuncPtr)(blk);
    这就是简单地使用函数指针调用函数。由Block语法转换的 __main_block_func_0 函数的指针被赋值成员变量FuncPtr中,另外 __main_block_func_0的函数的参数 __cself 指向Block的值,通过源码可以看出 Block 正式作为参数进行传递的。
*/
int main(int argc, const char * argv[]) {
    void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
    ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);
    return 0;
}

针对源码的解释 大部分在代码中都注释了。需要特别指出的是:

static void __main_block_func_0(struct __main_block_impl_0 *__cself) 

中的参数 __cself 是指向 __main_block_impl_0 的指针,及匿名block 自身。
扩展:该句源码类似如 OC 中的方法消息传递,OC中每个方法都默认带两个参数 一个是指向自身的实例self 一个是该方法的SEL 对象。
例如:

    - (void) method: (int)argc{
        NLog(@"%p %d \n",self,arg)
    }

Objective - C 编译器同C++的方法一样,也将该方法作为C语言的函数来处理.源码如下:

/*
    方法中 在转换成源码后 自动的添加了self, _cmd两个参数 
*/
    void _I_MyObjct_method_(struct Myobject *self,SEL _cmd, int arg){
        NSLog (@"%p %d \n",self,arg);
    }

截获自动变量值(局部变量)

struct __main_block_impl_0 {
  struct __block_impl impl;
  struct __main_block_desc_0* Desc;
  int val; //局部变量跟block外的类型一直
  const char *fmt; //跟block外的类型一致
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _dmy, int _val, const char *_fmt, int flags=0) : dmy(_dmy), val(_val), fmt(_fmt) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
  int val = __cself->val; // bound by copy //block 调用外部的局部变量 实际上 相当于Copy 了一份 所以不会影响 局部变量的值 也不能修改值 
  const char *fmt = __cself->fmt; // bound by copy

        printf("Block\n .. ,%d %s",dmy,val,fmt);
    }

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
int main(int argc, const char * argv[]) {
    int dmy = 256; //局部变量 
    int val = 10; // 局部变量
    const char *fmt = "val = %d \n"; //局部变量
    void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, val, fmt));
    ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);
    return 0;
}

源码解析:block 在调用 外部局部变量的时候 其实是将外部局部变量 copy了一份 使用的 所以在没有任何修饰符的时候是不可以修改外部局部变量的。

__block 说明符

之前的分析中,block 无法改变被截获的自动变量的值。这样极为不便:
解决这个问题有两种方法,
第一种:C 语言中有一个变量,允许block改成值。具体如下:

  • 静态变量
  • 静态全局变量
  • 全局变量

虽然Block语法的匿名函数部分简单的转换为了C语言函数,但从这个C语言函数中访问静态全局,全局变量并没有任何改变,可直接使用。
但静态变量的情况,转换后的函数原本就设置在含有Block语法的函数外,所以无法从变量作用域访问。
看看这段代码的源码:

     int global_val = 1;
     
     static int static_global_val = 2;
     
     int main(int argc, const char * argv[]) {
 
    static int static_val = 3;
    
    void (^blk)(void) = ^{
    
        global_val += 1;
        
        static_global_val += 2;
        
        static_val += 3;
        
        
    };
    
    blk();
    
    return 0;
    
    }

该源代码中使用了Block 改写静态变量 静态全局变量 全局变量。该源代码转换后如下:

int global_val = 1; //全局变量
 static int static_global_val = 2; //静态全局变量
            
 struct __main_block_impl_0 {
          struct __block_impl impl;
          struct __main_block_desc_0* Desc;
          int *static_val;//局部静态变量   --->  可以看出 跟局部变量不同 这边是接受的指针
          __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int *_static_val, int flags=0) : static_val(_static_val) {
            impl.isa = &_NSConcreteStackBlock;
            impl.Flags = flags;
            impl.FuncPtr = fp;
            Desc = desc;
          }
        };
        static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
          int *static_val = __cself->static_val; // bound by copy // 改代码跟局部变量 相似,实际上改变的是一个 复制后的指针.但该指针最终指向的 还是最初的变量值。
        
                global_val += 1;
                static_global_val += 2;
                (*static_val) += 3;
        
            }
        
        static struct __main_block_desc_0 {
          size_t reserved;
          size_t Block_size;
        } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
        int main(int argc, const char * argv[]) {
            static int static_val = 3;
            void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, &static_val));
            ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);
            return 0;
        }
        

分析该源码:发现无论是全局 还是 静态全局 都可以在Block中直接访问 修改变量值。

然而,静态局部变量,貌似也可以正常访问,其调用原理,跟之前的局部变量的调用相似,唯一的不同是,在Block中调用的是 指向该变量的指针,并且是赋值了一份指针(但还是最终指向原来的变量)。所以我们可以在Block中改变原理变量的值。
这样就有个疑问,我们为什么不使用静态局部变量,来使用去自动变量(局部变量)的访问呢?
原因:在该静态局部变量,有变量作用域,当block超出了该作用域,执行的时候,其内部调用的静态局部变量会被废弃,我们就无法调用到。因此Block中超出变量作用域而存在的变量同静态变量一样,将不能通过指针访问原来的自动变量。

解决Block 中不能保存值这一问题的第二个方法是使用__block

int main(int argc, const char * argv[]) {
    __block int val = 3;
    void (^blk)(void) = ^{
        val = 1;
    };
    blk();
    return 0;
}

将上面代码用 clang 转化后如下:

/*
    __block 转化成了结构体 
*/
struct __Block_byref_val_0 {
  void *__isa;
__Block_byref_val_0 *__forwarding; //相当于一个指向源变量的指针
 int __flags;
 int __size;
 int val; //相当于源变量
};

struct __main_block_impl_0 {
  struct __block_impl impl;
  struct __main_block_desc_0* Desc;
  __Block_byref_val_0 *val; // by ref //持有源变量的结构体实例
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_val_0 *_val, int flags=0) : val(_val->__forwarding) {
    impl.isa = &_NSConcreteStackBlock; // block 为栈类型
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
  __Block_byref_val_0 *val = __cself->val; // bound by ref ;类似于 静态局部变量 都是copy 一份指向源变量的结构体指针。

        (val->__forwarding->val) = 1;//通过访问 __block 结构体 成员变量 __forwarding 来访问源变量
    }
static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {_Block_object_assign((void*)&dst->val, (void*)src->val, 8/*BLOCK_FIELD_IS_BYREF*/);}

static void __main_block_dispose_0(struct __main_block_impl_0*src) {_Block_object_dispose((void*)src->val, 8/*BLOCK_FIELD_IS_BYREF*/);}

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
  void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*);
  void (*dispose)(struct __main_block_impl_0*);
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0};
int main(int argc, const char * argv[]) {
    __attribute__((__blocks__(byref))) __Block_byref_val_0 val = {(void*)0,(__Block_byref_val_0 *)&val, 0, sizeof(__Block_byref_val_0), 3};
    void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_val_0 *)&val, 570425344));
    ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);
    return 0;
}

源码解析:__Block_byref_val_0 结构体实例的成员变量__forwarding持有指向该实例自身的指针。通过成员变量__forwarding访问成员变量val。(成员变量val是该实例自身持有的变量,它相当于原自动变量)
如图所示:

Block源码解析和深入理解_第1张图片

Block存储域
Block 是Objective-C对象。上面我们所创建的block类 都为_NSConcreteStackBlock.
由上面我们提到的源码可以知道:

    impl.isa = &_NSConcreteStackBlock

根据 block 结构体实例的 isa 指针进行分类:

  • _NSConcreteStackBlock //不难看出 其存储域在栈上
  • _NSConcreteGlobalBlock // 其存储域 在全局
  • _NSConcreteMallocBlock // 其存储域 在堆上
    详细分类如图所示:

_NSConcreteGlobalBlock: 存在的情况:

  • 记述全局变量的地方有Block语法时
  • Block语法的表达式中不使用应截获的自动变量时

以上情况Block 为 全局类对象。除此之外Block语法生成的Block为栈类对象,
例如(一):

/*
    在下面的block中由于for循环的值 一直在变 所以Block截获的局部变量一直在变。
*/
    typedef int (^blk_t)(int);
    for (int rate = 0;rate < 10; ++rate){
        blk_t blk = ^(int count){
            return rate * count;
        }
    }

转化为源码如下:

struct __main_block_impl_0 {
  struct __block_impl impl;
  struct __main_block_desc_0* Desc;
  int rate;
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _rate, int flags=0) : rate(_rate) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};

由此可见 虽然block 声明在全局中,但由于block初始化的时候调用了局部变量,所以该block创建成栈类型的。
_NSConcreteMallocBlock :存在的情况
在分析之前我们看下之前遗留的问题:

  • Block 超出变量作用域可存在的原因
  • __block变量用结构体成员变量__forwarding存在的原因

配置在全局变量上的Block,从变量作用域外也可以通过指针安全的使用。但设置在栈上的Blcok,如果其变量作用域结束,该Block就被废弃,同样的__block也配置在栈上,所以其所属的变量作用域结束,则该__block变量也会被废弃。
Block提供了将Block和__block变量从栈上复制到堆上的方法来解决这个问题



而__block 变量用结构体成员变量__forwarding可以实现无论__block变量配置在栈上还是堆上都能够正确的访问__block变量。

深入理解blocks提供的复制方法究竟是啥?

实际上当ARC有效时,编译器会进行判断自动的将block从栈上复制到堆上
如:

    typedef int (^blk_t)(int);
        blk_t func (int count){
            return ^(int count){
                return rate *count;
            };
        }

源码转换为:

    blk_t func (int rate)
    {
        blk_t tmp = &__func_block_impl_0(
            _func_block_func_0,&_func_block_desc_0_DATA,rate
        );
        tmp = objc_retainBlock(tmp);
        return objc_autoreleaseReturnValue(tmp);
    }

分析源码:从源码来看 在ARC状态下 block复制到堆上 实际上其引用计数增加了。

__block变量的存储域

当block从栈中 复制到堆上时,由于block持有__block变量,所以其__blcok变量也会从栈中复制到堆上,所以当block超出作用域调用__block变量也可以成功。这是和静态局部变量最大的区别。而静态局部变量,在block从栈中复制到堆上时,由于block不持有变量,所以静态局部变量不 会复制到堆上,其作用域没变。故出作用域调用会崩溃。
如图所示:



截获对象

下面我们将id对象类型的局部变量 在block中调用。id类型的对象 默认修饰符 都是__strong类型的。

typedef void (^blk_t)(id);
blk_t blk;
int main(int argc, const char * argv[]) {
    {
        id array = [[NSMutableArray alloc]init]; // __strong 类型修改的局部变量
        blk = [^(id objc){
            [array addObject:objc];
            NSLog(@"array count = %ld",[array count]);
        } copy];
    }
    blk(@"ww");
    return 0;
}

分析 :按理来说 array 对象出了大括号作用域,强引用失效 其对象就会废弃。但改代码运行正常。那么就意味着,array对象出大括号作用域时,没有被废弃 ,仍能正常访问。那么是什么原因呢,我们看下Clang之后的源码.

typedef void (*blk_t)(id);
blk_t blk;

struct __main_block_impl_0 {
  struct __block_impl impl;
  struct __main_block_desc_0* Desc;
  id array;
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, id _array, int flags=0) : array(_array) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __main_block_func_0(struct __main_block_impl_0 *__cself, id objc) {
  id array = __cself->array; // bound by copy //复制一份指针 赋值

            ((void (*)(id, SEL, ObjectType))(void *)objc_msgSend)((id)array, sel_registerName("addObject:"), (id)objc);
            NSLog((NSString *)&__NSConstantStringImpl__var_folders_0b_9hq6xqxs5gjcxx5j_skhh8n00000gn_T_main_1808b3_mi_0,((NSUInteger (*)(id, SEL))(void *)objc_msgSend)((id)array, sel_registerName("count")));
        }
        /*
                关键方法:该方法 相当于ARC 中的 retain方法,将对象的引用计数加一。但该方法除引用计数加一外,还有一个操作就是将block 从栈上复制到堆上,从而可以出作用域,调用id __strong修饰类型的对象。
        */
static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {_Block_object_assign((void*)&dst->array, (void*)src->array, 3/*BLOCK_FIELD_IS_OBJECT*/);}
/*
        dispose 相当于ARC 模式下的 release 将对象的引用计数减一。引用计数减一得同时,将堆上的block 废弃掉。
*/
static void __main_block_dispose_0(struct __main_block_impl_0*src) {_Block_object_dispose((void*)src->array, 3/*BLOCK_FIELD_IS_OBJECT*/);}

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
  void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*);
  void (*dispose)(struct __main_block_impl_0*);
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0};
int main(int argc, const char * argv[]) {
    {
        id array = ((NSMutableArray *(*)(id, SEL))(void *)objc_msgSend)((id)((NSMutableArray *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("NSMutableArray"), sel_registerName("alloc")), sel_registerName("init"));
        blk = (blk_t)((id (*)(id, SEL))(void *)objc_msgSend)((id)((void (*)(id))&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, array, 570425344)), sel_registerName("copy"));///必须调用block 的copy 方法才能正常运行
    }
    ((void (*)(__block_impl *, id))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk, (NSString *)&__NSConstantStringImpl__var_folders_0b_9hq6xqxs5gjcxx5j_skhh8n00000gn_T_main_1808b3_mi_1);
    return 0;
}

//从上面的源码可以发现:前提:当block调用copy方法,从栈中复制到对象,当Block调用的局部变量是个id对象的时候,该对象在block中自动的引用计数加一,并且该block持有该对象,也就是说,对象出了作用域也能被调用,知道block 从堆上废弃掉为止。如果block 的最后没有调用copy,那么该对象值,也会随着作用域的结束而被废弃。
总结:

什么时候栈上的Block会复制到堆上呢?

  • 调用Block的copy实例方法时。
  • Block作为函数返回值返回时。
  • 将Block赋值给附有__strong修饰符id类型的类或者Block类型成员变量时。
  • 在方法名中含有usingBlock的cocoa框架方法或者GCD的API中传递Block时。

对象和__block的区别?

  • 如果调用对象的Block,没有调用Copy 或者不在栈上,那么该对象出作用域就会被释放。
  • 如果调用对象的Block,调用了Copy,或者Block在堆上,那么该对象的作用域跟使用__block修饰的变量的作用域一直,都会被Block所持有,并且生命周期,会随着Block的废除,而释放。

因此当Block中使用对象类型的自动变量时,除以下情形外,推荐调用Block的copy实例方法!!

  • block作为函数返回值返回时。
  • Block赋值给类的附加__strong修饰符的id类型或者Block类型的成员变量时。
  • 向方法名中含有usingBlock的Cocoa框架方法或者GCD的API中传递Block时。

__block变量和对象

从前面我们看到__block可以修饰任意类型:

  • 当然包括id对象__strong类型了,其原理是相同的:
    当 block 从栈上复制到 堆上时,__block 所修饰的自动变量也会从栈上复制到堆上,使用_Block_objct_assign函数,持有赋值给__block变量的对象。当 block 废弃时,__block所修饰的自动变量,也会通过函数_Block_objct_dispose ,释放掉__block变量的对象。
  • 当__weak修饰符修饰时,由于__weak修饰的自动变量出作用域后会废弃 自动置nil,所以当block调用的时候,其实是调用的nil对象所以不会崩溃,但取不到值。
  • 当__block __weak 同时修饰自动变量时,还是因为__weak(不持有对象)的原因,当 block 从栈上复制到堆上时,__block变量复制到堆上的是一个nil值,所以对该变量进行的操作都是无效的。
  • 当__block 和 __unsafe__unretained 同时修饰变量时,跟__weak不同,当__unsafe__unretained,所修饰的对象边nil 时 该变量不会自动置nil,而是变成野指针,所以当block 从栈上复制到堆上时,实际上__block变量是一个野指针,所以当调用的时候回出错,导致程序崩溃
  • __block 和 __autoreleasing 修饰跟 上面的__unsafe__unretained是一样的。

Block 循环引用

存在循环引用的情况:当block对象 作为类的 属性或者成员变量,并且在block初始化的时候,调用了self或者self相关类的成员变量。都会引起引用循环。

解决方法:

  • 使用__weak 修饰要截取的自动变量,
  • 当在MRC 中时,可以使用__unsafe_unretained(弊端 不会自动置nil 容易出现野指针) 修饰。
  • 可以使用__block 修饰,前提是 必须 执行block代码块,而且可以适当地在代码块中 手动的把__block变量置nil
    以下是相关解决方法的实例:
    实例一:
    typedef void (^blk_t)(void);
    @interface Myobject : NSObject
    {
        blk_t blk_; //成员变量
        id _objc;//成员变量
    }
    @end
    @implementation MyObject
    - (id)init
    {
        self = [super init];
        /*
            分析改代码会出现两种情况的引用循环:
             * 一种是:成员变量block 调用 self,self中持有block ,block中也持有self,导致引用循环,解决方法在之前 加入
             __weak typeof(self) weakSelf = self;
             * 第二中,虽然成员变量block没有直接调用self ,但其调用了成员变量_objc,所以也会造成引用循环:
             解决方法: __weak id weakObjc = _objc;
        */
        blk_ = ^{
            NSLog(@"self = %@, objc = %@",self,_objc);
        }   
        return self;
    }

实例二:

    typedef void (^blk_t)(void);
    @interface Myobject : NSObject
    {
        blk_t blk_; //成员变量
    }
    @end
    @implementation MyObject
    - (id)init
    {
        self = [super init];
        /*
            此处使用__block修饰变量,是的block 持有__block变量,而__block变量持有MyObject对象,而MyObject持有block对象。出现引用循环:
            然而 当 block执行的时候,__block变量废弃,从而消除引用循环
        */
    __block id temp = self;
        blk_ = ^{
            NSLog(@"self = %@,,self);
            temp = nil;
        }   
        return self;
    }
    - (void)execBlock
    {
        blk_()
     }
     int main (){
        id o = [[MyObject alloc] init];
        [o execBlock];//必须执行 否则导致引用循环
        return 0;    
     }
     

总结下__block 和 __weak 之间的优缺点:
使用__block变量的优点:

  • 通过__block 变量可控制对象的持有期间
  • 在不能使用__weak修饰符的环境中不使用__unsafe__unretain修饰符即可(不必担心野指针)
    在执行Block时可动态的决定是否将nil或者其他对象赋值在__block变量中。

使用__block变量的缺点如下:

  • 为避免循环引用必须执行Block

你可能感兴趣的:(Block源码解析和深入理解)