Runtime基础

* 对于C语言,函数的调用在编译的时候会决定调用哪个函数,调用未实现的函数就会报错。
* 对于OC的函数,属于动态调用过程,在编译的时候并不能决定真正调用哪个函数,即使调用的
函数并未实现,只要声明过就不会报错, 只有在真正运行的时候才会根据函数的名称找到对应的
函数来调用, 找不到函数实现就会报错。

Runtime是什么

Runtime 又叫运行时,基本是用C和汇编写的,方便我们在运行时的时候将消息重定向给新的对象、交换方法、动态添加方法、为系统类添加属性等等。多数情况我们只需要编写 OC 代码即可,但底层都是基于Runtime来实现的。
Runtime 自动在幕后搞定一切,比如: 如果我们调用方法,编译器会将 OC 代码转换成运行时代码,在运行时确定数据结构和函数

在main.m中 写OC代码

@interface Animal : NSObject
    
@end

@implementation Animal
    
- (void)eat
{
        
} 
@end

int main(int argc, char * argv[]) {
    @autoreleasepool {
        
        Animal *pig = [[Animal alloc] init];
        [pig eat];
    }
    return 0;
}

打开终端, 执行clang -rewrite-objc main.m
这段命令将main.m中的OC代码转化成c++代码并且存储在main.cpp文件
打开main.cpp, 竟然有9万多行代码, 先找到main函数如下:

int main(int argc, char * argv[]) {
    /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool; 

        Animal *pig = ((Animal *(*)(id, SEL))(void *)objc_msgSend)((id)((Animal *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("Animal"), sel_registerName("alloc")), sel_registerName("init"));
        ((void (*)(id, SEL))(void *)objc_msgSend)((id)pig, sel_registerName("eat"));
    }
    return 0;
}
从上面C++代码中可以看到创建对象、方法调用都被转换成
objc_msgSend(receiver, selector)

Objective-C 是一门动态语言,它会将一些工作放在代码运行时才处理而并非编译时。也就是说,有很多类和成员变量在我们编译的时是不知道的,而在运行时,我们所编写的代码会转换成完整的确定的代码运行, 通过消息机制决定函数调用方式。

运行时消息机制

OC的方法调用,其实每次都是一个运行时消息发送过程。
objc_msgSend(receiver, selector)
消息接收者recever寻找对应的selector,也分为两种情况:
1.接收者能找到对应的selector,直接执行接收receiver对象的selector方法。
2.接收者找不到对应的selector,消息被转发或者临时向接收者添加这个selector对应的实现内容,否则崩溃。

Runtime基本数据结构

1. id
objc_msgSend的第一个参数, 有个强转类型

typedef struct objc_object *id;

struct objc_object {
    Class _Nonnull isa  OBJC_ISA_AVAILABILITY;
};

id在OC中是表示一个任意类型,从这里可以看出:

  • id是一个指向objc_object结构体的指针。
  • objc_object结构体包含了Class isa成员,而isa就是我们常说的创建一个对象时,用来指向所属类的指针。因此根据isa就可以获取对应的类。
  • OC中的对象虽然没有明显的使用指针,但是在OC代码被编译转化为C之后,每个OC对象其实都是拥有一个isa的指针的。

2. Class
上文中, isa为Class类型, 而Class是一个指向objc_class结构体的指针

typedef struct objc_class *Class;

看下objc_class具体的定义

struct objc_class {
    Class _Nonnull isa  OBJC_ISA_AVAILABILITY;

#if !__OBJC2__
    Class _Nullable super_class                              OBJC2_UNAVAILABLE;
    const char * _Nonnull name                               OBJC2_UNAVAILABLE;
    long version                                             OBJC2_UNAVAILABLE;
    long info                                                OBJC2_UNAVAILABLE;
    long instance_size                                       OBJC2_UNAVAILABLE;
    struct objc_ivar_list * _Nullable ivars                  OBJC2_UNAVAILABLE;
    struct objc_method_list * _Nullable * _Nullable methodLists                    OBJC2_UNAVAILABLE;
    struct objc_cache * _Nonnull cache                       OBJC2_UNAVAILABLE;
    struct objc_protocol_list * _Nullable protocols          OBJC2_UNAVAILABLE;
#endif

} OBJC2_UNAVAILABLE;

isa

  • objc_class和objc_object同样是结构体,而且都拥有一个isa指针。
  • objc_object的isa指针指向对象的定义
  • objc_class中的isa指针指向的是元类

**注意** 在Runtime中Objc类本身同时也是一个对象。Runtime把类对象所属类型就叫做元类,用于描述类对象本身所具有的特征,最常见的类方法就被定义于此,所以objc_class中的isa指针指向的是元类,每个类仅有一个类对象,而每个类对象仅有一个与之相关的元类。

super_class

  • super_class指向objc_class类所继承的父类
  • 当前类已经是最顶层的类(如NSProxy),则super_class指针为NULL

ivars

  • 成员变量列表
  • 用于存放所有的成员变量和属性信息

methodLists

  • 用于存放对象的所有成员方法,属性的存取方法都存放在methodLists中

cache

  • 用于对调用方法的缓存
  • 它也是推断最近调用的方法极有可能被二次调用,并将其存入cache,在二次调用时先在cache查找方法,而不是直接在类的方法列表中查找

protocols

  • 协议列表

3. SEL
Objective-C在编译时,会依据每一个方法的名字、参数序列,生成一个唯一的整型标识(Int类型的地址),这个标识就是SEL。

SEL实际是指向objc_selector结构体的指针

typedef struct objc_selector *SEL;

SEL为方法选择器,用于表示运行时方法的名字,以便进行方法实现的查找。

**注意** 因为要对应方法实现,所以每一个方法对应的SEL都是唯一的。因此它不具备C++可以进行函数重载的特性,当两个方法名一样时,会发生编译错误,即使参数不一样。

4. Ivar
在objc_class中看到的ivars成员列表,其中的元素就是Ivar,
Ivar可以理解成instance variable,也就是实例变量

typedef struct ivar_t *Ivar;

struct objc_ivar {
    char * Nullable ivar_name                               OBJC2UNAVAILABLE;
    char * Nullable ivar_type                               OBJC2UNAVAILABLE;
    int ivar_offset                                          OBJC2_UNAVAILABLE;
#ifdef LP64
    int space                                                OBJC2_UNAVAILABLE;
#endif
} 

Ivar其实是指向ivar_t结构体的指针,它包含了实例变量名ivar_name、类型ivar_type、相对对象地址偏移ivar_offset等信息

5. Method
在objct_class定义中看到methodLists,其中的元素就是Method,表示某个方法的类型

typedef struct objc_method *Method;

struct objc_method {
    // 方法名类型SEL 
    SEL Nonnull method_name                                 OBJC2UNAVAILABLE;
    // 一个char指针,指向存储方法的参数类型和返回值类型
    char * Nullable method_types                            OBJC2UNAVAILABLE;
    // 本质上是一个指针,指向方法的实现
    IMP Nonnull method_imp                                  OBJC2UNAVAILABLE;
}  

可以看出, Method主要作用为关联了方法名SEL和方法的实现IMP,其实就是SEL(method_name)IMP(method_imp)形成了一个映射,当通过Method自己的定义的迭代器查找方法名SEL时,就可以很方便的找到方法实现IMP,从而调用方法的实现执行相关的操作。method_types表示方法实现的参数以及返回值类型。

6. IMP

typedef void (IMP)(void / id, SEL, ... */ ); 

* id,为self指针,表示消息接收者
* SEL,方法选择器,表示一个方法的selector指针
* 后面的...为传送消息的一些参数

可以看出, IMP是一个函数指针,指向了方法实现的首地址。
当OC发起消息后,最终执行的代码是由IMP指针决定的, 利用这个特性,我们可以对代码进行优化。在特殊情况下,可以通过获取IMP而直接调用方法实现,可以跳过消息传递机制,像C语言调用函数那样,这样的执行将会更加高效,可以提高程序的性能。

消息发送

上文中的main.m中代码, 编译器将其转化成了

int main(int argc, char * argv[]) {
    /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool; 
        // 简化一下
Animal *pig = objc_msgSend(objc_msgSend(objc_getClass("Animal"), sel_registerName("alloc")), sel_registerName("init"));
        objc_msgSend(pig, sel_registerName("eat"));
    }
    return 0;
}

第二个objc_msgSend返回值是作为第一个objc_msgSend的首个参数的。

运行时阶段的消息发送的步骤

  • 根据receiver的isa指针,获取到所属类,先在类的cache即缓存中*查找selector(IMP),可以找得到就跳到对应的函数去执行。如果没有找到,再在类的method_lists即方法列表中查找
  • 如果methodLists找不到,就到超类的方法列表里寻找,一直找,直到找到NSObject类为止。
  • 如果找到了selector,则获取实现方法并调用,并传入接收者对象以及方法的所有参数;没有找到时走方法解析和消息转发流程。
  • 将实现的返回值作为它自己的返回值

参考链接: OC_runtime运行时官方文档翻译

你可能感兴趣的:(Runtime基础)