iOS 底层 dyld 与 objc 的关联

在之前的文章中iOS应用程序加载流程主要讲述了 dyld 的加载流程,说到 dyld 在加载中会调用 _objc_init,那么它是如何于 objc 关联的呢?下面进入今天的探究

_objc_init 源码分析

首先,我们打开 objc-781 源码,找到 _objc_init 的源码,源码实现如下

void _objc_init(void)
{
    static bool initialized = false;
    if (initialized) return;
    initialized = true;
    
    // fixme defer initialization until an objc-using image is found?
    environ_init(); //环境变量的初始化
    tls_init(); //线程 key 的绑定
    static_init(); //C++ 静态构造函数的调用
    runtime_init(); //运行时的初始化
    exception_init(); //初始化异常处理
    cache_init(); //缓存的初始化
    _imp_implementationWithBlock_init(); //对 imp 的 block 标记初始化

    _dyld_objc_notify_register(&map_images, load_images, unmap_image); //注册处理程序,以便在映射、取消映射 和初始化objc镜像文件时使用

#if __OBJC2__
    didCallDyldNotifyRegister = true;
#endif
}

由以上源码可以看到,_objc_init 主要分为以下几部分

environ_init 环境变量初始化

此函数用于读取运行时的环境变量,如果需要,可以打印环境变量。我们先来看下简化后的源码,如下

/***********************************************************************
* environ_init
* Read environment variables that affect the runtime.
* Also print environment variable help, if requested.
**********************************************************************/
void environ_init(void) 
{
    if (issetugid()) {
        // All environment variables are silently ignored when setuid or setgid
        // This includes OBJC_HELP and OBJC_PRINT_OPTIONS themselves.
        return;
    } 

    bool PrintHelp = false;
    bool PrintOptions = false;
    bool maybeMallocDebugging = false;

    // Scan environ[] directly instead of calling getenv() a lot.
    // This optimizes the case where none are set.
    for (char **p = *_NSGetEnviron(); *p != nil; p++) {...}

    // Special case: enable some autorelease pool debugging 
    // when some malloc debugging is enabled 
    // and OBJC_DEBUG_POOL_ALLOCATION is not set to something other than NO.
    if (maybeMallocDebugging) {...}

    // Print OBJC_HELP and OBJC_PRINT_OPTIONS output.
    if (PrintHelp  ||  PrintOptions) {...}
}

从源码可以知道,核心的代码在 for 循环这段代码中,它的源码实现如下

for (char **p = *_NSGetEnviron(); *p != nil; p++) {
    if (0 == strncmp(*p, "Malloc", 6)  ||  0 == strncmp(*p, "DYLD", 4)  ||
        0 == strncmp(*p, "NSZombiesEnabled", 16))
    {
        maybeMallocDebugging = true;
    }

    if (0 != strncmp(*p, "OBJC_", 5)) continue;
    
    if (0 == strncmp(*p, "OBJC_HELP=", 10)) {
        PrintHelp = true;
        continue;
    }
    if (0 == strncmp(*p, "OBJC_PRINT_OPTIONS=", 19)) {
        PrintOptions = true;
        continue;
    }
    
    const char *value = strchr(*p, '=');
    if (!*value) continue;
    value++;
    
    for (size_t i = 0; i < sizeof(Settings)/sizeof(Settings[0]); i++) {
        const option_t *opt = &Settings[I];
        if ((size_t)(value - *p) == 1+opt->envlen  &&
            0 == strncmp(*p, opt->env, opt->envlen))
        {
            *opt->var = (0 == strcmp(value, "YES"));
            break;
        }
    }
}

通过注释和源码可知主要进行 environ 进行扫码,这样可以优化未设置的情况。中间的源码是对特殊情况的处理,这里就不过多的讲解了。我们重点看下第三部分简化的源码,主要针对环境变量的打印输出,我们可以将里面的 for 循环 拿出来,不添加条件,运行源码强行的打印所有环境变量,如下

此外,还可以通过终端命令,打印一个项目的所有环境变量

//1. cd 到任意一个项目的根目录
//2. 运行终端命令
export OBJC_hrlp = 1

以上这些环境变量,都可以通过 Xcode -> Product -> Scheme -> Edit Scheme... -> Run -> Arguments -> Environment Variables 来配置,举几个经常使用的环境变量

  • DYLD_PRINT_STATISTICS

设置为 YES,控制台就会打印 App 加载时长(pre-main 耗时)

  • OBJC_DISABLE_NONPOINTER_ISA

杜绝生成相应的 nonpointer isanonpointer isa 指针地址末尾为 1 ),生成的都是普通的 isa

  • OBJC_PRINT_LOAD_METHODS

打印 ClassCategory+ (void)load 方法的调用信息

OBJC_DISABLE_NONPOINTER_ISA 环境变量

下面我们分别打印配置该环境变量与不配置该环境变量有什么不同,首先我们设置 OBJC_DISABLE_NONPOINTER_ISAValue 为 YES

  • 添加如下代码,运行,打印 isa

由打印结果可知,当前 isa 的最后一位为 0(未做优化的 isa

  • 将该环境变量删除,再重新运行并打印

由打印结果可知,当前 isa 的最后一位为 1(已做优化的 isa

tls_init 线程key的绑定

主要是 本地线程池 的初始化以及析构,源码如下

void tls_init(void)
{
#if SUPPORT_DIRECT_THREAD_KEYS // 本地线程池,用来进行处理
    pthread_key_init_np(TLS_DIRECT_KEY, &_objc_pthread_destroyspecific); // 初始init
#else
    _objc_pthread_key = tls_create(&_objc_pthread_destroyspecific);// 析构
#endif
}

static_init C++ 静态构造函数的调用

运行系统级别的 C++ 静态构造函数,在 dyld 调用我们的静态构造函数之前,libc 调用 _objc_init 方法,因此需要自己做。(系统级别的 C++ 构造函数先于自定义的 C++ 构造函数运行)

/***********************************************************************
* static_init
* Run C++ static constructor functions.
* libc calls _objc_init() before dyld would call our static constructors, 
* so we have to do it ourselves.
**********************************************************************/
static void static_init()
{
    size_t count;
    auto inits = getLibobjcInitializers(&_mh_dylib_header, &count);
    for (size_t i = 0; i < count; i++) {
        inits[i]();
    }
}

runtime_init 运行时的初始化

这一部分主要是运行时的初始化,分为 分类的初始化已经创建的类的初始化(后续会展开分析,这里就不做详细讲解了)。源码如下

void runtime_init(void)
{
    objc::unattachedCategories.init(32);
    objc::allocatedClasses.init();
}

exception_init 初始化异常处理

主要是初始化 libobjc 的异常处理系统,注册异常处理的回调,从而监控异常的处理,其源码如下

/***********************************************************************
* exception_init
* Initialize libobjc's exception handling system.
* Called by map_images().
**********************************************************************/
void exception_init(void)
{
    old_terminate = std::set_terminate(&_objc_terminate);
}

程序异常即我们常说的 crash,是指程序的代码错误和发生了系统不允许的一些指令,然后系统会给的一些信号,crash 发生时会来到 _objc_terminate,源码如下

/***********************************************************************
* _objc_terminate
* Custom std::terminate handler.
*
* The uncaught exception callback is implemented as a std::terminate handler. 
* 1. Check if there's an active exception
* 2. If so, check if it's an Objective-C exception
* 3. If so, call our registered callback with the object.
* 4. Finally, call the previous terminate handler.
**********************************************************************/
static void (*old_terminate)(void) = nil;
static void _objc_terminate(void)
{
    if (PrintExceptions) {
        _objc_inform("EXCEPTIONS: terminating");
    }

    if (! __cxa_current_exception_type()) {
        // No current exception.
        (*old_terminate)();
    }
    else {
        // There is a current exception. Check if it's an objc exception.
        @try {
            __cxa_rethrow();
        } @catch (id e) {
            // It's an objc object. Call Foundation's handler, if any.
            (*uncaught_handler)((id)e); // oc 对象,抛出异常
            (*old_terminate)();
        } @catch (...) {
            // It's not an objc object. Continue to C++ terminate.
            (*old_terminate)();
        }
    }
}

此时,我们想跟进 uncaught_handler,发现只能找到它的定义,那么全局搜索下看在哪个地方调用了,在源码中找到了它的赋值

/***********************************************************************
* objc_setUncaughtExceptionHandler
* Set a handler for uncaught Objective-C exceptions. 
* Returns the previous handler. 
**********************************************************************/
objc_uncaught_exception_handler 
objc_setUncaughtExceptionHandler(objc_uncaught_exception_handler fn)
{
    // fn为设置的异常句柄 传入的函数,为外界给的
    objc_uncaught_exception_handler result = uncaught_handler;
    uncaught_handler = fn;
    return result;
}

在应用程序中传入一个用于处理异常的函数(即源码只能够的 fn),调用 objc_setUncaughtExceptionHandler 后,然后把异常信息回调到 App

cache_init 缓存初始化

主要进行缓存的初始化工作,其源码如下

void cache_init()
{
#if HAVE_TASK_RESTARTABLE_RANGES
    mach_msg_type_number_t count = 0;
    kern_return_t kr;

    while (objc_restartableRanges[count].location) {
        count++;
    }

    // 为当前任务注册一组可重新启动的缓存
    kr = task_restartable_ranges_register(mach_task_self(),
                                          objc_restartableRanges, count);
    if (kr == KERN_SUCCESS) return;
    _objc_fatal("task_restartable_ranges_register failed (result 0x%x: %s)",
                kr, mach_error_string(kr));
#endif // HAVE_TASK_RESTARTABLE_RANGES
}

_imp_implementationWithBlock_init 启动回调机制

通常这不会做什么,因为所有的初始化都是惰性的,但是对于某些进程,我们会迫不及待地加载 libobjc-trampolines.dylib,其源码如下

/// Initialize the trampoline machinery. Normally this does nothing, as
/// everything is initialized lazily, but for certain processes we eagerly load
/// the trampolines dylib.
void
_imp_implementationWithBlock_init(void)
{
#if TARGET_OS_OSX
    // Eagerly load libobjc-trampolines.dylib in certain processes. Some
    // programs (most notably QtWebEngineProcess used by older versions of
    // embedded Chromium) enable a highly restrictive sandbox profile which
    // blocks access to that dylib. If anything calls
    // imp_implementationWithBlock (as AppKit has started doing) then we'll
    // crash trying to load it. Loading it here sets it up before the sandbox
    // profile is enabled and blocks it.
    //
    // This fixes EA Origin (rdar://problem/50813789)
    // and Steam (rdar://problem/55286131)
    if (__progname &&
        (strcmp(__progname, "QtWebEngineProcess") == 0 ||
         strcmp(__progname, "Steam Helper") == 0)) {
        Trampolines.Initialize();
    }
#endif
}

_dyld_objc_notify_register dyld 注册通知回调

在之前的文章 iOS应用程序加载流程 介绍过这个方法了,它的源码实现是在 dyld 源码中,objc 源码中只有针对它的声明,如下

//
// Note: only for use by objc runtime
// Register handlers to be called when objc images are mapped, unmapped, and initialized.
// Dyld will call back the "mapped" function with an array of images that contain an objc-image-info section.
// Those images that are dylibs will have the ref-counts automatically bumped, so objc will no longer need to
// call dlopen() on them to keep them from being unloaded.  During the call to _dyld_objc_notify_register(),
// dyld will call the "mapped" function with already loaded objc images.  During any later dlopen() call,
// dyld will also call the "mapped" function.  Dyld will call the "init" function when dyld would be called
// initializers in that image.  This is when objc calls any +load methods in that image.
//
void _dyld_objc_notify_register(_dyld_objc_notify_mapped    mapped,
                                _dyld_objc_notify_init      init,
                                _dyld_objc_notify_unmapped  unmapped);

从源码注释中可以知道

  • 只供 objc 运行时使用
  • 注册处理程序,以便要在映射、取消映射和初始化objc映像时调用
  • Dyld 会通过一个包含 objc-image-info 镜像文件的数组回调 mapped 函数

dyld 与 objc 的关联

在上面的 _objc_init 源码分析中我们知道最终会调用 _dyld_objc_notify_register 函数,而该函数是在 dyld 源码中实现,我们打开 dyld-750.6源码,实现如下

void _dyld_objc_notify_register(_dyld_objc_notify_mapped    mapped,
                                _dyld_objc_notify_init      init,
                                _dyld_objc_notify_unmapped  unmapped)
{
    dyld::registerObjCNotifiers(mapped, init, unmapped);
}

结合上面 _objc_init 的源码,我们可以得出以下结论

  • mapped 等价于 map_images( dyld 将 image(镜像文件)加载进内存时,会触发该函数)
  • init 等价于 load_images( dyld 初始化 image(镜像文件)会触发该函数)
  • unmapped 等价于 unmap_image( dyld 将 image(镜像文件)移除时,会触发该函数)

我们再进入 registerObjCNotifiers 的源码,如下

void registerObjCNotifiers(_dyld_objc_notify_mapped mapped, _dyld_objc_notify_init init, _dyld_objc_notify_unmapped unmapped)
{
    // record functions to call
    sNotifyObjCMapped   = mapped;
    sNotifyObjCInit     = init;
    sNotifyObjCUnmapped = unmapped;

    // call 'mapped' function with all images mapped so far
    try {
        notifyBatchPartial(dyld_image_state_bound, true, NULL, false, true);
    }
    catch (const char* msg) {
        // ignore request to abort during registration
    }

    //  call 'init' function on all images already init'ed (below libSystem)
    for (std::vector::iterator it=sAllImages.begin(); it != sAllImages.end(); it++) {
        ImageLoader* image = *it;
        if ( (image->getState() == dyld_image_state_initialized) && image->notifyObjC() ) {
            dyld3::ScopedTimer timer(DBG_DYLD_TIMING_OBJC_INIT, (uint64_t)image->machHeader(), 0, 0);
            (*sNotifyObjCInit)(image->getRealPath(), image->machHeader());
        }
    }
}

以上我们可以得出

  • sNotifyObjCMapped 就是 _objc_init 源码中 调用方法 _dyld_objc_notify_register 的第一个参数 &map_images(映射镜像文件)
  • sNotifyObjCInit 就是第二个参数 load_images(加载镜像文件)
  • sNotifyObjCUnmapped 就是第三个参数 unmap_image()

registerObjCNotifiers 源码中我们看到了 sNotifyObjCInit 的调用,那么 sNotifyObjCMapped 是在什么时候调用的呢?

map_images 的调用时机

既然在源码中我们没有看到 sNotifyObjCMapped,那我们就全局搜索它在哪里调用了,在搜索结果中,只有 notifyBatchPartial 方法中调用了,如下

再次全局搜索 notifyBatchPartial 哪里调用了,在 registerObjCNotifiers 源码中找到了它的调用

由此也可以证明 map_images 先于 load_images 调用(先 map_imagesload_images

在 dyld 中注册回调函数,可以理解为添加观察者
在 objc 中注册 dyld,可以理解为发送通知
触发回调,可以理解为执行通知的方法

dyldobjc 的关联示意图如下

你可能感兴趣的:(iOS 底层 dyld 与 objc 的关联)