上篇文章我们已经了解到objc_init调用_dyld_objc_notify_register注册了load_image,load_image就是调用所有类里的load方法,今天我们来探讨一下map_images
objc_init
首先我们先来分析一下objc_init
函数
void _objc_init(void)
{
static bool initialized = false;
if (initialized) return;
initialized = true;
// fixme defer initialization until an objc-using image is found?
environ_init(); // 环境变量的初始化 export OBJC_HELP=1(终端也可以打印环境变量)
tls_init(); // 线程池初始化
static_init(); // 全局静态c++函数调用 libobjc 的全局构造函数自己调用,不用dyld调用
runtime_init();
exception_init(); // 异常抛出点
#if __OBJC2__
cache_t::init();
#endif
_imp_implementationWithBlock_init();
_dyld_objc_notify_register(&map_images, load_images, unmap_image);
#if __OBJC2__
didCallDyldNotifyRegister = true;
#endif
}
-
environ_init()
: 读取影响运⾏时的环境变量。如果需要,还可以打印环境变量帮助。 -
tls_init()
关于线程key的绑定 - ⽐如每线程数据的析构函数 -
static_init()
运⾏C ++静态构造函数。在dyld调⽤我们的静态构造函数之前,libc
会调⽤ _objc_init(),
因此我们必须⾃⼰做
*lock_init()
: 没有重写,采⽤C++ 的特性 -
cache_init()
缓存条件初始化 -
runtime_init()
: runtime运⾏时环境初始化,⾥⾯主要
是:unattachedCategories,allocatedClasses 后⾯会分析 -
_imp_implementationWithBlock_init
:启动回调机制。通常这不会做什么,因为所有的初始化都是惰性的,但是对于某些进程,我们会迫不及待地加载trampolines dylib。 -
exception_init
初始化libobjc的异常处理系统
NSSetUncaughtExceptionHandler
注册异常回调函数
void HFExceptionHandlers(NSException *exception) {
NSLog(@"%s",__func__);
int32_t exceptionCount = atomic_fetch_add_explicit(&LGUncaughtExceptionCount,1,memory_order_relaxed);
if (exceptionCount > LGUncaughtExceptionMaximum) {
return;
}
// 获取堆栈信息 - model 编程思想
NSArray *callStack = [LGUncaughtExceptionHandle lg_backtrace];
NSMutableDictionary *userInfo = [NSMutableDictionary dictionaryWithDictionary:[exception userInfo]];
[userInfo setObject:exception.name forKey:LGUncaughtExceptionHandlerSignalExceptionName];
[userInfo setObject:exception.reason forKey:LGUncaughtExceptionHandlerSignalExceptionReason];
[userInfo setObject:callStack forKey:LGUncaughtExceptionHandlerAddressesKey];
[userInfo setObject:exception.callStackSymbols forKey:LGUncaughtExceptionHandlerCallStackSymbolsKey];
[userInfo setObject:@"LGException" forKey:LGUncaughtExceptionHandlerFileKey];
[[[LGUncaughtExceptionHandle alloc] init]
performSelectorOnMainThread:@selector(lg_handleException:)
withObject:
[NSException
exceptionWithName:[exception name]
reason:[exception reason]
userInfo:userInfo]
waitUntilDone:YES]; // 发送到服务端,阻塞当前线程
}
+ (void)installUncaughtSignalExceptionHandler{
// uncaught_handler() = fn = LGExceptionHandlers
// objc_setUncaughtExceptionHandler()
NSSetUncaughtExceptionHandler(&HFExceptionHandlers);
}
当发生异常,就会回调我们的HFExceptionHandlers
函数,我们就可以在这个函数里面将异常信息发送到我们的服务器。
_dyld_objc_notify_register
_dyld_objc_notify_register(&map_images, load_images, unmap_image)
参数解释
这边map_images
是取地址,而load_images
不需要呢?
首先要先明白一点map_images
参数是指针传递,传的是地址,可以进行修改返回相当于输入输出参数,而load_images
值传递即输入参数。
我们要知道map_images
函数是不断的循环和递归加载类的信息,所以中间会有所变化,因此用地址传递,而我们后续可能还有用到map_images
通过对代码分析,我们定位到一下函数走向流程
map_images
->map_images_nolock
->_read_images
...
map_images_nolock
该函数虽然代码挺多的,但是我们的主线是定位镜像的加载,里面很多函数都只是初始化和其他处理(根据注释猜测),所以我们定位到read_image
目前我们先定位到read_image
,主要是read_image
函数代码里面有比较多函数名猜测是关于类的信息加载。
read_images
接下来我们重点分析read_images
通过read_image
里面的注释,我们可以将其流程归纳如下:
- 1: 条件控制进⾏⼀次的加载
- 2: 修复预编译阶段的
@selector
的混乱问题 - 3: 错误混乱的类处理
- 4:修复重映射⼀些没有被镜像⽂件加载进来的 类
- 5: 修复⼀些消息!
- 6: 当我们类⾥⾯有协议的时候 : readProtocol
- 7: 修复没有被加载的协议
- 8: 分类处理
- 9: 类的加载处理
-
10 : 没有被处理的类 优化那些被侵犯的类
通过注释我们就能很快确定我们的研究目标9.类的加载处理。
注意上面的注释:这边只有非懒加载类才能够进来,额什么是非懒加载类呢?也就是有load的方法的就是非懒加载类。
通过源码分析我们定位到上面两个地方,一个是readClass
,另一个是realizeClassWithoutSwift
首先我们来分析一下readClass
readClass
里面有对类的ro,rw
,还有supperClass进行操作。所以我们猜测这边应该是类的加载。
如果这边是类的加载的话,那么我们定义的HFObject类应该会在这边加载,所以我们先断点到我们的类这边,通过一步步调试发现并没有走到断点三的位置也就是3360行,所以我们写的类并不是在这边加载的。
紧接着我们来看看realizeClassWithoutSwift
同样我们还是在realizeClassWithoutSwift添加一段判断是否是HFObject类的代码
从截图的代码中我们可以看到
ro
的获取以及rw
的配置
而在代码下面还有对父类和元类的初始化
supercls = realizeClassWithoutSwift(remapClass(cls->getSuperclass()), nil); // 父类递归调用
metacls = realizeClassWithoutSwift(remapClass(cls->ISA()), nil); // 递归调用
...
cls->setSuperclass(supercls);
cls->initClassIsa(metacls);
我们还可以打印一下类的信息:
由此可以证明类的加载就在这个函数里头。但是这边只有对非懒加载类进来,如果懒加载的类呢?
我们可以通过断点来调试看看
通过bt打印函数调用堆栈如下
通过上面的断点调试我们可以得出结论:懒加载类在第一次调用的时候的时候,通过
objc_msgSend
发送消息,进行快速查找和慢速查找,在慢速查找的时候会初始化这个类。
补充:
- 懒加载类与⾮懒加载类 — 当前类是否实现 load ⽅法
- 1: 懒加载类情况 数据加载推迟到第⼀次消息的时候
lookUpImpOrForward
realizeClassMaybeSwiftMaybeRelock
realizeClassWithoutSwift
methodizeClass - 2: ⾮懒加载类情况 map_images的时候 加载所有类数据
readClass
_getObjc2NonlazyClassList
realizeClassWithoutSwift
methodizeClass
-
ro,rw,rwe 这三个的究竟是什么?
app在使用类时,是需要在磁盘中app的二进制文件中读取类的信息,二进制文件中的类存储了类的元类、父类、flags和方法缓存,如下图
类的额外信息(name、方法、协议和实例变量等)存储在class_ro_t中
class_ro_t简称ro:read only,将类从磁盘中读取到内存中就是对ro的赋值操作。由于ro是只读的,加载到内存后不会发生改变又称为clean memory(干净内存)。
class_rw_t简称rw:read write,用于读写编写程序也被称作drity memory, 在进程运行时发生更改的内存。类一经使用运行时就会分配一个额外的内存,那么这个内存变成了drity memory。但是在实际应用中,类的使用量只是10%,这样就在rw中造成了内存浪费,所以苹果就把rw中方法、协议和实例变量等放到了class_rw_ext_t中。
将需要动态更新的部分提取出来存入class_rw_ext_t
methodizeClass
methodizeClass
是对方法的处理。那他都做了什么处理呢
static void methodizeClass(Class cls, Class previously)
{
runtimeLock.assertLocked();
bool isMeta = cls->isMetaClass();
auto rw = cls->data();
auto ro = rw->ro();
auto rwe = rw->ext();
// Methodizing for the first time
if (PrintConnecting) {
_objc_inform("CLASS: methodizing class '%s' %s",
cls->nameForLogging(), isMeta ? "(meta)" : "");
}
// Install methods and properties that the class implements itself.
method_list_t *list = ro->baseMethods();
if (list) {
prepareMethodLists(cls, &list, 1, YES, isBundleClass(cls), nullptr);
if (rwe) rwe->methods.attachLists(&list, 1);
}
property_list_t *proplist = ro->baseProperties;
if (rwe && proplist) {
rwe->properties.attachLists(&proplist, 1);
}
protocol_list_t *protolist = ro->baseProtocols;
if (rwe && protolist) {
rwe->protocols.attachLists(&protolist, 1);
}
// Root classes get bonus method implementations if they don't have
// them already. These apply before category replacements.
if (cls->isRootMetaclass()) {
// root metaclass
addMethod(cls, @selector(initialize), (IMP)&objc_noop_imp, "", NO);
}
// Attach categories.
if (previously) {
if (isMeta) {
objc::unattachedCategories.attachToClass(cls, previously,
ATTACH_METACLASS);
} else {
// When a class relocates, categories with class methods
// may be registered on the class itself rather than on
// the metaclass. Tell attachToClass to look for those.
objc::unattachedCategories.attachToClass(cls, previously,
ATTACH_CLASS_AND_METACLASS);
}
}
objc::unattachedCategories.attachToClass(cls, cls,
isMeta ? ATTACH_METACLASS : ATTACH_CLASS);
#if DEBUG
// Debug: sanity-check all SELs; log method list contents
for (const auto& meth : rw->methods()) {
if (PrintConnecting) {
_objc_inform("METHOD %c[%s %s]", isMeta ? '+' : '-',
cls->nameForLogging(), sel_getName(meth.name()));
}
ASSERT(sel_registerName(sel_getName(meth.name())) == meth.name());
}
#endif
}
首先通过prepareMethodLists(cls, &list, 1, YES, isBundleClass(cls), nullptr)
对方法列表进行排序,这样方便后面慢速查找时用二分查找来找方法,紧接着是对属性和协议进行处理。
注意这边的rwe为NULL,因为rwe只有在动态更新的时候才会有值,啥时候动态更新,也就是分类加载,动态添加方法属性的时候。