Nginx源码分析---Nginx启动初始化过程(二)

在Nginx启动初始化过程(一)中提到main函数会调用ngx_init_cycle()初始化一个全局cycle变量,本文就来看看这个ngx_init_cycle()函数究竟做了哪些初始化工作。ngx_cycle_t结构类型被定义在src/core/ngx_cycle.h文件中,多达23个成员变量(nginx-0.7.67),由于ngx_init_cycle()函数的代码多达近800行,绝对算大函数了(当然,我也相信还有更加变态的函数,将整个世界都写到一个函数中的情况也是有可能的),在此就挑一些相对关键的代码来看吧。

ngx_timezone_update(); 
/* force localtime update with a new timezone */ 
tp = ngx_timeofday(); 
tp->sec = 0; 
ngx_time_update();

这几个函数都是来自于Nginx的时间管理,对时区和时间进行一次更新操作。一个高性能服务器需要合理的调用gettimeofday(),减少gettimeofday()的调用次数有利于提高服务器的性能。Nginx对时间的管理也是值得我们去学习的,这部分代码就放后续分析吧。

/*创建一个大小为NGX_CYCLE_POOL_SIZE的内存池*/ 
pool = ngx_create_pool(NGX_CYCLE_POOL_SIZE, log);
if (pool == NULL) { return NULL; } 
pool->log = log;
/*在内存池上分配一个ngx_cycle_t对象*/ 
cycle = ngx_pcalloc(pool, sizeof(ngx_cycle_t)); 
if (cycle == NULL) { 
	ngx_destroy_pool(pool); 
	return NULL; 
}

这几行简简单单的代码在整个Nginx源码中是随处可见,它首先创建了一个内存池,然后在这个内存池上为cycle变量分配了一块存储空间。后续的所有初始化工作都为了填写这个cycle变量的各个成员字段。Nginx的内存池实现是相当的简单,但绝对不简陋;在web server的应用场景中是非常的有效。内存池的实现在src/core/ngx_palloc.h和src/core/ngx_palloc.c中。

/*初始化一个链表*/ 
if (ngx_list_init(&cycle->open_files, pool, n, sizeof(ngx_open_file_t)) != NGX_OK) { 
	ngx_destroy_pool(pool); 
	return NULL; 
if (ngx_list_init(&cycle->shared_memory, pool, n, sizeof(ngx_shm_zone_t)) != NGX_OK) { 
	ngx_destroy_pool(pool); 
	return NULL; 
}

此段代码被我刻意简化了参数n值的求解过程,但我们能够清楚的看出Nginx使用了链表来维护需要打开的文件以及共享内存,也就是每个打开的文件都会放到cycle中的open_files链表中,每个共享内存段都会放到shared_memory链表中。此处仅仅是完成这两个链表空间的初始化,为后面存放相应的对象做好准备。

/*初始化listening数组*/ 
cycle->listening.elts = ngx_pcalloc(pool, n * sizeof(ngx_listening_t)); 
if (cycle->listening.elts == NULL) { 
	ngx_destroy_pool(pool); 
	return NULL; 
cycle->listening.nelts = 0; 
ycle->listening.size = sizeof(ngx_listening_t); 
cycle->listening.nalloc = n; 
cycle->listening.pool = pool; 

cycle中的listening字段是一个数组,在这里完成此数组的初始化,为该数组分配起n个存储ngx_listening_t元素的单元。这个数组将用于存储监听套接字。Nginx原本就提供数组初始化的接口函数ngx_array_init,此处却没有使用数组初始化函数来完成初始化,诡异。

cycle->conf_ctx = ngx_pcalloc(pool, ngx_max_module * sizeof(void *));
/*ngx_max_module为模块总数*/ 
if (cycle->conf_ctx == NULL) { 
	ngx_destroy_pool(pool); 
	return NULL; 
for (i = 0; ngx_modules[i]; i++) { 
	if (ngx_modules[i]->type != NGX_CORE_MODULE) {
		continue; 
		/* 非核心模块跳过,此处只关心核心模块*/ 
	
	module = ngx_modules[i]->ctx; 
	if (module->create_conf) { 
		rv = module->create_conf(cycle); 
		if (rv == NULL) { 
			ngx_destroy_pool(pool); 
			return NULL; 
		
		cycle->conf_ctx[ngx_modules[i]->index] = rv; 
	
}

首先将conf_ctx初始化了一段内存空间(可以看成一个普通的数组),这段空间能够存储ngx_max_module个void*指针;在启动初初始化过程(一)中,我们得知ngx_max_modules统计了模块总数,因此可以看出cycle中的conf_ctx将存储每个module的某些信息。接下来的for循环验证了我们的猜想。在for循环中,调用NGX_CORE_MODULE类型模块的ceate_conf回调,创建相应的配置结构存储空间,然后将这个配置结构存储空间的地址保存到conf_ctx数组的对应单元处。寻找正确的对应单元就是通过每个模块的index字段。通过对NGX_CORE_MODULE类型模块的处理,我们暂且猜测conf_ctx数组就是用来存储每个模块的配置结构;利用这个数组,我们能够获取每个模块相应的配置数据。以后的分析将会检验这里的猜测。

NGX_CORE_MODULE类型的模块有:ngx_core_module、ngx_errlog_module、ngx_events_module和ngx_http_module等。

ngx_core_module定义在src/core/nginx.c文件中,create_conf钩子对应的函数为ngx_core_module_create_conf(),此函数就是创建ngx_core_conf_t配置结构。

ngx_errlog_module定义在src/core/ngx_log.c中,create_conf钩子没有对应的回调函数,为NULL。

ngx_events_module定义在src/event/ngx_event.c中,create_conf钩子没有对应的回调函数,为NULL。

ngx_http_module定义在src/http/ngx_http.c中,create_conf钩子没有对应的回调函数,为NULL。

由此可以看出,此处的循环执行create_conf回调函数,其实就只调用了ngx_core_module_create_conf()。

if (ngx_conf_param(&conf) != NGX_CONF_OK) { 
	environ = senv; 
	ngx_destroy_cycle_pools(&conf); 
	eturn NULL; 
if (ngx_conf_parse(&conf, &cycle->conf_file) != NGX_CONF_OK) {
	/*解析配置文件*/ 
	environ = senv; 
	ngx_destroy_cycle_pools(&conf); 
	return NULL; 
}

这里将完成对配置文件的解析工作,做过Nginx模块开发的都清楚——解析配置文件的时候,将会完成每个指令的set回调,这个set回调函数一般都是用于将配置数据填写到配置结构中。 解析配置文件常用的手法之一就是利用状态机,但此处Nginx却没有明确的使用状态机来完成配置文件的解析工作。后面具体看看Nginx解析配置文件的流程。其次,Nginx通过解析配置文件,回调一系列的函数来完成各个模块之间的衔接,有效的将一个完全解耦的系统组合到了一块。

for (i = 0; ngx_modules[i]; i++) { 
	if (ngx_modules[i]->type != NGX_CORE_MODULE) { continue; } 
	module = ngx_modules[i]->ctx; 
	if (module->init_conf) { 
		if (module->init_conf(cycle, cycle->conf_ctx[ngx_modules[i]->index]) == NGX_CONF_ERROR) { 
			environ = senv; ngx_destroy_cycle_pools(&conf); return NULL; 
		
	
}

前面完成了NGX_CORE_MODULE类型模块的配置结构创建工作,这里调用所有NGX_CORE_MODULE类型模块的init_conf回调函数,完成配置结构的初始化工作。同ceate_conf,其实此处也只是调用了ngx_core_module的ngx_core_module_init_conf()回调函数。对ceate_conf创建的配置结构进行初始化。其他几个NGX_CORE_MODULE没有init_conf回调函数。

/* open the new files */ 
part = &cycle->open_files.part; 
file = part->elts; 
/*此处for循环是在遍历链表open_files*/ 
for (i = 0; /* void */ ; i++) { 
	if (i >= part->nelts) { 
		if (part->next == NULL) { break; } 
		part = part->next; 
		file = part->elts; 
		i = 0; 
	
	if (file[i].name.len == 0) { continue; } 
	/*根据链表中存储的文件名来打开对应的文件*/ 
	file[i].fd = ngx_open_file(file[i].name.data, NGX_FILE_APPEND, NGX_FILE_CREATE_OR_OPEN, NGX_FILE_DEFAULT_ACCESS);  
	if (file[i].fd == NGX_INVALID_FILE) { goto failed; } 
	#if !(NGX_WIN32) 
	if (fcntl(file[i].fd, F_SETFD, FD_CLOEXEC) == -1) { goto failed; } 
	#endif 
}

遍历open_files链表,打开所有文件(调用open)。起初,我们看到了对open_files链表的创建、初始化,却没有看到写需要打开的文件名数据到链表中;其实,填写文件名数据就是在解析配置文件的时候完成的。除此之外,很多很多的数据初始化都是在解析配置文件的时候完成。执行了打开文件操作后,open_files链表就不光保存了文件名了,还保存了文件描述符等信息,足够以后读写文件之用了。

/* create shared memory */ 
part = &cycle->shared_memory.part; 
shm_zone = part->elts; 
/*同上面的open_files,此处遍历链表shared_memory,初始化各个共享内存段*/ 
for (i = 0; /* void */ ; i++) { 
	if (i >= part->nelts) { 
		if (part->next == NULL) { break; } 
		part = part->next; 
		shm_zone = part->elts; 
		i = 0; 
	
	if (shm_zone[i].shm.size == 0) { goto failed; } 
	if (shm_zone[i].init == NULL) { /* unused shared zone */ continue; } 
	shm_zone[i].shm.log = cycle->log; 
	opart = &old_cycle->shared_memory.part; 
	oshm_zone = opart->elts; 
	for (n = 0; /* void */ ; n++) { 
		if (n >= opart->nelts) { 
			if (opart->next == NULL) { break; } 
			opart = opart->next; 
			oshm_zone = opart->elts; n = 0; 
		
		if (shm_zone[i].shm.name.len != oshm_zone[n].shm.name.len) { continue; } 
		if (ngx_strncmp(shm_zone[i].shm.name.data, oshm_zone[n].shm.name.data, 
			shm_zone[i].shm.name.len) != 0) { continue; } 
		if (shm_zone[i].shm.size == oshm_zone[n].shm.size) { 
			shm_zone[i].shm.addr = oshm_zone[n].shm.addr; 
			if (shm_zone[i].init(&shm_zone[i], oshm_zone[n].data) != NGX_OK) { goto failed; } 
			goto shm_zone_found; 
		
		ngx_shm_free(&oshm_zone[n].shm); 
		break; 
	} /*下面三步就完成共享内存的创建和初始化*/ 
	if (ngx_shm_alloc(&shm_zone[i].shm) != NGX_OK) { goto failed; } 
	if (ngx_init_zone_pool(cycle, &shm_zone[i]) != NGX_OK) { goto failed; } 
	if (shm_zone[i].init(&shm_zone[i], NULL) != NGX_OK) { goto failed; } 
	shm_zone_found: 
		continue; 
}

这部分复杂的代码就是为完成所有共享内存的创建及初始化,后面再专门分析Nginx对共享内存的管理及使用。

if (ngx_open_listening_sockets(cycle) != NGX_OK) { goto failed; } 
if (!ngx_test_config) { ngx_configure_listening_sockets(cycle); }

遍历listening数组,打开所有的监听套接口(依次进行socket、bind、listen),同时设置一些socket选项及文件描述符属性,如非阻塞等。

for (i = 0; ngx_modules[i]; i++) { 
	if (ngx_modules[i]->init_module) { 
		if (ngx_modules[i]->init_module(cycle) != NGX_OK) { 
			/* fatal */ 
			exit(1); 
		
	
}

执行所有模块的init_module操作,看名字为对模块进行初始化。 浏览源码,发现包括几个NGX_CORE_MODULE类型的模块在内的绝大多数模块都没有这个init回调函数。究竟哪些模块才使用这个回调接口呢?动用搜索功能,终于找到了一个模块使用了这个回调接口,它就是ngx_event_core_module。在此,就不纠结这个独特的初始化函数了,到分析事件驱动的时候,再回头看看。

ngx_init_cycle()就差不多了,不过还有很多清除多余资源的代码没有做介绍,比如:关闭无用的文件,监听套接字等资源。有兴趣的读者,自行研究吧。至此,初始化过程就暂且告一段落吧,下一篇开始进程管理。


你可能感兴趣的:(Nginx源码分析---Nginx启动初始化过程(二))