nginx 处理请求原理和每个阶段的意思

适用

Nginx通过fastcgi调用python, Perl和C++等写的CGI程序。PHP有PHP-FPM (FastCGI Process Manager),这个对PHP来说更好的FastCGI进程管理器,关于PHP-FPM的更多信息,请Google php-fpm+nginx。

原理

Nginx并不提供支持对外部程序的直接调用或者解析(所以缺少像apache里的mod_php这样的模块),所有的外部程序(包括PHP)必须通过fastcgi接口来调用,在Linux下接口是socket (文件socket或者Internet socket)。所以为了调用CGI程序,我们需要一个fastcgi的wrapper,这个wrapper绑定在某个固定socket上(比如端口或者文件socket),当nginx将CGI请求发送给这个socket的时候,wrapper接纳请求并fork一个新的线程,这个线程调用外部的程序或者解释器处理脚本并读取返回值,而wrapper再将返回的数据(网页或者图片等)通过fastcgi将数据通过那个固定的socket传递给nginx。示意图如下:

Ningx的FastCGI原理

所以,我们首先需要一个wrapper,这个wrapper需要完成的工作:

  1. 通过调用fastcgi(库)的函数通过socket和ningx通信(读写socket是fastcgi内部实现的功能,对wrapper是非透明的)
  2. 调度thread,进行fork和kill
  3. 和application进行通信

在编写nginx的http的模块的时候,需要在各个阶段对http请求做相应的处理,以达到不同的目的,

比如请求发起的时候是否有访问权限、内容生成的时候进行过滤或者其它处理等等。

如果在编译nginx模块内注册的处理阶段不正确会导致达不到想要的结果,比如你想处理内容的时候内容实际上这个时候是没有的,如此等等。

在nginx内部定义了多个阶段的类型以满足不同的处理要求(ngx_http_core_module.h中,不同版本不一样):

typedef enum {

    NGX_HTTP_POST_READ_PHASE = 0,


    NGX_HTTP_SERVER_REWRITE_PHASE,


    NGX_HTTP_FIND_CONFIG_PHASE,
    NGX_HTTP_REWRITE_PHASE,
    NGX_HTTP_POST_REWRITE_PHASE,

    NGX_HTTP_PREACCESS_PHASE,

    NGX_HTTP_ACCESS_PHASE,
    NGX_HTTP_POST_ACCESS_PHASE,

    NGX_HTTP_TRY_FILES_PHASE,
    NGX_HTTP_CONTENT_PHASE,

    NGX_HTTP_LOG_PHASE
} ngx_http_phases;

各对应的意思分别为:

NGX_HTTP_POST_READ_PHASE = 0 //读取请求阶段
NGX_HTTP_SERVER_REWRITE_PHASE //URI转换阶段
NGX_HTTP_FIND_CONFIG_PHASE //查找相应的配置来执行阶段
NGX_HTTP_REWRITE_PHASE //URI转换阶段(不太清楚此处)
NGX_HTTP_POST_REWRITE_PHASE //对转换后的URL结果进行处理的阶段
NGX_HTTP_PREACCESS_PHASE //权限检查准备阶段
NGX_HTTP_ACCESS_PHASE //权限检查阶段
NGX_HTTP_POST_ACCESS_PHASE //对权限检查结果进行处理阶段
NGX_HTTP_TRY_FILES_PHASE //处理配置中的try_files阶段
NGX_HTTP_CONTENT_PHASE //处理生成返回数据阶段(此处认为不太细,当然有filter也可以忽略)
NGX_HTTP_LOG_PHASE //记录日志处理阶段,具体说明应当是请求完成后,关闭请求时处理

从这个配置中可以分析出来nginx在处理请求的整个流程,流程是从头执行到尾的,可见LOG是放在最后面执行,对于内容段的处理一般都是在 filter模块中去做,在NGX_HTTP_LOG_PHASE阶段注册的处理段也不能获取到返回的数据,返回数据在发送至客户端后就直接给释放了。

因此,在各个阶段处理时应当清楚这个阶段的数据准备情况。


Nginx 配置指令的执行顺序(一)

NGINX源码关于HTTP请求的概要解析:参考文章:Nginx的HTTP请求处理

  1. typedef enum {  
  2.     //0读取请求phase  
  3.     NGX_HTTP_POST_READ_PHASE = 0,  
  4.     //1这个阶段主要是处理全局的(server block)的rewrite。  
  5.     NGX_HTTP_SERVER_REWRITE_PHASE,  
  6.     //2这个阶段主要是通过uri来查找对应的location,然后根据loc_conf设置r的相应变量  
  7.     //e.g. 根据location内配置的具体命令设置r->content_handler,到NGX_HTTP_CONTENT_PHASE调用  
  8.     NGX_HTTP_FIND_CONFIG_PHASE,  
  9.     //3这个主要处理location的rewrite  
  10.     NGX_HTTP_REWRITE_PHASE,  
  11.     //4post rewrite,这个主要是进行一些校验以及收尾工作,以便于交给后面的模块。  
  12.     NGX_HTTP_POST_REWRITE_PHASE,  
  13.     //5比如流控这种类型的access就放在这个phase,也就是说它主要是进行一些比较粗粒度的access。  
  14.     NGX_HTTP_PREACCESS_PHASE,  
  15.     //6这个比如存取控制,权限验证就放在这个phase,一般来说处理动作是交给下面的模块做的.这个主要是做一些细粒度的access  
  16.     NGX_HTTP_ACCESS_PHASE,  
  17.     //7一般来说当上面的access模块得到access_code之后就会由这个模块根据access_code来进行操作  
  18.     NGX_HTTP_POST_ACCESS_PHASE,  
  19.     //8try_file模块,也就是对应配置文件中的try_files指令,可接收多个路径作为参数,当前一个路径的资源无法找到,则自动查找下一个路径  
  20.     NGX_HTTP_TRY_FILES_PHASE,  
  21.     //9内容处理模块  
  22.     NGX_HTTP_CONTENT_PHASE,    
  23.     //10log模块  
  24.     NGX_HTTP_LOG_PHASE  
  25. } ngx_http_phases; 



正常情况下,我们可以通过如下的方式来注册我们自己的处理模块:

static ngx_int_t
ngx_http_xxx_init(ngx_conf_t *cf)
{
ngx_http_handler_pt *h;
ngx_http_core_main_conf_t *cmcf;

cmcf = ngx_http_conf_get_module_main_conf(cf, ngx_http_core_module);

h = ngx_array_push(&cmcf->phases[NGX_HTTP_CONTENT_PHASE].handlers);
if (h == NULL) {
return NGX_ERROR;
}

*h = ngx_http_xxx_handler;

return NGX_OK;
}

且ngx_http_xxx_up_handler的返回值只能是如下几个:

NGX_OK //处理成功,进入下一阶段
NGX_DECLINED //放弃处理
NGX_AGAIN || NGX_DONE //处理完成,返回该值会触发请求
NGX_ERROR || NGX_HTTP_.. //处理错误或者HTTP的其它状态值

另外对于NGX_HTTP_CONTENT_PHASE阶段,实际上还有另外一种注册方式,Just like this:

static char *
ngx_http_xxx_server(ngx_conf_t *cf, ngx_command_t *cmd, void *conf)
{
ngx_str_t *value;
ngx_url_t u;
ngx_http_core_loc_conf_t *clcf;

clcf = ngx_http_conf_get_module_loc_conf(cf, ngx_http_core_module);

clcf->handler = ngx_http_xxx_handler;

if (clcf->name.data[clcf->name.len - 1] == ‘/’) {
clcf->auto_redirect = 1;
}

return NGX_CONF_OK;
}

不过这样子,你要做的东西就太多了,更多的情况下考虑下upstream结合或者对请求进行特殊处理,比如对于分布式存储的分发,需要对请求处理和文件系统关联时、比如请求的数据直接交给特殊的SERVER来拿内容时。呵呵.


你可能感兴趣的:(nginx,socket,server,Module,Access,wrapper)