URL和URI

nginx.conf里面有几个大板块,第一部分是event,里面是设定最大并发数量。然后是各种协议,比如http\https\mail,一个http协议里面可以有多个server,每一个server对应的就是一个网站,在生产中,server 1和server 2乃至server n如果是虚拟主机的话,那么他们的内容是一样的,这样要是server 1的服务器负载压力过大, nginx会启动负载均衡把用户都引向相对负载压力较小的服务器,以此达到保护服务器的目的。


而server下面可以有多个location,而location里就需要根据情况填写URI,那什么是URI呢?


URL:统一资源定位符

URI:同一资源标识符


举个例子:www.yahoo.com/nba/GoldenWarriors/players-curry.html,这一大串就是一个url,而uri指的是后面nba/GoldenWarriors/players-curry.html这一段。


nginx还有一个变量叫document_uri,他跟uri显示的东西是一回事。

Location里的匹配句式

location这个参数可以根据uri的不同需求进行配置,可以使用字符串和正则表达式匹配,使用字符串的话没啥说的,写啥就是对应啥;如果要使用正则表达式的话,语法是这样的:location [=|~|~*|^~] /uri/ {……},说一下中括号里各个东西的意思:

~:区分大小写;

~*:不区分大小写;

^~:匹配,但是不是精确匹配,比如请求为/static/20%/aa,可以被规则^~ /static/ /aa匹配到;

=:精确匹配。下面举几个例子


1、location =/ {

    里面就是各个的详细信息

        }

这个使用了"=",所以采用的是精确匹配“/”,即只能访问nginx安装文件夹里的第一层所有文件,第二层的乃至更深的文件都无法访问。同理,当拒绝某ip访问的时候,也是仅仅拒绝这个ip地址访问“/”这个文件夹。


2、location /{

    里面是各种配置信息

    }

这里没有采用"=",也就是说只要是nginx安装文件夹下的所有文件,不管是第几层,只要在这个文件夹下都可以访问。


3、location ^~/p_w_picpaths/{

    里面是各种配置信息

    }

首先这里先确定范围是nginx安装目录下的p_w_picpaths文件下的所有子文件(包括其子文件夹),但是前面使用了^~,意思是禁止表达式匹配。


4、location ~* \.(gif|jpg|jpeg)${

    里面是各种配置信息

    }

不区分大小的匹配所有以.gif/.jpg/.jpeg结尾的文件夹,但是要注意,如果这个4号式子与上面那个3号式子一起写,无论是3上4下,还是4上3下,/p_w_picpaths/下的文件会优先被3号式子选出。


比如,在nginx安装文件夹下有这样一个文件/p_w_picpaths/1.gif。虽然它也是gif结尾,但是由于3式子对文件夹的范围更精确,所以被3先挑出来,但是由于后面的^~,就脱离了正则的范围。不进入4的控制里。而如果有/AAA/1.jpg。这个文件就会被4挑选出来。

举几个例子,就会更容易加深理解:

1)要求:abc.domian.com/sort/2 => abc.domian.com/index.php?act=sort&name=abc&id=2

配置如下:

location {
        if ($host ~* (.*)\domain.\com){
            set $sub_name $1;
            rewrite ^/sort\/(\d+)\/?$ /index.php?act=sort&name=abc&id=$1 last;
            }
        }

【评析】(\d)代表数字,(\d+)代表一个或者多个数字。

2)要求:/123456/xxxx -> /xxxx?id=123456

配置如下:

location{
        if ($uri ~* /123456/(.*)){
            set $args_1 $1;
            set $args_2 $2;
            rewrite ^/(\d+)/(.+) /$2?id=$1last;
            }
        }

【评析】(.+)是贪婪匹配,就是什么都要;而比如说(.+K)就是挑出一个或者多个字符后面跟一个K。