Nginx的Rewrite学习

Rewrite重写是基于ngx_http_rewrite_module的,在编辑重写之前,请确保安装了此模块

一、nginx的全局变量

1、以http://www.yllin.com:5055/user/index?id=1&type=3为例

变量名 说明 例子
$args Url中的请求参数 id=1&type=3
$content_length 请求头中的Content-length字段
$content_type 请求头中的Content-type字段
$document_root 请求的根路径
$document_uri 当前的url(不包括请求参数) /user/index
$host 主机字段 www.yllin.com
$http_user_agent 请求的客户端的用户代理信息
$http_cookie 客户端的cookie信息
$limit_rate Nginx对网络连接速率的限制(Nginx配置limit_rate指令的配置值 )
$remote_addr 客户端的地址
$remote_port 客户端和服务端的连接端口
$remote_user 客户端的用户名
$request_body_file 发送给服务端的文件资源名称
$request_method 客户端的请求方式 如post、get
$request_filename 资源文件的路径名
$request_uri 请求的url,附带参数 /user/index?id=1&type=3
$query_string 与args同种意义
$scheme 请求协议 http、ftp
$server_protocol 协议版本
$server_addr 服务器ip
$server_name 服务器名字
$server_port 服务器端口
$uri 资源文件的路径名

二、if指令

格式:

if (text-do){
    ...(这里存放配置)
}

当text-do为真的时候,执行里面的括号里面的配置(注意:括号与前面的if之间需保持一个空格,有的时候可能会报错)
看以下几个例子
1、可以用=和!=来比较变量和字符串

if ($request_method = GET){
    return 503;
}

2、可以使用正则来匹配处理,~ 代表的区分大小写 ~* 不区分大小写 !~ 表示区分大小写并把匹配结果取反;同理,!~*表示不区分大小写并把最终匹配结果取反,可以用小括号捕获值,还可以用$1...$9来得到对应值

if($http_user_agent ~ MSIE) {
    ## 检测浏览器用户代理是否包含MSIE这个字符串
}
 
 
if($http_cookie ~* "id=([^;]+)(?:|$)"){
    ## Nginx 配置,可以使用$1, $2来获取对应匹配的值,如
    ## set $id $1;         将捕获的结果保存在$id中,以便后续使用
}

3、请求资源文件
···
if(-e $request_filename)
## 判断请求文件或者目录是否存在
}

变量名 说明 例子
-f 判断请求的文件是否存在,如果存在,则为true;在其前加上"!"即表示取反 id=1&type=3
-d 请求的目录是否存在;在其前加上"!"即表示取反
-e 判断请求的目录或文件是否存在,如果存在,则为true。
-x 判断当前请求文件是否为可执行文件。

if(!-e $request_filename){
## 判断请求的文件或者目录是否不存在
}
···

变量名 说明 例子
-f 判断请求的文件是否存在,如果存在,则为true;在其前加上"!"即表示取反 id=1&type=3
-d 请求的目录是否存在;在其前加上"!"即表示取反
-e 判断请求的目录或文件是否存在,如果存在,则为true。
-x 判断当前请求文件是否为可执行文件。

三、break指令

break指令用来终止当前相同作用域下的其后的Nginx配置。Nginx服务器在根据配置处理请求的过程中遇到这个指令时,会回到上一层作用域,继续向下读取配置;也就是说在同一作用域下的Nginx配置,位于该指令之后,都将失效
实例:

location / {
    if ($slow){                  ## 产生作用域
        set $id $1;              ## 位于break之前,有效
        break;
        limit_rate 10k;          ## 位于break之后,配置无效
    }
 
    ## Nginx其他配置(依旧有效)
}

四、return指令

return指令用于完成对请求的处理,可以直接向客户端返回响应状态代码。所有处理该指令后的Nginx都将无效。该指令通常在server块和location块配合if指令使用,具体语法如下:

return [text];
return code URL;
return URL;

code,返回给客户端的状态码。可以为0~999之前的任意HTTP状态码(非标准的444可以强制关闭服务器与客户端之间的连接)。
text, 为返回给客户端的响应体内容,支持使用变量。
URL,返回给客户端一个URL地址

通常会配置return指令来处理域名重定向,代码如下:

if ($true){
    return 301 http://www.lyblog.net
}

五、rewrite指令

该指令通过正则表达式的使用来改变URI。可以同时存在一个或多个指令,按照顺序依次对URL进行匹配和处理。
可以在server块或location中使用,如下格式:

rewrite regex replacement [flag];
regex,用于匹配URI的正则表达式。使用括号"()"标记要截取的内容。

regex 只能接受到$document_uri(如上面的示例url http://www.yllin.com:5055/user/index?id=1&type=3,只能接收到 /user/index)

replacement,匹配成功后用于替换URI中被截取内容的字符串。默认情况下,如果该字符串是由"http://"或"https://"开头,则不会继续向下对URI进行其他处理,而是直接将重写后的URI返回给客户端。
1、可以在if中使用,

if ($host = 'www.yllin.cn') {
    rewrite ^.*$ http://www.baidu.com$request_uri? permanent;
}
flag,用来设置rewrite对URI的处理行为,可以为以下标志中的任意一个。

①last
终止在本location块中处理接收到的URI,并将处理后的URI作为一个新的URI,使用各location块进行处理。该标志将重写后的URI重新在server块中执行,为重写后的URI提供了转入到其他location块的机会。如下

location / {
             if (!-e $request_filename){
                 rewrite . /router.php last;
             }
             #autoindex  on;
        }

上面的意思是,如果当前的url没有找到目录或者文件,就 替换成 /router.php
http://www.yllin.com:5055/user/index?id=1&type=3 会比默认替换成
http://www.yllin.com:5055/router.php?id=1&type=3进行请求
②break
将此处理重写的URI作为新的URI,在本块中继续进行处理。该标识将重写后的地址在当前的location块中执行,不会将新的URI转向其他location块中。请看如下示例:

location /lyblog/ {
    rewrite ^(/lyblog/.*)/media/(.*)\..*$ $1/mp3/$2.mp3 break;
    rewrite ^(/lyblog/.*)/audio/(.*)\..*$ $1/mp3/$2.ra break;
}

如果URI在第2行匹配成功并处理,Nginx服务器将新的URI继续在location中执行第3行规则中匹配处理,新的URI始终在同一个location块中。
③redirect,
将重写后的URI返回给客户端,状态码为302,指明是临时重定向URI,主要用在replacement变量不是以"http://"或"https://"情况。
④permanent
将重写后的URI返回给客户端,状态码为301,表示永久跳转。

六、set 指令

set指令主要是用来设置变量,其语法结构为:

set variable value

variable,变量名,必须以"$"符号作为变量的第一个字符,且不能与Nginx预设的变量同名
value,为变量赋值,可以为字符串,其他变量或变量组合

七、域名跳转

## 示例1
...
server {
    listen 80;
    server_name lyblog.net;
    rewrite ^/ http://www.lyblog.net/;             ## 域名跳转
    ...
}
...
 
## 示例2
...
server {
    listen 80;
    server_name lyblog.net www.lyblog.net;
    if ($host ~ myweb\.net){
        rewrite ^(.*) http://www.lyblog.org$1 permanent;          ## 多域名跳转
    }
}
 
 
## 示例3
...
server {
    listen 80;
    server_name demo1.lyblog.net demo2.lyblog.net;
    if ($http_host ~* ^(.*)\.lyblog\.net$){
        rewrite ^(.*) http://demo.lyblog.net$1;                     ## 三级域名的跳转
    }
}

八、域名镜像

镜像网站是指将一个完全相同的网站分别放置到几个服务器上,并分别使用独立的URL,其中一个服务器上的网站叫主站,其他的都为镜像网站。镜像站就可以看作是主站的一个副本。可以在主站存在问题时,作备份服务器使用。另外,也可以提高不同地区网站的响应速度。镜像网站可以响应网站流量负载,解决网络带宽封锁等问题。

Nginx中的Rewrite功能可以轻松实现域名镜像的跳转。实现原理很简单,也就是把不同镜像URL重写到指定的URL就可以了。以下是示例配置:

server {
    ...
    listen 80;
    server_name google.lyblog.net;
    rewrite ^(.*) http://www.google.com$1 last;
}
server {
    ...
    listen 81;
    server_name bings.lyblog.net;
    rewrite ^(.*) http://bings.cn$1 last;
}

当然,我们也可以为某一个目录下镜像,实现如下:

server {
    listen 80;
    server_name cdn.lyblog.net;
    location ^~ /source {
        ...
        rewrite ^/source(.*) http://cdn.google.com/websrc2$1 last;
    }
}
 
server {
    listen 81;
    server_name cdn1.lyblog.net;
    rewrite ^(.*) http://cdn.baidu.com/
 
    location ^~ /source2 {
        ...
        rewrite ^/source2(.*) http://cdn.baidu.com/websrc2$1 last;
    }
}

九、目录前自动添加"/"

如果网站设定了默认资源文件,那么客户端访问时可以不加具体的资源文件名。如,你访问:http://www.yllin.cn时,直接就可以访问到"/index.html"文件。

如果访问一个二级目录,如:http://www.yllin.cn/user/index.html;则如果直接输入http://www.yllin.cn/user可能无法访问,必须在后面加上斜线http://www.yllin.cn/user/。像这种情况,也不可能去要求用户这么输入,可以通过Rewrite功能为末尾没有斜杠"/":

server {
    ...
    listen 81;
    server_name www.yllin.cn;
    location ^~ /bbs {
        ...
        if (-d $request_filename){
            rewrite ^/(.*)([^/])$ http://$host/$1$2/ permanent;
        }
    }
}

十、目录合并

搜索引擎优化是一种利用搜索引擎的索引规则来提高网站排名。其中目录也是增强SEO的一种手段。如一个网站的路径如下:

[root]/server/12/34/56/78/9.html

如果用户访问这个资源,则URL也必须写成http://www.yllin.com/server/12/34/56/78/9.html;这非常利于SEO,并且对用户的输入也存在难度。对于以上URL,可以改写成http://www.yllin.com/server/12-34-56-78-9.html,具体配置如下:

server {
    ...
    listen 80;
    server_name www.yllin.com;
    location ^~ /server {
        ...
        rewrite ^/server-([0-9]+)-([0-9]+)-([0-9]+)-([0-9]+)-([0-9]+)\.html$ /server/$1/$2/$3/$4/$5.html last;
        break;
    }
 
}

十一、防盗链

盗链是一种损害原始网站合法利益,给原服务器造成额外负担。首先了解一下防盗链的原理。

客户端向服务器请求资源时,为了减少网络带宽,提高响应速度,服务器一般不会一次把所有资源完整的传给客户端。如,请求一个网页,首先传回网页文本文件,当服务器解析网页时,再开始下载资源文件,如图片,样式表,可执行脚本。如果这些资源文件不是放在该服务器上,而在其他服务器上。这就构成了盗链。

要防止盗链,需要了解HTTP协议中的请求头部的Referer头域和采用URL的格式表示访问当前网页或者文件的源地址。通过头域的值,可以检测到访问目标资源的源地址。这样,如果检测到Referer头域中的值并不是自己站点内的URL,就采取阻止措施,实现防盗链的目的。但是,Referer头域的值是可以更改的,因此该方法不能够完全阻止所有盗链。

Nginx配置中有一个指令 valid_referers,用来获取 Referer 头域中的值,并且根据该值的情况给$invalid_referer变量赋值。如果 Referer 头域中没有符合 valid_referers 指令配置的值,则$invalid_referer 变量将会被赋值为1。valid_referers 指令的语法结构为:

valid_referers none | blocked | server_names | string ...;

none,检测Referer头域不存在的情况
blocked,检测Referer头域的值被防火墙或代理服务器删除或伪装的情况。这种情况下,该头域的值不以"http://"或者"https://"开头
server_names,设置一个或多个URL,检测Referer头域的值是否是这些URL中的某个。在Nginx 0.5.33以后支持使用通配符"*"

有了valid_referers指令和$invalid_referer变量,配合Rewrite功能就可以实现防盗链。有两种实现方案:1、根据资源文件类型;2、根据请求的目录

以下是根据资源文件类型:

server {
    ...
    listen 80;
    server_name www.yllin.com;
    location ~* ^.+\.(gif|jpg|png|swf|flv|rar|zip)$ {
        ...
        valid_referers none blocked server_names *.lyblog.net;
        if ($invalid_referer){
            rewrite ^/ http://www.yllin.com/images/default.jpg;
        }
    }
 
}

下面是根据目录实现防盗链的配置:

server {
    ...
    listen 80;
    server_name www.yllin.com;
    location /file/ {
        ...
        root /server/file/;
        valid_referers none blocked server_names *.myblog.net;
 
        if($invalid_referer){
            rewrite ^/ http://www.yllin.com/images/default.jpg;
        }
    }
 
}

参考来源 https://www.lyblog.net/detail/600.html

你可能感兴趣的:(Nginx的Rewrite学习)