域名跳转(重定向)、URL重写(伪静态)、动静分离(跳转域名,并接入CDN实现加速)
#依赖PCRE库
#模块:ngx_http_rewrite_module
Rwrite相关指令
#if (条件) { command } coding.net/u/aminglinux/p/nginx/git/blob/master/rewrite/if.md
#break和last coding.net/u/aminglinux/p/nginx/git/blob/master/rewrite/break.md
#return 后面跟状态码、URL、text(支持变量)coding.net/u/aminglinux/p/nginx/git/blob/master/rewrite/return.md
#rewrite规则 coding.net/u/aminglinux/p/nginx/git/blob/master/rewrite/rewrite_ruler.md
#rewrite_log定义rewrite日志 rewrite_log on; 写到error_log notice级别

===========================================================================
if指令
格式:if (条件判断) { 具体的rewrite规则 }
条件举例
条件判断语句由Nginx内置变量、逻辑判断符号和目标字符串三部分组成。
其中,内置变量是Nginx固定的非自定义的变量,如,$request_method, $request_uri等。
逻辑判断符号,有=, !=, ~, ~, !~, !~
!表示相反的意思,~为匹配符号,它右侧为正则表达式,区分大小写,而~为不区分大小写匹配。
目标字符串可以是正则表达式,通常不用加引号,但表达式中有特殊符号时,比如空格、花括号、分号等,需要用单引号引起来。
示例1
if ($request_method = POST) //当请求的方法为POST时,直接返回405状态码
{
return 405; //在该示例中并未用到rewrite规则,if中支持用return指令。
}
示例2
if ($http_user_agent ~ MSIE) //user_agent带有MSIE字符的请求,直接返回403状态码
{
return 403;
}
如果想同时限制多个user_agent,还可以写成这样
if ($http_user_agent ~ "MSIE|firefox|spider")
{
return 403;
}
示例3
if(!-f $request_filename) //当请求的文件不存在,将会执行下面的rewrite规则
{
rewrite 语句;
}
示例4
if($request_uri ~
'gid=\d{9,12}/') //\d表示数字,{9,12}表示数字出现的次数是9到12次,如gid=123456789/就是符合条件的。
{
rewrite 语句;
}

rewrite中的break和last
两个指令用法相同,但含义不同,需要放到rewrite规则的末尾,用来控制重写后的链接是否继续被nginx配置执行(主要是rewrite、return指令)。
示例1(连续两条rewrite规则):
server{
listen 80;
server_name test.com;
root /tmp/123.com;

rewrite /1.html /2.html ;
rewrite /2.html /3.html ;

}
当我们请求1.html时,最终访问到的是3.html,两条rewrite规则先后执行。

break和last在location {}外部

格式:rewrite xxxxx break;

示例2(增加break):
server{
listen 80;
server_name test.com;
root /tmp/123.com;

rewrite /1.html /2.html break;
rewrite /2.html /3.html;

}
当我们请求1.html时,最终访问到的是2.html
说明break在此示例中,作用是不再执行break以下的rewrite规则。
但,当配置文件中有location时,它还会去执行location{}段的配置(请求要匹配该location)。

示例3(break后面还有location段):
server{
listen 80;
server_name test.com;
root /tmp/123.com;

rewrite /1.html /2.html break;
rewrite /2.html /3.html;
location /2.html {
    return 403;
}

}
当请求1.html时,最终会返回403状态码,说明它去匹配了break后面的location{}配置。

以上2个示例中,可以把break替换为last,它们两者起到的效果一模一样。

当break和last在location{}里面

示例4(什么都不加):
server{
listen 80;
server_name test.com;
root /tmp/123.com;

location / {
    rewrite /1.html /2.html;
    rewrite /2.html /3.html;
}
location /2.html
{
    rewrite /2.html /a.html;
}
location /3.html
{
    rewrite /3.html /b.html;
}

}
当请求/1.html,最终将会访问/b.html,连续执行location /下的两次rewrite,跳转到了/3.html,然后又匹配location /3.html

示例5(增加break):
server{
listen 80;
server_name test.com;
root /tmp/123.com;

location / {
    rewrite /1.html /2.html break;
    rewrite /2.html /3.html;
}
location /2.html
{
    rewrite /2.html /a.html;
}
location /3.html
{
    rewrite /3.html /b.html;
}

}
当请求/1.html,最终会访问/2.html
在location{}内部,遇到break,本location{}内以及后面的所有location{}内的所有指令都不再执行。

示例6(增加last):
server{
listen 80;
server_name test.com;
root /tmp/123.com;

location / {
    rewrite /1.html /2.html last;
    rewrite /2.html /3.html;
}
location /2.html
{
    rewrite /2.html /a.html;
}
location /3.html
{
    rewrite /3.html /b.html;
}

}
当请求/1.html,最终会访问/a.html
在location{}内部,遇到last,本location{}内后续指令不再执行,而重写后的url再次从头开始,从头到尾匹配一遍规则。

结论

当rewrite规则在location{}外,break和last作用一样,遇到break或last后,其后续的rewrite/return语句不再执行。但后续有location{}的话,还会近一步执行location{}里面的语句,当然前提是请求必须要匹配该location。
当rewrite规则在location{}里,遇到break后,本location{}与其他location{}的所有rewrite/return规则都不再执行。
当rewrite规则在location{}里,遇到last后,本location{}里后续rewrite/return规则不执行,但重写后的url再次从头开始执行所有规则,哪个匹配执行哪个。

nginx的return指令
该指令一般用于对请求的客户端直接返回响应状态码。在该作用域内return后面的所有nginx配置都是无效的。
可以使用在server、location以及if配置中。
除了支持跟状态码,还可以跟字符串或者url链接。
直接返回状态码
示例1:
server{
listen 80;
server_name www.aming.com;
return 403;
rewrite /(.*) /abc/$1; //该行配置不会被执行。
}

示例2:
server {
.....

if ($request_uri ~ ".htpasswd|.bak")
{
return 404;
rewrite /(.*) /aaa.txt; //该行配置不会被执行。
}
//如果下面还有其他配置,会被执行。
.....
}

返回字符串

示例3:
server{
listen 80;
server_name www.aming.com;
return 200 "hello";
}
说明:如果要想返回字符串,必须要加上状态码,否则会报错。
还可以支持json数据

示例4:
location ^~ /aming {
default_type application/json ;
return 200 '{"name":"aming","id":"100"}';
}

也支持写一个变量

示例5:
location /test {
return 200 "$host $request_uri";
}

返回url

示例6:
server{
listen 80;
server_name www.aming.com;
return http://www.aminglinux.com/123.html;
rewrite /(.*) /abc/$1; //该行配置不会被执行。
}
注意:return后面的url必须是以http://或者https://开头的。

生成场景实战

背景:网站被黑了,凡是在百度点击到本网站的请求,全部都跳转到了一个其他网站。
通过nginx解决:
if ($http_referer ~ 'baidu.com')
{
return 200 "";
}

如果写成:
return http://$host$request_uri; 在浏览器中会提示“重定向的次数过多”。

rewrite规则

格式:rewrite regex replacement [flag]

  • rewrite配置可以在server、location以及if配置段内生效

  • regex是用于匹配URI的正则表达式,其不会匹配到$host(域名)

  • replacement是目标跳转的URI,可以以http://或者https://开头,也可以省略掉$host,直接写$request_uri部分(即请求的链接)

  • flag,用来设置rewrite对URI的处理行为,其中有break、last、rediect、permanent,其中break和last在前面已经介绍过,
    rediect和permanent的区别在于,前者为临时重定向(302),而后者是永久重定向(301),对于用户通过浏览器访问,这两者的效果是一致的。
    但是,对于搜索引擎蜘蛛爬虫来说就有区别了,使用301更有利于SEO。所以,建议replacemnet是以http://或者https://开头的flag使用permanent。

示例1

location / {
rewrite /(.) http://www.aming.com/$1 permanent;
}
说明:.
为正则表达式,用()括起来,在后面的URI中可以调用它,第一次出现的()用$1调用,第二次出现的()用$2调用,以此类推。

示例2

location / {
rewrite /.* http://www.aming.com$request_uri permanent;
}
说明:在replacement中,支持变量,这里的$request_uri就是客户端请求的链接

示例3

server{
listen 80;
server_name www.123.com;
root /tmp/123.com;
index index.html;
rewrite /(.*) /abc/$1 redirect;
}
说明:本例中的rewrite规则有问题,会造连续循环,最终会失败,解决该问题有两个方案。
关于循环次数,经测试发现,curl 会循环50次,chrome会循环80次,IE会循环120次,firefox会循环20次。

示例4

server{
listen 80;
server_name www.123.com;
root /tmp/123.com;
index index.html;
rewrite /(.*) /abc/$1 break;
}
说明:在rewrite中使用break,会避免循环。

示例5

server{
listen 80;
server_name www.123.com;
root /tmp/123.com;
index index.html;
if ($request_uri !~ '^/abc/')
{
rewrite /(.*) /abc/$1 redirect;
}
}
说明:加一个条件限制,也可以避免产生循环