Nginx中的location匹配与rewrite重写跳转

文章目录

  • 前言
  • 一、rewrite跳转实现
  • 二、rewrite执行顺序
  • 三、rewrite跳转场景
  • 四、语法与flg标记说明
  • 五、Nginx常用的正则表达式符号
  • 六、location
    • 1.分类
    • 2.常用匹配规则
    • 3.优先级
    • 4.示例
    • 5.匹配规则定义
  • 总结:

前言

  • rewrite功能就是使用nginx提供的全局变量或自己设置的变量,结合正则表达式和标记实现URL重写以及重定向
    例如:更换域名后需要保持旧的域名能够转到新的域名上、某网页发生改变需要跳转到新的页面、网站防盗链等等需求

  • rewrite只能放在server{},location{},if{}中,并且默认只能对域名后面的除去传递的参数外的字符串起作用
    例如:http://www.xjj.com/a/we/index.php?id=1&u=str 只对/a/we/index.php重写

一、rewrite跳转实现

  • Nginx:通过ngx_http_rewrite_module模块支持URL重写、支持if条件判断,但不支持else
  • 跳转:从一个location跳转到另一个location,循环最多可以执行10次,超过后nginx将返回500错误
  • PCRE支持:perl兼容正则表达式的语法规则匹配
  • 重写模块set指令:创建新的变量并为其赋值

二、rewrite执行顺序

①执行server快里面的rewriter指令

②执行location匹配

③执行选定的location中的rewrite指令

三、rewrite跳转场景

  • 调整用户浏览的URL,看起来更规范,合乎开发及产品人员的需求
  • 为了让搜索引擎搜录网站内容及用户体验更好,企业会将动态URL地址伪装成静态地址提供服务
  • 网址换新域名后,让旧的访问跳转到新的域名上;例如,访问京东的 360buy.com 会跳转到 jd.com
  • 服务端某些业务调整,比如根据特殊变量、目录、客户端的信息进行URL调整等

四、语法与flg标记说明

语法rewrite <regex> <replacement> [flag];
regex:表示正则匹配规则
replacement:表示跳转后的内容
flag:表示 rewrite 支持的 flag 标记

flag标记说明:

last :本条规则匹配完成后,继续向下匹配新的location URI规则,一般用在 server 和 if 中
break :本条规则匹配完成即终止,不再匹配后面的任何规则,一般使用在 location 中
redirect :返回302临时重定向,浏览器地址会显示跳转后的URL地址
permanent :返回301永久重定向,浏览器地址栏会显示跳转后的URL地址

五、Nginx常用的正则表达式符号

符号 描述
^ 匹配输入字符申的起始位置
$ 匹配输入字符串的结束位置
* 匹配前面的字符零次或多次
+ 匹配前面的字符一次或多次
匹配前面的字符零次或一次
. 匹配除"\n"之外的任何单个字符
\ 将后面接着的字符标记为一个特殊字符或一个原义字符或一个向后引用
\d 匹配纯数字
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
[] 定义匹配的字符范围
[c] 匹配单个字符
[a-z] 匹配a-z小写字母的任意一个
[a-zA-Z0-9] 匹配所有大小写字母或数字
() 表达式的开始和结束位置
| 或运算符

六、location

1.分类

location大致可以分为以下三类:

  1. 精准匹配:location = / {…}
  2. 一般匹配:location / {…}
  3. 正则匹配:location ~ / {…}

2.常用匹配规则

符号 描述
= 进行普通字符精准匹配,也就是完全匹配
^~ 表示普通字符匹配,使用前缀匹配;如果匹配成功,则不再匹配后续location
~ 区分大小写的匹配
~* 不区分大小写的匹配
!~ 区分大小写的匹配取非
!~* 不区分大小写的匹配取非

3.优先级

  1. 首先精准匹配 =
  2. 其次前缀匹配 ^~
  3. 其次是按文件中顺序的正则匹配 ~ 或 ~*
  4. 然后是匹配不带任何修饰的前缀匹配,即一般匹配
  5. 最后交给 / 通用匹配,优先级最低

4.示例

  1. localtion = / {}
    =为精准匹配 /,主机名后面不能带任何字符串,比如访问 / 和 /xcf,则 / 匹配,/xcf 不匹配
  2. location / {}
    因为所有的地址都以 / 开头,所以这条规则将匹配到所有的请求,比如访问 / 和 /data,则 / 匹配,/data也匹配
    但若后面是正则表达式,则会和最长字符串优先匹配(最长匹配)
  3. location /documents/ {}
    匹配任何以 /documents/ 开头的地址,匹配符合以后,还要继续往下搜索其它 location
  4. location /documents/abc {}
    匹配任何以 /documents/abc 开头的地址,匹配符合后,还要继续往下搜索其他 location
    只有其他 location 后面的正则表达式没有匹配到时,才会采用这一条
  5. location ^~ /images/ {}
    匹配任何以 /images/ 开头的地址,匹配符合以后,停止往下搜索正则,并采用这条
  6. location ~* .(gif|jpg|jpeg)$ {}
    匹配所有以 gif、jpg、jpeg 为结尾的请求
    然而,所有请求 /images/ 下的图片会被 location ^~ /images/ 处理,因为 ^~ 的优先级更高,所以到达不了这一条正则
  7. location /images/abc {}
    最长字符匹配到 /images/abc,优先级最低,继续往下搜索其它 location,会发现 ^~ 和 ~ 存在
  8. location ~ /images/abc {}
    匹配以 /images/abc 开头的,优先级次之,只有去掉 location ^~ /images 才会采用这一条
  9. location /images/abc/1.html {}
    匹配 /images/abc/1.html 文件,如果和正则 ~ /images/abc/1.html 相比,正则优先级更高
  10. 优先级总结:
    (location = 完整路径) > (location ^~ 路径) > (location ,* 正则顺序) > (location 部分起始路径) > (location /)

5.匹配规则定义

①第一个必选规则:
直接匹配网站根,通过域名访问网站首页比较频繁,使用这个会加速处理,比如说官网
可以是一个静态首页,也可以直接转发给后端应用服务器

location / {
     
    root
    html;
    index
    index.html index.html;
}

②第二个必选规则:
处理静态文件请求,这是nginx作为http服务器的强项
有两种配置模式,目录匹配或后缀匹配,任选其一或搭配使用

location ^~ /static/ {
     
    root /webroot/static/;
}

location ~* \.(html|gif|jpg|jpeg|png|css|js|ico)$ {
     
    root /webroot/res/ ;
}

③第三个必选规则:
就是通用规则,比如用来转发带.php、.jsp后缀的动态请求到后端应用服务器
非静态文件请求就默认是动态请求

location / {
     
    proxy_ pass http://tomcat_server;

总结:

比较rewrite和location

相同点:都实现跳转

不同点:rewrite是在同一域名内更改获取资源的路径

location是对一类路径做控制访问或反向代理,还可以proxy_pass到其他机器

  • rewrite会写在location里,执行顺序
    • 执行server块里面的rewrite指令
    • 执行location匹配
    • 执行选定的location中的rewrite指令

你可能感兴趣的:(web服务器集群,nginx,正则表达式,php)