nginx rewrite学习笔记

一、什么是Rewrite

 

 

  Rewrite对称URL Rewrite,即URL重写,就是把传入Web的请求重定向到其他

  URL的过程。URL Rewrite最常见的应用是URL伪静态化,是将动态页面显示为静态页

  面方式的一种技术。比如http://www.123.com/news/index.asp?id=123 使用

  URLRewrite 转换后可以显示为 http://www.123.com/news/123.html

  对于追求完美主义的网站设计师,就算是网页的地址也希望看起来尽量简洁明快。形如

  http://www.123.com/news/index.asp?id=123的网页地址,自然是毫无美感可言,而用

  UrlRewrite技术,你可以轻松把它显示为 http://www.123.com/news/123.html。

  理论上,搜索引擎更喜欢静态页面形式的网页,搜索引擎对静态页面的评分一般要高于

  动态页面。所以,UrlRewrite可以让我们网站的网页更容易被搜索引擎所收录。

  从安全角度上讲,如果在url中暴露太多的参数,无疑会造成一定量的信息泄漏,可能

  会被一些黑客利用,对你的系统造成一定的破坏,所以静态化的url地址可以给我们带来更

  高的安全性。

二、Rewrite相关指令

 

  Nginx Rewrite相关指令有ifrewritesetreturn等。

  if 的语法 应用于 server和location环境内

  if (condition) { … }

  if可以支持如下条件判断匹配符号

  ~ 为区分大小写匹配

  ~* 为不区分大小写匹配

  !~和!~*分别为区分大小写不匹配及不区分大小写不匹配

 

  -f 和!-f 用来判断是否存在文件

  -d 和!-d 用来判断是否存在目录

  -e 和!-e 用来判断是否存在文件或目录

  -x 和!-x 用来判断文件是否可执行

  在匹配过程中可以引用一些Nginx的全局变量,更多的变量请参考

  http://wiki.nginx.org/NginxHttpCoreModule 的 Variables 部分

  $args, 请求中的参数;

  $document_root, 针对当前请求的根路径设置值;

  $host, 请求信息中的"Host",如果请求中没有Host行,则等于设置的服务器名;

  $limit_rate, 对连接速率的限制;

  $request_method, 请求的方法,比如"GET"、"POST"等;

  $remote_addr, 客户端地址;

  $remote_port, 客户端端口号;

  $remote_user, 客户端用户名,认证用;

  $request_filename, 当前请求的文件路径名

  $query_string, 与$args相同;

  $scheme, 所用的协议,比如http或者是https

  $server_protocol, 请求的协议版本,"HTTP/1.0"或"HTTP/1.1";

  $server_addr, 服务器地址,如果没有用listen指明服务器地址,使用这个变量将发起一次系统调用

  以取得地址(造成资源浪费);

  $server_name, 请求到达的服务器名;

  $document_uri 与$uri一样,URI地址;

  $server_port, 请求到达的服务器端口号;

  看了一大堆也许会有点晕,当然有时晕着晕着也就习惯了。不过我们还是先来看两个例

  子。这样更有助于理解。

  例 匹配访问的url地址是否是个目录

  if (-d $request_filename) {

  …;

  }

  例 匹配访问的地址是否以www开头

  if ($hosts ~* ^www) {

  …;

  }

  rewrite 指令根据表达式来重定向URI,或者修改字符串。可以应用于server,

  location, if环境下 每行rewrite指令最后应该根一个flag标记,支持的flag标记有

  last 相当于Apache里的[L]标记,表示完成rewrite

  break 本条规则匹配完成后,终止匹配,不再匹配后面的规则

  redirect 返回302临时重定向,浏览器地址会显示跳转后的URL地址

  permanent 返回301永久重定向,浏览器地址会显示跳转后URL地址

  last和break标记的区别在于,last标记在本条rewrite规则执行完后,会对其所在的

  server { … } 标签重新发起请求,而break标记则在本条规则匹配完成后,停止匹配,不

  再做后续的匹配。另有些时候必须使用last,比如在使用alias指令时,而使用proxy_pass

  指令时则必须使用break。

  例:以下这段rewrite会导致死循环

  location /abc/ {

  rewrite “^/abc/(.*)\.html$” /abc/index.html last;

  }

  我们应该将上面的last改成break以避免死循环。

  redirect和 permanent区别则是返回的不同方式的重定向,对于客户端来说一般状态

  下是没有区别的。而对于搜索引擎,相对来说301的重定向更加友好,如果我们把一个地址

  采用301跳转方式跳转的话,搜索引擎会把老地址的相关信息带到新地址,同时在搜索引擎

  索引库中彻底废弃掉原先的老地址。

  使用302重定向时,搜索引擎(特别是google)有时会查看跳转前后哪个网址更直观,

  然后决定显示哪个,如果它觉的跳转前的URL更好的话,也许地址栏不会更改,那么很有

  可能出现URL劫持的现像。

  我们在做URI重写时,有时会发现URI中含有相关参数,如果需要将这些参数保存下

  来,并且在重写过程中重新引用,我们可以用到 () 和 $N 的方式来解决。

  例:匹配访问的url地址是否是个目录,如果是则自动加个 /

  if (-d $request_filename) {

  rewrite ^/(.*)([^/])$ http://$host/$1$2/ permanent;

  }

  例:用户访问的网址为www.test.com/abc.html 重写后真实地址是

  www.test.com/login.php?user=abc

  location ~* /php/.*\.html$ {

  rewrite /php/(.*)\.html /login.php?user=$1 last;

  }

  例:用户访问地址为/uplook/11-22-33.html重写后真实地址为

  /uplook/11/22/33.html

  location /uplook/ {

  rewrite /uplook/([0-9]+)-([0-9]+)-([0-9]+).html /uplook/$1/$2/$3.html last;

  }

  set 指令是用于定义一个变量,并且赋值。应用于server,location,if环境。

  语法格式为: set $变量名 变量值

  例:当访问任意目录下的whoami.html都重定向到 /who.html

  location ~* .*/whoami\.html$ {

  set $who 'who.html';

  rewrite .* /$who break;

  }

  return 指令用于返回状态码给客户端,应用于server,location,if环境。

  例:如果访问的 .sh 结尾的文件则返回403操作拒绝错误

  location ~* .*\.sh$ {

  return 403;

  }

 

 

 

你可能感兴趣的:(rewrite)