Apache中的. htaccess文件

RewriteCond  Syntax: RewriteCond TestString CondPattern [flags]     RewriteCond 指令定义一条规则条件。在一条 RewriteRule 指令前面可能会有一条或多条 RewriteCond 指令,只有当自身的模板 (pattern) 匹配成功且这些条件也满足时规则才被应用于当前 URL 处理。      TestString 是一个字符串,除了包含普通的字符外,还可以包括下列的可扩展结构:
1.        $N,RewriteRule 后向引用,其中 (0 <= N <= 9)     $N 引用紧跟在 RewriteCond 后面的 RewriteRule 中模板中的括号中的模板在当前 URL 中匹配的数据。
2.        %N,RewriteCond 后向引用,其中 (0 <= N <= 9)     %N 引用最后一个 RewriteCond 的模板中的括号中的模板在当前 URL 中匹配的数据。
3.        ${mapname:key|default},RewriteMap 扩展 具体参见 RewriteMap
4.        %{ NAME_OF_VARIABLE } , 服务器变量。   变量的名字如下表(分类显示)

 

HTTP headers:
connection & request:
server internals:
system stuff:
HTTP_USER_AGENT
REMOTE_ADDR
DOCUMENT_ROOT
TIME_YEAR
HTTP_REFERER
REMOTE_HOST
SERVER_ADMIN
TIME_MON
HTTP_COOKIE
REMOTE_USER
SERVER_NAME
TIME_DAY
HTTP_FORWARDED
REMOTE_IDENT
SERVER_ADDR
TIME_HOUR
HTTP_HOST
REQUEST_METHOD
SERVER_PORT
TIME_MIN
HTTP_PROXY_CONNECTION
SCRIPT_FILENAME
SERVER_PROTOCOL
TIME_SEC
HTTP_ACCEPT
PATH_INFO
SERVER_SOFTWARE
TIME_WDAY
QUERY_STRING
TIME
AUTH_TYPE

5.       

 

specials:
说明
API_VERSION
Apache 与模块间的接口的版本号
THE_REQUEST
客户端发送到来的 HTTP 请求行的整行信息,不含其它的头字段信息,如( "GET /index.html HTTP/1.1")
REQUEST_URI
HTTP 请求行中请求的资源
REQUEST_FILENAME
请求中对应的服务器本地文件系统中全路径文件名
IS_SUBREQ
根据是否为 SubRequest, 分别值为 ”true” ”false”

6.        特别说明:
o         SCRIPT_FILENAME REQUEST_FILENAME 变量含有相同的值,也就是 Apache 服务器内部数据结构 request_rec filename 字段的值。第一个变量是一个 CGI 变量,而第二个则与 REQUEST_URI( 含有 request_rec 数据结构中 uri 字段的值 ) 保持一致。
o         %{ENV:variable} 中的 variable 可以是任何环境变量的名字。对其值的查找,先通过 Apache 内部的数据结构,(如找不到)再在 Apache 服务器进程中通过 getenv() 查找。
o         %{HTTP:header} 中的 header 可以是任何 HTTP MIME-header 的名字,其值通过查找 HTTP 请求信息而得。
o         %{LA-U:variable}  用来引用后续 API 阶段中定义的、当前还不知道的值,具体实现是通过执行一个基于 URL 的内部的 sub-request 来决定的 variable 的最终的值。例如,假如你想在服务器范围内利用 REMOTE_USER 的值来完成重写,但这个值是在验证阶段设置的,而验证阶段是在 URL 转换阶段的后面。从另一方面讲,由于 mod_rewrite 在修补 (fixup)API 阶段进行目录范围的重写,而修补阶段在验证阶段的后面,所以此时只要用 %{REMOTE_USER} 就可以取得该值了。
o         %{LA-F:variable} ,执行一个基于文件名字 (filename) 的内部 sub-request 来决定 variable 的最终的值。大多数时间内,这和 LA-U 相同。
   CondPattern 是一个条件模板,也就是说,是一个扩展正则式( extended regular expression ),用与跟 TestString 进行匹配。作为一个标准的扩展正则式, CondPattern 有以下补充:
1.        可以在模板串前增加一个 ! 前缀,以用表示不匹配模板。但并不是所有的 test 都可以加!前缀。
2.        CondPattern 中可以使用以下特殊变量:
o         '<CONDPATTERN' ( 小于,基于字母顺序 condPattern 当作一个普通字符串,将它和 TestString 进行比较,当 TestString  的字符小于 CondPattern 为真 .
o         '>CondPattern' ( 大于 condPattern 当作一个普通字符串,将它和 TestString 进行比较,当 TestString  的字符大于 CondPattern 为真 .
o         '=CondPattern' ( 等于 condPattern 当作一个普通字符串,将它和 TestString 进行比较,当 TestString  CondPattern 完全相同时为真 . 如果 CondPattern 只是  "" ( 两个引号紧挨在一起 此时需 TestString  为空字符串方为真 .
o         '-d' ( 是否为目录 testString 当作一个目录名,检查它是否存在以及是否是一个目录 .
o         '-f' ( 是否是 regular file)  testString 当作一个文件名,检查它是否存在以及是否是一个 regular 文件 .
o         '-s' ( 是否为长度不为 0 regular 文件 testString 当作一个文件名,检查它是否存在以及是否是一个长度大于 0 regular 文件
o         '-l' ( 是否为 symbolic link)  testString 当作一个文件名,检查它是否存在以及是否是一个  symbolic link.
o         '-F' ( 通过 subrequest 来检查某文件是否可访问 检查 TestString 是否是一个合法的文件,而且通过服务器范围内的当前设置的访问控制进行访问。这个检查是通过一个内部 subrequest 完成的 因此需要小心使用这个功能以降低服务器的性能。
o         '-U' ( 通过 subrequest 来检查某个 URL 是否存在 检查 TestString 是否是一个合法的 URL ,而且通过服务器范围内的当前设置的访问控制进行访问。这个检查是通过一个内部 subrequest 完成的 因此需要小心使用这个功能以降低服务器的性能。
   [flags] 是第三个参数,多个标志之间用逗号分隔。
1.        'nocase|NC' ( 不区分大小写   在扩展后的 TestString CondPattern 中,比较时不区分文本的大小写。注意,这个标志对文件系统和 subrequest 检查没有影响 .
2.        'ornext|OR' ( 建立与下一个条件的或的关系   默认的情况下,二个条件之间是 AND 的关系,用这个标志将关系改为 OR 。例如: RewriteCond %{REMOTE_HOST} ^host1.* [OR] RewriteCond %{REMOTE_HOST} ^host2.* [OR] RewriteCond %{REMOTE_HOST} ^host3.* RewriteRule ...  如果没有 [OR] 标志,需要写三个条件 / 规则 .
例子:根据客户端浏览器的不同,返回不同的首页面。  RewriteCond %{HTTP_USER_AGENT} ^Mozilla.* RewriteRule ^/$ /homepage.max.html [L] RewriteCond %{HTTP_USER_AGENT} ^Lynx.* RewriteRule ^/$ /homepage.min.html [L] RewriteRule ^/$ /homepage.std.html [L]

当你在地址栏里输入 sina.com.cn  google.cn

看看有什么变化?是不是会自动跳转到www.sina.com.cnwww.google.cn

这一技术通过apache的rewrite可以实现,当然你得把 不带www的域名指向你服务器的IP

 要是虚拟主机的话,得在viralhost段加入 ServerAlias xxx.com

然后打开重写引擎功能

 RewriteEngine On

能过rewritecond判断主机名是否带www

RewriteCond %{HTTP_HOST}  ^xxx\.com$ [NC]

然后来一条

RewriteRule ^/(.*)$ http://www.xxx.com/$1[R=301,L]

OK,重起apache,现在在浏览器中输入 xxx.com 看看是不是自动变成了www.xxx.com了呢。

重新整理一下就是:

RewriteEngine On

RewriteCond %{HTTP_HOST} ^xxx\.com$ [NC]

RewriteRule ^/(.*)$ http://www.xxx.com/$1[R=301,L]

 

APACHE REWRITE实现URL的跳转和域名跳转

Rewirte主要的功能就是实现URL的跳转,它的正则表达式是基于Perl语言。可基于服务器级的(httpd.conf)和目录级 的 (.htaccess)两种方式。如果要想用到rewrite模块,必须先安装或加载rewrite模块。方法有两种一种是编译apache的时候就直接 安装rewrite模块,别一种是编译apache时以DSO模式安装apache,然后再利用源码和apxs来安装rewrite模块。

基于服务器级的(httpd.conf)有两种方法,一种是在httpd.conf的全局下直接利用RewriteEngine on来打开rewrite功能;另一种是在局部里利用RewriteEngine on来打开rewrite功能,下面将会举例说明,需要注意的是,必须在每个virtualhost里用RewriteEngine on来打开rewrite功能。否则virtualhost里没有RewriteEngine on它里面的规则也不会生效。

基于目录级的(.htaccess),要注意一点那就是必须打开此目录的FollowSymLinks属性且在.htaccess里要声明 RewriteEngine on。

2、举例说明:

例一.下面是在一个虚拟主机里定义的规则。功能是把client请求的主机前缀不是www.9streets.cn和202.91.246.20都 跳转到主机前缀为http://www.9streets.cn,避免相 同内容的网页有多个指向的域名,如http://9strees.cn

NameVirtualHost 202.91.246.20:80
ServerAdmin [email protected]
DocumentRoot “/web”
ServerName 9streets.cn

RewriteEngine on #打开rewirte功能
RewriteCond %{HTTP_HOST} !^www.9streets.cn [NC] #声明Client请求的主机中前缀不是www.9streets.cn, 其中 [NC] 的意思是忽略大小写
RewriteCond %{HTTP_HOST} !^202.91.246.20 [NC] #声明Client请求的主机中前缀不是202.91.246.20,其中 [NC] 的意思是忽略大小写
RewriteCond %{HTTP_HOST} !^$ #声明Client请求的主机中前缀不为空
RewriteRule ^(.*) http://www.kiya.cn/ [L] #含义是如果Client请求的主机中的前缀符合上述条件,则直接进行跳转到http://www.kiya.cn/,[L]意味着立即停止重写操作,并 不再应用其他重写规则。这里的.*是指匹配所有URL中不包含换行字符,()括号的功能是把所有的字符做一个标记,以便于后面的应用.就是引用前面里的 (.*)字符。

例二.将输入 efou.net 的域名时跳转到http:www.9streets.cn

RewriteEngine on
RewriteCond %{HTTP_HOST} ^efou.net [NC]
RewriteRule ^(.*) http://www.9streets.cn/ [L]

例三.赛卡软件近期更换了域名,新域名为www.sicasoft.com, 更加简短好记。这时需要将原来的域名ss.kiya.cn, 以及论坛所在地址ss.kiya.cn/bbs/定向到新的域名,以便用户可以找到,并且使原来的论坛 URL 继续有效而不出现 404 未找到,比如原来的http://ss.kiya.cn/bbs/tread-60.html, 让它在新的域名下继续有效,点击后转发到http://bbs.sicasoft.com/tread-60.html,而其他网页,如原先的http: //ss.kiya.cn/purchase不会到二级域名bbs.sicasoft.com/purchase上,而是到 www.sicasoft.com/purchase
按照这样的要求重定向规则应该这样写:

RewriteEngine On
RewriteCond %{REQUEST_URI} ^/bbs/
RewriteRule ^bbs/(.*) http://bbs.sicasoft.com/$1 [R=permanent,L]
RewriteCond %{REQUEST_URI} !^/bbs/
RewriteRule ^(.*) http://www.sicasoft.com/$1 [R=permanent,L]

3.Apache mod_rewrite规则重写的标志一览

1) R[=code](force redirect) 强制外部重定向
强制在替代字符串加上http://thishost[:thisport]/前缀重定向到外部的URL.如果code不指定,将用缺省的302 HTTP状态码。
2) F(force URL to be forbidden)禁用URL,返回403HTTP状态码。
3) G(force URL to be gone) 强制URL为GONE,返回410HTTP状态码。
4) P(force proxy) 强制使用代理转发。
5) L(last rule) 表明当前规则是最后一条规则,停止分析以后规则的重写。
6) N(next round) 重新从第一条规则开始运行重写过程。
7) C(chained with next rule) 与下一条规则关联

如果规则匹配则正常处理,该标志无效,如果不匹配,那么下面所有关联的规则都跳过。

 T=MIME-type(force MIME type) 强制MIME类型
9) NS (used only if no internal sub-request) 只用于不是内部子请求
10) NC(no case) 不区分大小写
11) QSA(query string append) 追加请求字符串
12) NE(no URI escaping of output) 不在输出转义特殊字符
例如:RewriteRule /foo/(.*) /bar?arg=P1%3d$1 [R,NE] 将能正确的将/foo/zoo转换成/bar?arg=P1=zoo
13) PT(pass through to next handler) 传递给下一个处理
例如:
RewriteRule ^/abc(.*) /def$1 [PT] # 将会交给/def规则处理
Alias /def /ghi
14) S=num(skip next rule(s)) 跳过num条规则
15) E=VAR:VAL(set environment variable) 设置环境变量

4.Apache rewrite例子集合

URL重定向

例子一:
同时达到下面两个要求:
1.用http://www.9streets.cn/xxx.php 来访问http://www9streets.cn/xxx/
2.用http://vote.9streets.cn 来访问 http://www.9streets.cn/user.php?username=vote的功能

RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.zzz.com
RewriteCond %{REQUEST_URI} !^user.php$
RewriteCond %{REQUEST_URI} .php$
RewriteRule (.*).php$ http://www.zzz.com/$1/ [R]
RewriteCond %{HTTP_HOST} !^www.zzz.com
RewriteRule ^(.+) %{HTTP_HOST} [C]
RewriteRule ^([^.]+).zzz.com http://www.zzz.com/user.php?username=$1

例子二:

/type.php?typeid=* –> /type*.html
/type.php?typeid=*&page=* –> /type*page*.html

RewriteRule ^/type([0-9]+).html$ /type.php?typeid=$1 [PT]
RewriteRule ^/type([0-9]+)page([0-9]+).html$ /type.php?typeid=$1&page=$2 [PT]

5.使用Apache的URL Rewrite配置多用户虚拟服务器

要实现这个功能,首先要在DNS服务器上打开域名的泛域名解析(自己做或者找域名服务商做)。比如,我就把 *.kiya.us和 *.kiya.cn全部解析到了我的IP地址70.40.213.183上。

然后,看一下我的Apache中关于*.kiya.us的虚拟主机的设定。

ServerAdmin [email protected]
DocumentRoot /home/www/www.kiya.us
ServerName dns.kiya.us
ServerAlias dns.kiya.us kiya.us *.kiya.us
CustomLog /var/log/httpd/osa/access_log.log” common
ErrorLog /var/log/httpd/osa/error_log.log”
AllowOverride None
Order deny,allow

#AddDefaultCharset GB2312

RewriteEngine on
RewriteCond %{HTTP_HOST} ^[^.]+.kiya.(cn|us)$
RewriteRule ^(.+) %{HTTP_HOST}$1 [C]
RewriteRule ^([^.]+).kiya.(cn|us)(.*)$ /home/www/www.kiya.us/sylvan$3?un=$1&%{QUERY_STRING} [L]

在这段设定中,我把*.kiya.cn和*.kiya.us 的Document Root都设定到了 /home/www/www.kiya.us

继续看下去,在这里我就配置了URL Rewrite规则。

RewriteEngine on #打开URL Rewrite功能
RewriteCond %{HTTP_HOST} ^[^.]+.kiya.(cn|us)$ #匹配条件,如果用户输入的URL中主机名是类似 xxxx.kiya.us 或者 xxxx.kiya.cn 就执行下面一句
RewriteRule ^(.+) %{HTTP_HOST}$1 [C] #把用户输入完整的地址(GET方式的参数除外)作为参数传给下一个规则,[C]是Chain串联下一个规则的意思
RewriteRule ^([^.]+).kiya.(cn|us)(.*)$ /home/www/dev.kiya.us/sylvan$3?un=$1&%{QUERY_STRING} [L]
# 最关键的是这一句,使用证则表达式解析用户输入的URL地址,把主机名中的用户名信息作为名为un的参数传给/home/www/dev.kiya.us 目录下的脚本,并在后面跟上用户输入的GET方式的传入参数。并指明这是最后一条规则([L]规则)。注意,在这一句中指明的重写后的地址用的是服务器上 的绝对路径,这是内部跳转。如果使用http://xxxx这样的URL格式,则被称为外部跳转。使用外部跳转的话,浏览着的浏览器中的URL地址会改变 成新的地址,而使用内部跳转则浏览器中的地址不发生改变,看上去更像实际的二级域名虚拟服务器。

设置后重启Apache服务器就大功告成了!
Update May 1, 2009

今天上网看到了有人提一个问题:

求Rewrite 防盗链正则
不允许www.im286.com www.chinaz.com 这两个网站盗链 , 其它的网站都可以盗链的规则怎么写.

论坛中的答案是:

RewriteEngine On
RewriteCond %{HTTP_REFERER} chinaz.com [NC]
RewriteCond %{HTTP_REFERER} im286.com [NC]
RewriteRule .*\.(jpg|jpeg|gif|png|rar|zip|txt|ace|torrent|gz|swf)$ http://www.xxx.com/fuck.png [R,NC,L]

Update May 7, 2009

介绍一篇文章:http://lamp.linux.gov.cn/Apache/ApacheMenu/mod/mod_rewrite.html

Update May 24, 2009

一、关于是否需要使用完全转义,比如在 RewriteCond %{HTTP_REFERER} chinaz.com [NC] 中 把 chinaz.com 改成 chinaz\.com
答案是,两者都是可以的。

二、今天在做 YOURcaddy.com (就是我去年做的PlanetCoachella的变形)的时候,在 GoDaddy 主机上无法正常转向,后来找到了问题:
在HostMonster以及我自己的机器上,是用
RewriteRule ^business/([^\.]+)$ biz/detail.php?name=$1 [L]
达到改写的。而在Godaddy主机上,是这样:
RewriteRule ^business/([^\.]+)$ /biz/detail.php?name=$1 [L]
目标文件前多了一个/
现在想想,可能是因为没有指定RewriteBase,至于到底是不是我改日再验证一下。

三、添加两个关于判断 USER AGENT 例子和自动添加.php扩展名及自动换.html到.php扩展名的例子:
1

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^MSIE [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^Opera [NC]
RewriteRule ^.* – [F,L] 这里”-”表示没有替换,浏览器为IE和Opera的访客将被禁止访问。

2

RewriteEngine On
RewriteBase /test
RewriteCond %{REQUEST_FILENAME}.php -f
RewriteRule ([^/]+)$ /test/$1.php
#for example: /test/admin => /test/admin.php
RewriteRule ([^/]+)\.html$ /test/$1.php [L]
#for example: /test/admin.html => /test/admin.php

限制目录只能显示图片
< IfModule mod_rewrite.c>
RewriteEngine on
RewriteCond %{REQUEST_FILENAME} !^.*\.(gif|jpg|jpeg|png|swf)$
RewriteRule .*$ – [F,L]
< /IfModule>

Update Jun 10, 2009

补充,关于特定文件扩展名的重写。

重写有某些扩展名的文件:
RewriteRule (.*.css$|.*.js$) gzip.php?$1 [L]
如果要排除一些扩展名:
RewriteRule !\.(js|ico|gif|jpg|JPG|png|PNG|css|pdf|swf)$ index.php

 

你可能感兴趣的:(apache)