guoguo1980

基于反相代理的Web缓存加速

内容摘要：
对于一个日访问量达到百万级的网站来说，速度很快就成为一个瓶颈。除了优化内容发布系统的应用本身外，如果能把不需要实时更新的动态页面的输出结果转化成静态网页来发布，速度上的提升效果将是显著的，因为一个动态页面的速度往往会比静态页面慢2－10倍，而静态网页的内容如果能被缓存在内存里，访问速度甚至会比原有动态网页有2－3个数量级的提高。

动态缓存和静态缓存的比较
基于反向代理加速的站点规划
基于apache mod_proxy的反向代理加速实现
基于squid的反向代理加速实现
面向缓存的页面设计
应用的缓存兼容性设计：
HTTP_HOST/SERVER_NAME和REMOTE_ADDR/REMOTE_HOST需要用 HTTP_X_FORWARDED_HOST/HTTP_X_FORWARDED_SERVER代替

后台的内容管理系统的页面输出遵守可缓存的设计，这样就可以把性能问题交给前台的缓存服务器来解决了，从而大大简化CMS系统本身的复杂程度。

静态缓存和动态缓存的比较

静态页面的缓存可能有2种形式：其实主要区别就是CMS是否自己负责关联内容的缓存更新管理。

静态缓存：是在新内容发布的同时就立刻生成相应内容的静态页面，比如：2003年3月22日，管理员通过后台内容管理界面录入一篇文章后，就立刻生成http://www.chedong.com/tech/2003/03/22/001.html这个静态页面，并同步更新相关索引页上的链接。
动态缓存：是在新内容发布以后，并不预先生成相应的静态页面，直到对相应内容发出请求时，如果前台缓存服务器找不到相应缓存，就向后台内容管理服务器发出请求，后台系统会生成相应内容的静态页面，用户第一次访问页面时可能会慢一点，但是以后就是直接访问缓存了。

如果去ZDNet等国外网站会发现他们使用的基于Vignette内容管理系统都有这样的页面名称：0,22342566,300458.html。其实这里的0,22342566,300458就是用逗号分割开的多个参数：
第一次访问找不到页面后，相当于会在服务器端产生一个doc_type= 0&doc_id=22342566&doc_template=300458的查询，
而查询结果会生成的缓存的静态页面： 0,22342566,300458.html

静态缓存的缺点：

复杂的触发更新机制：这两种机制在内容管理系统比较简单的时候都是非常适用的。但对于一个关系比较复杂的网站来说，页面之间的逻辑引用关系就成为一个非常非常复杂的问题。最典型的例子就是一条新闻要同时出现在新闻首页和相关的3个新闻专题中，在静态缓存模式中，每发一篇新文章，除了这篇新闻内容本身的页面外，还需要系统通过触发器生成多个新的相关静态页面，这些相关逻辑的触发也往往就会成为内容管理系统中最复杂的部分之一。
旧内容的批量更新：通过静态缓存发布的内容，对于以前生成的静态页面的内容很难修改，这样用户访问旧页面时，新的模板根本无法生效。

在动态缓存模式中，每个动态页面只需要关心，而相关的其他页面能自动更新，从而大大减少了设计相关页面更新触发器的需要。

以前做小型应用的时候也用过类似方式：应用首次访问以后将数据库的查询结果在本地存成一个文件，下次请求时先检查本地缓存目录中是否有缓存文件，从而减少对后台数据库的访问。虽然这样做也能承载比较大的负载，但这样的内容管理和缓存管理一体的系统是很难分离的，而且数据完整性也不是很好保存，内容更新时，应用需要把相应内容的的缓存文件删除。但是这样的设计在缓存文件很多的时候往往还需要将缓存目录做一定的分布，否则一个目录下的文件节点超过3000，rm *都会出错。

这时候，系统需要再次分工，把复杂的内容管理系统分解成：内容输入和缓存这2个相对简单的系统实现。

后台：内容管理系统，专心的将内容发布做好，比如：复杂的工作流管理，复杂的模板规则等……
前台：页面的缓存管理则可以使用缓存系统实现

______________________             ___________________
|Squid Software cache|             |F5 Hardware cache|
----------------------             -------------------
            /                    /
             / ________________ /
               |ASP |JSP |PHP |
             Content Manage System
               ----------------

所以分工后：内容管理和缓存管理2者，无论哪一方面可选的余地都是非常大的：软件（比如前台80端口使用SQUID对后台8080的内容发布管理系统进行缓存），缓存硬件，甚至交给akamai这样的专业服务商。

面向缓存的站点规划

一个利用SQUID对多个站点进行做WEB加速http acceleration方案：
原先一个站点的规划可能是这样的：
200.200.200.207 www.chedong.com
200.200.200.208 news.chedong.com
200.200.200.209 bbs.chedong.com
200.200.200.205 images.chedong.com
面向缓存服务器的设计中：所有站点都通过外部DNS指向到同一个IP：200.200.200.200/201这2台缓存服务器上（使用2台是为了冗余备份）

                          _____________________   ________
www.chedong.com  请求  / |       cache box     | |        |  / 192.168.0.4   www.chedong.com 
news.chedong.com 请求   -| 200.200.200.200/201 |-|firewall| -  192.168.0.4   news.chedong.com 
bbs.chedong.com  请求  / |   /etc/hosts        | |   box  |  / 192.168.0.3   bbs.chedong.com
                          ---------------------   --------

工作原理：
外部请求过来时，设置缓存根据配置文件进行转向解析。这样，服务器请求就可以转发到我们指定的内部地址上。
在处理多虚拟主机转向方面：mod_proxy比squid要简单一些：可以把不同服务转向后后台多个IP的不同端口上。
而squid只能通过禁用DNS解析，然后根据本地的/etc/hosts文件根据请求的域名进行地址转发，后台多个服务器必须使用相同的端口。
使用反向代理加速，我们不仅可以得到性能上的提升，而且还能获得额外的安全性和配置的灵活度：

配置灵活性提高：可以自己在内部服务器上控制后台服务器的DNS解析，当需要在服务器之间做迁移调整时，就不用大量修改外部DNS配置了，只需要修改内部DNS实现服务的调整。
数据安全性增加：所有后台服务器可以很方便的被保护在防火墙内。
后台应用设计复杂程度降低：原先为了效率常常需要建立专门的图片服务器images.chedong.com和负载比较高的应用服务器 bbs.chedong.com分离，在反向代理加速模式中，所有前台请求都通过缓存服务器：实际上就都是静态页面，这样，应用设计时就不用考虑图片和应用本身分离了，也大大降低了后台内容发布系统设计的复杂程度，由于数据和应用都存放在一起，也方便了文件系统的维护和管理。

基于Apache mod_proxy的反向代理缓存加速实现

Apache包含了mod_proxy模块，可以用来实现代理服务器，针对后台服务器的反向加速
安装apache 1.3.x 编译时：
--enable-shared=max --enable-module=most
注：Apache 2.x中mod_proxy已经被分离成mod_proxy和mod_cache：同时mod_cache有基于文件和基于内存的不同实现
创建/var/www/proxy，设置apache服务所用户可写
mod_proxy配置样例：反相代理缓存＋缓存
架设前台的www.example.com反向代理后台的www.backend.com的8080端口服务。
修改：httpd.conf
<VirtualHost *>
ServerName www.example.com
ServerAdmin [email protected]
# reverse proxy setting
ProxyPass / http://www.backend.com:8080/
ProxyPassReverse / http://www.backend.com:8080/
# cache dir root
CacheRoot "/var/www/proxy"
# max cache storage
CacheSize 50000000
# hour: every 4 hour
CacheGcInterval 4
# max page expire time: hour
CacheMaxExpire 240
# Expire time = (now - last_modified) * CacheLastModifiedFactor
CacheLastModifiedFactor 0.1
# defalt expire tag: hour
CacheDefaultExpire 1
# force complete after precent of content retrived: 60-90%
CacheForceCompletion 80
CustomLog /usr/local/apache/logs/dev_access_log combined
</VirtualHost>

基于Squid的反向代理加速实现

Squid是一个更专用的代理服务器，性能和效率会比Apache的mod_proxy高很多。
如果需要combined格式日志补丁：
http://www.squid-cache.org/mail-archive/squid-dev/200301/0164.html
squid的编译：
./configure --enable-useragent-log --enable-referer-log --enable-default-err-language=Simplify_Chinese / --enable-err-languages="Simplify_Chinese English" --disable-internal-dns
make
#make install
#cd /usr/local/squid
make dir cache
chown squid.squid *
vi /usr/local/squid/etc/squid.conf
在/etc/hosts中：加入内部的DNS解析，比如：
192.168.0.4 www.chedong.com
192.168.0.4 news.chedong.com
192.168.0.3 bbs.chedong.com
---------------------cut here----------------------------------
# visible name
visible_hostname cache.example.com
# cache config: space use 1G and memory use 256M
cache_dir ufs /usr/local/squid/cache 1024 16 256
cache_mem 256 MB
cache_effective_user squid
cache_effective_group squid

http_port 80
httpd_accel_host virtual
httpd_accel_single_host off
httpd_accel_port 80
httpd_accel_uses_host_header on
httpd_accel_with_proxy on
# accelerater my domain only
acl acceleratedHostA dstdomain .example1.com
acl acceleratedHostB dstdomain .example2.com
acl acceleratedHostC dstdomain .example3.com
# accelerater http protocol on port 80
acl acceleratedProtocol protocol HTTP
acl acceleratedPort port 80
# access arc
acl all src 0.0.0.0/0.0.0.0
# Allow requests when they are to the accelerated machine AND to the
# right port with right protocol
http_access allow acceleratedProtocol acceleratedPort acceleratedHostA
http_access allow acceleratedProtocol acceleratedPort acceleratedHostB
http_access allow acceleratedProtocol acceleratedPort acceleratedHostC
# logging
emulate_httpd_log on
cache_store_log none
# manager
acl manager proto cache_object
http_access allow manager all
cachemgr_passwd pass all

----------------------cut here---------------------------------
创建缓存目录：
/usr/local/squid/sbin/squid -z
启动squid
/usr/local/squid/sbin/squid
停止squid：
/usr/local/squid/sbin/squid -k shutdown
启用新配置：
/usr/local/squid/sbin/squid -k reconfig
通过crontab每天0点截断/轮循日志：
0 0 * * * (/usr/local/squid/sbin/squid -k rotate)

可缓存的动态页面设计

什么样的页面能够比较好的被缓存服务器缓存呢？如果返回内容的HTTP HEADER中有"Last-Modified"和"Expires"相关声明，比如：
Last-Modified: Wed, 14 May 2003 13:06:17 GMT
Expires: Fri, 16 Jun 2003 13:06:17 GMT
前端缓存服务器在期间会将生成的页面缓存在本地：硬盘或者内存中，直至上述页面过期。
因此，一个可缓存的页面：

页面必须包含Last-Modified: 标记
一般纯静态页面本身都会有Last-Modified信息，动态页面需要通过函数强制加上，比如在PHP中：
// always modified now
header("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT");
必须有Expires或Cache-Control: max-age标记设置页面的过期时间：
对于静态页面，通过apache的mod_expires根据页面的MIME类型设置缓存周期：比如图片缺省是1个月，HTML页面缺省是2天等。
<IfModule mod_expires.c>
ExpiresActive on
ExpiresByType image/gif "access plus 1 month"
ExpiresByType text/css "now plus 2 day"
ExpiresDefault "now plus 1 day"
</IfModule>

对于动态页面，则可以直接通过写入HTTP返回的头信息，比如对于新闻首页index.php可以是20分钟，而对于具体的一条新闻页面可能是1天后过期。比如：在php中加入了1个月后过期：
// Expires one month later
header("Expires: " .gmdate ("D, d M Y H:i:s", time() + 3600 * 24 * 30). " GMT");
如果服务器端有基于HTTP的认证，必须有Cache-Control: public标记，允许前台

ASP应用的缓存改造首先在公用的包含文件中(比如include.asp)加入以下公用函数：
<%
' Set Expires Header in minutes
Function SetExpiresHeader(ByVal minutes)
    ' set Page Last-Modified Header:
    ' Converts date (19991022 11:08:38) to http form (Fri, 22 Oct 1999 12:08:38 GMT)
    Response.AddHeader "Last-Modified", DateToHTTPDate(Now())

    ' The Page Expires in Minutes
    Response.Expires = minutes

    ' Set cache control to externel applications
    Response.CacheControl = "public"
End Function
' Converts date (19991022 11:08:38) to http form (Fri, 22 Oct 1999 12:08:38 GMT)
Function DateToHTTPDate(ByVal OleDATE)
Const GMTdiff = #08:00:00#
OleDATE = OleDATE - GMTdiff
DateToHTTPDate = engWeekDayName(OleDATE) & _
    ", " & Right("0" & Day(OleDATE),2) & " " & engMonthName(OleDATE) & _
    " " & Year(OleDATE) & " " & Right("0" & Hour(OleDATE),2) & _
    ":" & Right("0" & Minute(OleDATE),2) & ":" & Right("0" & Second(OleDATE),2) & " GMT"
End Function
Function engWeekDayName(dt)
    Dim Out
    Select Case WeekDay(dt,1)
        Case 1:Out="Sun"
        Case 2:Out="Mon"
        Case 3:Out="Tue"
        Case 4:Out="Wed"
        Case 5:Out="Thu"
        Case 6:Out="Fri"
        Case 7:Out="Sat"
    End Select
    engWeekDayName = Out
End Function
Function engMonthName(dt)
    Dim Out
    Select Case Month(dt)
        Case 1:Out="Jan"
        Case 2:Out="Feb"
        Case 3:Out="Mar"
        Case 4:Out="Apr"
        Case 5:Out="May"
        Case 6:Out="Jun"
        Case 7:Out="Jul"
        Case 8:Out="Aug"
        Case 9:Out="Sep"
        Case 10:Out="Oct"
        Case 11:Out="Nov"
        Case 12:Out="Dec"
    End Select
    engMonthName = Out
End Function
%>
然后在具体的页面中，比如index.asp和news.asp的“最上面”加入以下代码：HTTP Header

<%
'页面将被设置20分钟后过期
SetExpiresHeader(20)
%>

应用的缓存兼容性设计

经过代理以后，由于在客户端和服务之间增加了中间层，因此服务器无法直接拿到客户端的IP，服务器端应用也无法直接通过转发请求的地址返回给客户端。但是在转发请求的HTTD头信息中，增加了HTTP_X_FORWARDED_????信息。用以跟踪原有的客户端IP地址和原来客户端请求的服务器地址：
下面是2个例子，用于说明缓存兼容性应用的设计原则：

    '对于一个需要服务器名的地址的ASP应用：不要直接引用HTTP_HOST/SERVER_NAME，判断一下是否有HTTP_X_FORWARDED_SERVER
    function getHostName ()
        dim hostName as String = ""
        hostName = Request.ServerVariables("HTTP_HOST")
        if not isDBNull(Request.ServerVariables("HTTP_X_FORWARDED_HOST")) then
            if len(trim(Request.ServerVariables("HTTP_X_FORWARDED_HOST"))) > 0 then
                hostName = Request.ServerVariables("HTTP_X_FORWARDED_HOST")
            end if
        end if
        return hostNmae
    end function

    //对于一个需要记录客户端IP的PHP应用：不要直接引用REMOTE_ADDR，而是要使用HTTP_X_FORWARDED_FOR，
    function getUserIP (){
        $user_ip = 
   
   
   
   

    
    
    
    内容摘要：
对于一个日访问量达到百万级的网站来说，速度很快就成为一个瓶颈。除了优化内容发布系统的应用本身外，如果能把不需要实时更新的动态页面的输出结果转化成静态网页来发布，速度上的提升效果将是显著的，因为一个动态页面的速度往往会比静态页面慢2－10倍，而静态网页的内容如果能被缓存在内存里，访问速度甚至会比原有动态网页有2－3个数量级的提高。


    
    
    
     
     动态缓存和静态缓存的比较  
     基于反向代理加速的站点规划
 
     基于apache mod_proxy的反向代理加速实现  
     基于squid的反向代理加速实现  
     面向缓存的页面设计  
     应用的缓存兼容性设计：
HTTP_HOST/SERVER_NAME和REMOTE_ADDR/REMOTE_HOST需要用 HTTP_X_FORWARDED_HOST/HTTP_X_FORWARDED_SERVER代替  
    
后台的内容管理系统的页面输出遵守可缓存的设计，这样就可以把性能问题交给前台的缓存服务器来解决了，从而大大简化CMS系统本身的复杂程度。
    
    
    
    

   
   
   
   

   
   
   
   

    
    
    
    静态缓存和动态缓存的比较 

    
    
    
    静态页面的缓存可能有2种形式：其实主要区别就是CMS是否自己负责关联内容的缓存更新管理。

    
    
    
     
     静态缓存：是在新内容发布的同时就立刻生成相应内容的静态页面，比如：2003年3月22日，管理员通过后台内容管理界面录入一篇文章后，就立刻生成http://www.chedong.com/tech/2003/03/22/001.html这个静态页面，并同步更新相关索引页上的链接。

 
     动态缓存：是在新内容发布以后，并不预先生成相应的静态页面，直到对相应内容发出请求时，如果前台缓存服务器找不到相应缓存，就向后台内容管理服务器发出请求，后台系统会生成相应内容的静态页面，用户第一次访问页面时可能会慢一点，但是以后就是直接访问缓存了。

如果去ZDNet等国外网站会发现他们使用的基于Vignette内容管理系统都有这样的页面名称：0,22342566,300458.html。其实这里的0,22342566,300458就是用逗号分割开的多个参数：
第一次访问找不到页面后，相当于会在服务器端产生一个doc_type= 0&doc_id=22342566&doc_template=300458的查询，
而查询结果会生成的缓存的静态页面： 0,22342566,300458.html
 
    

    
    
    
    静态缓存的缺点：

    
    
    
     
     复杂的触发更新机制：这两种机制在内容管理系统比较简单的时候都是非常适用的。但对于一个关系比较复杂的网站来说，页面之间的逻辑引用关系就成为一个非常非常复杂的问题。最典型的例子就是一条新闻要同时出现在新闻首页和相关的3个新闻专题中，在静态缓存模式中，每发一篇新文章，除了这篇新闻内容本身的页面外，还需要系统通过触发器生成多个新的相关静态页面，这些相关逻辑的触发也往往就会成为内容管理系统中最复杂的部分之一。  
     旧内容的批量更新： 通过静态缓存发布的内容，对于以前生成的静态页面的内容很难修改，这样用户访问旧页面时，新的模板根本无法生效。  
    

    
    
    
    在动态缓存模式中，每个动态页面只需要关心，而相关的其他页面能自动更新，从而大大减少了设计相关页面更新触发器的需要。


    
    
    
    以前做小型应用的时候也用过类似方式：应用首次访问以后将数据库的查询结果在本地存成一个文件，下次请求时先检查本地缓存目录中是否有缓存文件，从而减少对后台数据库的访问。虽然这样做也能承载比较大的负载，但这样的内容管理和缓存管理一体的系统是很难分离的，而且数据完整性也不是很好保存，内容更新时，应用需要把相应内容的的缓存文件删除。但是这样的设计在缓存文件很多的时候往往还需要将缓存目录做一定的分布，否则一个目录下的文件节点超过3000，rm *都会出错。


    
    
    
    这时候，系统需要再次分工，把复杂的内容管理系统分解成：内容输入和缓存这2个相对简单的系统实现。


    
    
    
     
     后台：内容管理系统，专心的将内容发布做好，比如：复杂的工作流管理，复杂的模板规则等……  
     前台：页面的缓存管理则可以使用缓存系统实现
 
    

    
    
    
    ______________________             ___________________
|Squid Software cache|             |F5 Hardware cache|
----------------------             -------------------
            /                    /
             / ________________ /
               |ASP |JSP |PHP |
             Content Manage System
               ----------------

    
    
    
    所以分工后：内容管理和缓存管理2者，无论哪一方面可选的余地都是非常大的：软件（比如前台80端口使用SQUID对后台8080的内容发布管理系统进行缓存），缓存硬件，甚至交给akamai这样的专业服务商。


    
    
    
    面向缓存的站点规划
一个利用SQUID对多个站点进行做WEB加速http acceleration方案：
    
    
    
    
原先一个站点的规划可能是这样的：
    
    
    
    
200.200.200.207 www.chedong.com 
    
    
    
    
200.200.200.208 news.chedong.com 
    
    
    
    
200.200.200.209 bbs.chedong.com 
    
    
    
    
200.200.200.205 images.chedong.com
    
    
    
    
面向缓存服务器的设计中：所有站点都通过外部DNS指向到同一个IP：200.200.200.200/201这2台缓存服务器上（使用2台是为了冗余备份）

    
    
    
                              _____________________   ________
www.chedong.com  请求  / |       cache box     | |        |  / 192.168.0.4   www.chedong.com 
news.chedong.com 请求   -| 200.200.200.200/201 |-|firewall| -  192.168.0.4   news.chedong.com 
bbs.chedong.com  请求  / |   /etc/hosts        | |   box  |  / 192.168.0.3   bbs.chedong.com
                          ---------------------   --------

工作原理：
    
    
    
    
外部请求过来时，设置缓存根据配置文件进行转向解析。这样，服务器请求就可以转发到我们指定的内部地址上。
    
    
    
    
在处理多虚拟主机转向方面：mod_proxy比squid要简单一些：可以把不同服务转向后后台多个IP的不同端口上。
    
    
    
    
而squid只能通过禁用DNS解析，然后根据本地的/etc/hosts文件根据请求的域名进行地址转发，后台多个服务器必须使用相同的端口。
    
    
    
    
使用反向代理加速，我们不仅可以得到性能上的提升，而且还能获得额外的安全性和配置的灵活度：
    
    
    
    


    
    
    
     
     配置灵活性提高：可以自己在内部服务器上控制后台服务器的DNS解析，当需要在服务器之间做迁移调整时，就不用大量修改外部DNS配置了，只需要修改内部DNS实现服务的调整。  
     数据安全性增加：所有后台服务器可以很方便的被保护在防火墙内。  
     后台应用设计复杂程度降低：原先为了效率常常需要建立专门的图片服务器images.chedong.com和负载比较高的应用服务器 bbs.chedong.com分离，在反向代理加速模式中，所有前台请求都通过缓存服务器：实际上就都是静态页面，这样，应用设计时就不用考虑图片和应用本身分离了，也大大降低了后台内容发布系统设计的复杂程度，由于数据和应用都存放在一起，也方便了文件系统的维护和管理。
 
    

    
    
    
    基于Apache mod_proxy的反向代理缓存加速实现
Apache包含了mod_proxy模块，可以用来实现代理服务器，针对后台服务器的反向加速
    
    
    
    
安装apache 1.3.x 编译时：
    
    
    
    
--enable-shared=max --enable-module=most
    
    
    
    

    
    
    
    注：Apache 2.x中mod_proxy已经被分离成mod_proxy和mod_cache：同时mod_cache有基于文件和基于内存的不同实现
    
    
    
    
创建/var/www/proxy，设置apache服务所用户可写
    
    
    
    
mod_proxy配置样例：反相代理缓存＋缓存
    
    
    
    
架设前台的www.example.com反向代理后台的www.backend.com的8080端口服务。
    
    
    
    
修改：httpd.conf
    
    
    
    
<VirtualHost *>
    
    
    
    
ServerName www.example.com
    
    
    
    
ServerAdmin [email protected]
    
    
    
    
# reverse proxy setting
    
    
    
    
ProxyPass / http://www.backend.com:8080/
    
    
    
    
ProxyPassReverse / http://www.backend.com:8080/
    
    
    
    
# cache dir root
    
    
    
    
CacheRoot "/var/www/proxy"
    
    
    
    
# max cache storage
    
    
    
    
CacheSize 50000000
    
    
    
    
# hour: every 4 hour 
    
    
    
    
CacheGcInterval 4
    
    
    
    
# max page expire time: hour
    
    
    
    
CacheMaxExpire 240
    
    
    
    
# Expire time = (now - last_modified) * CacheLastModifiedFactor 
    
    
    
    
CacheLastModifiedFactor 0.1
    
    
    
    
# defalt expire tag: hour
    
    
    
    
CacheDefaultExpire 1
    
    
    
    
# force complete after precent of content retrived: 60-90%
    
    
    
    
CacheForceCompletion 80
    
    
    
    
CustomLog /usr/local/apache/logs/dev_access_log combined
    
    
    
    
</VirtualHost>
    
    
    
    


    
    
    
    基于Squid的反向代理加速实现
Squid是一个更专用的代理服务器，性能和效率会比Apache的mod_proxy高很多。
    
    
    
    
如果需要combined格式日志补丁：
    
    
    
    

    http://www.squid-cache.org/mail-archive/squid-dev/200301/0164.html
    
    
    
    
squid的编译：
    
    
    
    
./configure --enable-useragent-log  --enable-referer-log --enable-default-err-language=Simplify_Chinese / --enable-err-languages="Simplify_Chinese English" --disable-internal-dns  
    
    
    
    
make
    
    
    
    
#make install
    
    
    
    
#cd /usr/local/squid
    
    
    
    
make dir cache
    
    
    
    
chown squid.squid *
    
    
    
    
vi /usr/local/squid/etc/squid.conf
    
    
    
    
在/etc/hosts中：加入内部的DNS解析，比如：
    
    
    
    
192.168.0.4 www.chedong.com 
    
    
    
    
192.168.0.4 news.chedong.com
    
    
    
    
192.168.0.3 bbs.chedong.com
    
    
    
    
---------------------cut here----------------------------------
    
    
    
    
# visible name
    
    
    
    
visible_hostname cache.example.com
    
    
    
    
# cache config: space use 1G and memory use 256M
    
    
    
    
cache_dir ufs /usr/local/squid/cache 1024 16 256 
    
    
    
    
cache_mem 256 MB
    
    
    
    
cache_effective_user squid
    
    
    
    
cache_effective_group squid
    
    
    
    

    
    
    
    
http_port 80
    
    
    
    
httpd_accel_host virtual
    
    
    
    
httpd_accel_single_host off
    
    
    
    
httpd_accel_port 80
    
    
    
    
httpd_accel_uses_host_header on
    
    
    
    
httpd_accel_with_proxy on
    
    
    
    
# accelerater my domain only
    
    
    
    
acl acceleratedHostA dstdomain .example1.com
    
    
    
    
acl acceleratedHostB dstdomain .example2.com
    
    
    
    
acl acceleratedHostC dstdomain .example3.com
    
    
    
    
# accelerater http protocol on port 80
    
    
    
    
acl acceleratedProtocol protocol HTTP
    
    
    
    
acl acceleratedPort port 80
    
    
    
    
# access arc
    
    
    
    
acl all src 0.0.0.0/0.0.0.0
    
    
    
    
# Allow requests when they are to the accelerated machine AND to the
    
    
    
    
# right port with right protocol
    
    
    
    
http_access allow acceleratedProtocol acceleratedPort acceleratedHostA
    
    
    
    
http_access allow acceleratedProtocol acceleratedPort acceleratedHostB
    
    
    
    
http_access allow acceleratedProtocol acceleratedPort acceleratedHostC
    
    
    
    
# logging
    
    
    
    
emulate_httpd_log on
    
    
    
    
cache_store_log none
    
    
    
    
# manager
    
    
    
    
acl manager proto cache_object
    
    
    
    
http_access allow manager all
    
    
    
    
cachemgr_passwd pass all
    
    
    
    

    
    
    
    
----------------------cut here---------------------------------
    
    
    
    
创建缓存目录：
    
    
    
    
/usr/local/squid/sbin/squid -z
    
    
    
    
启动squid
    
    
    
    
/usr/local/squid/sbin/squid
    
    
    
    
停止squid：
    
    
    
    
/usr/local/squid/sbin/squid -k shutdown
    
    
    
    
启用新配置：
    
    
    
    
/usr/local/squid/sbin/squid -k reconfig
    
    
    
    
通过crontab每天0点截断/轮循日志：
    
    
    
    
0 0 * * * (/usr/local/squid/sbin/squid -k rotate) 
    
    
    
    


    
    
    
    可缓存的动态页面设计
什么样的页面能够比较好的被缓存服务器缓存呢？如果返回内容的HTTP HEADER中有"Last-Modified"和"Expires"相关声明，比如：
    
    
    
    
Last-Modified: Wed, 14 May 2003 13:06:17 GMT
    
    
    
    
Expires: Fri, 16 Jun 2003 13:06:17 GMT
    
    
    
    
前端缓存服务器在期间会将生成的页面缓存在本地：硬盘或者内存中，直至上述页面过期。
    
    
    
    
因此，一个可缓存的页面：

    
    
    
     
     页面必须包含Last-Modified: 标记
一般纯静态页面本身都会有Last-Modified信息，动态页面需要通过函数强制加上，比如在PHP中：
// always modified now
header("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT");

 
     必须有Expires或Cache-Control: max-age标记设置页面的过期时间：
对于静态页面，通过apache的mod_expires根据页面的MIME类型设置缓存周期：比如图片缺省是1个月，HTML页面缺省是2天等。
<IfModule mod_expires.c> 
    ExpiresActive on
    ExpiresByType image/gif "access plus 1 month"
    ExpiresByType text/css "now plus 2 day"
    ExpiresDefault "now plus 1 day"
</IfModule>

对于动态页面，则可以直接通过写入HTTP返回的头信息，比如对于新闻首页index.php可以是20分钟，而对于具体的一条新闻页面可能是1天后过期。比如：在php中加入了1个月后过期：
// Expires one month later
header("Expires: " .gmdate ("D, d M Y H:i:s", time() + 3600 * 24 * 30). " GMT");

 
     如果服务器端有基于HTTP的认证，必须有Cache-Control: public标记，允许前台  
    
ASP应用的缓存改造 首先在公用的包含文件中(比如include.asp)加入以下公用函数：
    
    
    
    
<%
    
    
    
    
' Set Expires Header in minutes
    
    
    
    
Function SetExpiresHeader(ByVal minutes) 
    
    
    
    
    ' set Page Last-Modified Header:
    
    
    
    
    ' Converts date (19991022 11:08:38) to http form (Fri, 22 Oct 1999 12:08:38 GMT)
    
    
    
    
    Response.AddHeader "Last-Modified", DateToHTTPDate(Now())
    
    
    
    
    
    
    
    
    
    ' The Page Expires in Minutes
    
    
    
    
    Response.Expires = minutes
    
    
    
    
    
    
    
    
    
    ' Set cache control to externel applications
    
    
    
    
    Response.CacheControl = "public"
    
    
    
    
End Function 
    
    
    
    
' Converts date (19991022 11:08:38) to http form (Fri, 22 Oct 1999 12:08:38 GMT)
    
    
    
    
Function DateToHTTPDate(ByVal OleDATE)
    
    
    
    
  Const GMTdiff = #08:00:00#
    
    
    
    
  OleDATE = OleDATE - GMTdiff
    
    
    
    
  DateToHTTPDate = engWeekDayName(OleDATE) & _
    
    
    
    
    ", " & Right("0" & Day(OleDATE),2) & " " & engMonthName(OleDATE) & _
    
    
    
    
    " " & Year(OleDATE) & " " & Right("0" & Hour(OleDATE),2) & _
    
    
    
    
    ":" & Right("0" & Minute(OleDATE),2) & ":" & Right("0" & Second(OleDATE),2) & " GMT"
    
    
    
    
End Function 
    
    
    
    
Function engWeekDayName(dt)
    
    
    
    
    Dim Out
    
    
    
    
    Select Case WeekDay(dt,1)
    
    
    
    
        Case 1:Out="Sun"
    
    
    
    
        Case 2:Out="Mon"
    
    
    
    
        Case 3:Out="Tue"
    
    
    
    
        Case 4:Out="Wed"
    
    
    
    
        Case 5:Out="Thu"
    
    
    
    
        Case 6:Out="Fri"
    
    
    
    
        Case 7:Out="Sat"
    
    
    
    
    End Select
    
    
    
    
    engWeekDayName = Out
    
    
    
    
End Function
    
    
    
    
Function engMonthName(dt)
    
    
    
    
    Dim Out
    
    
    
    
    Select Case Month(dt)
    
    
    
    
        Case 1:Out="Jan"
    
    
    
    
        Case 2:Out="Feb"
    
    
    
    
        Case 3:Out="Mar"
    
    
    
    
        Case 4:Out="Apr"
    
    
    
    
        Case 5:Out="May"
    
    
    
    
        Case 6:Out="Jun"
    
    
    
    
        Case 7:Out="Jul"
    
    
    
    
        Case 8:Out="Aug"
    
    
    
    
        Case 9:Out="Sep"
    
    
    
    
        Case 10:Out="Oct"
    
    
    
    
        Case 11:Out="Nov"
    
    
    
    
        Case 12:Out="Dec"
    
    
    
    
    End Select
    
    
    
    
    engMonthName = Out
    
    
    
    
End Function
    
    
    
    
%>
    
    
    
    
然后在具体的页面中，比如index.asp和news.asp的“最上面”加入以下代码：HTTP Header
    
    
    
    
<!--#include file="../include.asp"-->
    
    
    
    
<%
    
    
    
    
'页面将被设置20分钟后过期
    
    
    
    
SetExpiresHeader(20)
    
    
    
    
%>
    
    
    
    


    
    
    
    应用的缓存兼容性设计

    
    
    
    
经过代理以后，由于在客户端和服务之间增加了中间层，因此服务器无法直接拿到客户端的IP，服务器端应用也无法直接通过转发请求的地址返回给客户端。但是在转发请求的HTTD头信息中，增加了HTTP_X_FORWARDED_????信息。用以跟踪原有的客户端IP地址和原来客户端请求的服务器地址：
    
    
    
    
下面是2个例子，用于说明缓存兼容性应用的设计原则：
    
    
    
    


    
    
    
    ___FCKpd___2

    
    
    
    
注意：HTTP_X_FORWARDED_FOR如果经过了多个中间代理服务器，有何能是逗号分割的多个地址，
    
    
    
    
比如：200.28.7.155,200.10.225.77 unknown,219.101.137.3
    
    
    
    
因此在很多旧的数据库设计中（比如BBS）往往用来记录客户端地址的字段被设置成20个字节就显得过小了。
    
    
    
    
经常见到类似以下的错误信息：
    
    
    
    

    

    
    
    
    Microsoft JET Database Engine 错误 '80040e57' 

    
    
    
    字段太小而不能接受所要添加的数据的数量。试着插入或粘贴较少的数据。 

    
    
    
    /inc/char.asp，行236 
原因就是在设计客户端访问地址时，相关用户IP字段大小最好要设计到50个字节以上，当然经过3层以上代理的几率也非常小。
    
    
    
    
如何检查目前站点页面的可缓存性（Cacheablility）呢？可以参考以下2个站点上的工具：
    
    
    
    

    http://www.ircache.net/cgi-bin/cacheability.py
    
    
    
    


    
    
    
    附：SQUID性能测试试验

    
    
    
    
phpMan.php是一个基于php的man page server，每个man
    
    
    
    
page需要调用后台的man命令和很多页面格式化工具，系统负载比较高，提供了Cache
    
    
    
    
Friendly的URL，以下是针对同样的页面的性能测试资料：
    
    
    
    
测试环境：Redhat 8 on Cyrix 266 / 192M Mem 
    
    
    
    
测试程序：使用apache的ab(apache benchmark)：
    
    
    
    
测试条件：请求50次，并发50个连接
    
    
    
    
测试项目：直接通过apache 1.3 (80端口) vs squid 2.5(8000端口：加速80端口) 
    
    
    
    

    
    
    
    
测试1：无CACHE的80端口动态输出：
    
    
    
    
ab -n 100 -c 10 http://www.chedong.com:81/phpMan.php/man/kill/1
    
    
    
    
This is ApacheBench, Version 1.3d <$Revision: 1.2 $> apache-1.3
    
    
    
    
Copyright (c) 1996 Adam Twiss, Zeus Technology Ltd,
    
    
    
    
http://www.zeustech.net/
    
    
    
    
Copyright (c) 1998-2001 The Apache Group, http://www.apache.org/
    
    
    
    

    
    
    
    
Benchmarking localhost (be patient).....done
    
    
    
    
Server Software:       
    
    
    
    
Apache/1.3.23                                     
    
    
    
    
Server Hostname:        localhost
    
    
    
    
Server
    
    
    
    
Port:           
    
    
    
    
80
    
    
    
    

    
    
    
    
Document Path:         
    
    
    
    
/phpMan.php/man/kill/1
    
    
    
    
Document Length:        4655 bytes
    
    
    
    

    
    
    
    
Concurrency Level:      5
    
    
    
    
Time taken for tests:   63.164 seconds
    
    
    
    
Complete requests:      50
    
    
    
    
Failed requests:        0
    
    
    
    
Broken pipe errors:     0
    
    
    
    
Total transferred:      245900 bytes
    
    
    
    
HTML transferred:       232750 bytes
    
    
    
    
Requests per second:    0.79 [#/sec] (mean)
    
    
    
    
Time per request:       6316.40 [ms]
    
    
    
    
(mean)
    
    
    
    
Time per request:       1263.28 [ms]
    
    
    
    
(mean, across all concurrent requests)
    
    
    
    
Transfer rate:         
    
    
    
    
3.89 [Kbytes/sec] received
    
    
    
    

    
    
    
    
Connnection Times (ms)
    
    
    
    
             
    
    
    
    
min  mean[+/-sd] median   max
    
    
    
    
Connect:        0   
    
    
    
    
29  106.1      0   553
    
    
    
    

    
    
    
    Processing:  2942  6016
1845.4   6227 10796
    
    
    
    

    
    
    
    

    
    
    
    Waiting:    
2941  5999 1850.7   6226 10795
    
    
    
    

    
    
    
    

    
    
    
    Total:      
2942  6045 1825.9   6227 10796
    
    
    
    

    
    
    
    
Percentage of the requests served within a certain time (ms)
    
    
    
    
  50%   6227
    
    
    
    
  66%   7069
    
    
    
    
  75%   7190
    
    
    
    
  80%   7474
    
    
    
    
  90%   8195
    
    
    
    
  95%   8898
    
    
    
    
  98%   9721
    
    
    
    
  99%  10796
    
    
    
    
 100%  10796 (last request)
    
    
    
    

    
    
    
    
测试2：SQUID缓存输出
    
    
    
    
/home/apache/bin/ab -n50 -c5
    
    
    
    
"http://localhost:8000/phpMan.php/man/kill/1"
    
    
    
    
This is ApacheBench, Version 1.3d <$Revision: 1.2 $> apache-1.3
    
    
    
    
Copyright (c) 1996 Adam Twiss, Zeus Technology Ltd,
    
    
    
    
http://www.zeustech.net/
    
    
    
    
Copyright (c) 1998-2001 The Apache Group, http://www.apache.org/
    
    
    
    

    
    
    
    
Benchmarking localhost (be patient).....done
    
    
    
    
Server Software:       
    
    
    
    
Apache/1.3.23                                     
    
    
    
    
Server Hostname:        localhost
    
    
    
    
Server
    
    
    
    
Port:           
    
    
    
    
8000
    
    
    
    

    
    
    
    
Document Path:         
    
    
    
    
/phpMan.php/man/kill/1
    
    
    
    
Document Length:        4655 bytes
    
    
    
    

    
    
    
    
Concurrency Level:      5
    
    
    
    
Time taken for tests:   4.265 seconds
    
    
    
    
Complete requests:      50
    
    
    
    
Failed requests:        0
    
    
    
    
Broken pipe errors:     0
    
    
    
    
Total transferred:      248043 bytes
    
    
    
    
HTML transferred:       232750 bytes
    
    
    
    
Requests per second:    11.72 [#/sec] (mean)
    
    
    
    
Time per request:       426.50 [ms] (mean)
    
    
    
    
Time per request:       85.30 [ms] (mean,
    
    
    
    
across all concurrent requests)
    
    
    
    
Transfer rate:         
    
    
    
    
58.16 [Kbytes/sec] received
    
    
    
    

    
    
    
    
Connnection Times (ms)
    
    
    
    
             
    
    
    
    
min  mean[+/-sd] median   max
    
    
    
    
Connect:       
    
    
    
    
0     1   
    
    
    
    
9.5      0    68
    
    
    
    

    
    
    
    Processing:    
7    83  537.4     
7  3808
    
    
    
    

    
    
    
    

    
    
    
    Waiting:       
5    81  529.1     
6  3748
    
    
    
    

    
    
    
    

    
    
    
    Total:         
7    84  547.0     
7  3876
    
    
    
    

    
    
    
    
Percentage of the requests served within a certain time (ms)
    
    
    
    
  50%      7
    
    
    
    
  66%      7
    
    
    
    
  75%      7
    
    
    
    
  80%      7
    
    
    
    
  90%      7
    
    
    
    
  95%      7
    
    
    
    
  98%      8
    
    
    
    
  99%   3876
    
    
    
    
 100%   3876 (last request)
    
    
    
    

    
    
    
    
结论：No Cache / Cache = 6045 / 84 = 70
    
    
    
    
结论：对于可能被缓存请求的页面，服务器速度可以有2个数量级的提高，因为SQUID是把缓存页面放在内存里的（因此几乎没有硬盘I/O操作）。
    
    
    
    

    
    
    
    
小节：
    
    
    
    


    
    
    
     
     
 
     大访问量的网站应尽可能将动态网页生成静态页面作为缓存发布，甚至对于搜索引擎这样的动态应用来说，缓存机制也是非常非常重要的。 
 
     在动态页面中利用HTTP Header定义缓存更新策略。 
 
     利用缓存服务器获得额外的配置和安全性 
 
     日志非常重要：SQUID日志缺省不支持COMBINED日志，但对于需要REFERER日志的这个补丁非常重要：http://www.squid-cache.org/mail-archive/squid-dev/200301/0164.html


 
    

    
    
    
    
参考资料：
    
    
    
    

    HTTP代理缓存 
    
    
    
    
http://vancouver-webpages.com/proxy.html

    
    
    
     

    
    
    
    

    可缓存的页面设计
    
    
    
    
http://linux.oreillynet.com/pub/a/linux/2002/02/28/cachefriendly.html
    
    
    
    

    运用ASP.NET的输出缓冲来存储动态页面 -  开发者 - ZDNet China
    
    
    
    
http://www.zdnet.com.cn/developer/tech/story/0,2000081602,39110239-2,00.htm
    
    
    
    
 
   
   
   
   
SERVER["REMOTE_ADDR"];
        if (
   
   
   
   

    
    
    
    内容摘要：
对于一个日访问量达到百万级的网站来说，速度很快就成为一个瓶颈。除了优化内容发布系统的应用本身外，如果能把不需要实时更新的动态页面的输出结果转化成静态网页来发布，速度上的提升效果将是显著的，因为一个动态页面的速度往往会比静态页面慢2－10倍，而静态网页的内容如果能被缓存在内存里，访问速度甚至会比原有动态网页有2－3个数量级的提高。


    
    
    
     
     动态缓存和静态缓存的比较  
     基于反向代理加速的站点规划
 
     基于apache mod_proxy的反向代理加速实现  
     基于squid的反向代理加速实现  
     面向缓存的页面设计  
     应用的缓存兼容性设计：
HTTP_HOST/SERVER_NAME和REMOTE_ADDR/REMOTE_HOST需要用 HTTP_X_FORWARDED_HOST/HTTP_X_FORWARDED_SERVER代替  
    
后台的内容管理系统的页面输出遵守可缓存的设计，这样就可以把性能问题交给前台的缓存服务器来解决了，从而大大简化CMS系统本身的复杂程度。
    
    
    
    

   
   
   
   

   
   
   
   

    
    
    
    静态缓存和动态缓存的比较 

    
    
    
    静态页面的缓存可能有2种形式：其实主要区别就是CMS是否自己负责关联内容的缓存更新管理。

    
    
    
     
     静态缓存：是在新内容发布的同时就立刻生成相应内容的静态页面，比如：2003年3月22日，管理员通过后台内容管理界面录入一篇文章后，就立刻生成http://www.chedong.com/tech/2003/03/22/001.html这个静态页面，并同步更新相关索引页上的链接。

 
     动态缓存：是在新内容发布以后，并不预先生成相应的静态页面，直到对相应内容发出请求时，如果前台缓存服务器找不到相应缓存，就向后台内容管理服务器发出请求，后台系统会生成相应内容的静态页面，用户第一次访问页面时可能会慢一点，但是以后就是直接访问缓存了。

如果去ZDNet等国外网站会发现他们使用的基于Vignette内容管理系统都有这样的页面名称：0,22342566,300458.html。其实这里的0,22342566,300458就是用逗号分割开的多个参数：
第一次访问找不到页面后，相当于会在服务器端产生一个doc_type= 0&doc_id=22342566&doc_template=300458的查询，
而查询结果会生成的缓存的静态页面： 0,22342566,300458.html
 
    

    
    
    
    静态缓存的缺点：

    
    
    
     
     复杂的触发更新机制：这两种机制在内容管理系统比较简单的时候都是非常适用的。但对于一个关系比较复杂的网站来说，页面之间的逻辑引用关系就成为一个非常非常复杂的问题。最典型的例子就是一条新闻要同时出现在新闻首页和相关的3个新闻专题中，在静态缓存模式中，每发一篇新文章，除了这篇新闻内容本身的页面外，还需要系统通过触发器生成多个新的相关静态页面，这些相关逻辑的触发也往往就会成为内容管理系统中最复杂的部分之一。  
     旧内容的批量更新： 通过静态缓存发布的内容，对于以前生成的静态页面的内容很难修改，这样用户访问旧页面时，新的模板根本无法生效。  
    

    
    
    
    在动态缓存模式中，每个动态页面只需要关心，而相关的其他页面能自动更新，从而大大减少了设计相关页面更新触发器的需要。


    
    
    
    以前做小型应用的时候也用过类似方式：应用首次访问以后将数据库的查询结果在本地存成一个文件，下次请求时先检查本地缓存目录中是否有缓存文件，从而减少对后台数据库的访问。虽然这样做也能承载比较大的负载，但这样的内容管理和缓存管理一体的系统是很难分离的，而且数据完整性也不是很好保存，内容更新时，应用需要把相应内容的的缓存文件删除。但是这样的设计在缓存文件很多的时候往往还需要将缓存目录做一定的分布，否则一个目录下的文件节点超过3000，rm *都会出错。


    
    
    
    这时候，系统需要再次分工，把复杂的内容管理系统分解成：内容输入和缓存这2个相对简单的系统实现。


    
    
    
     
     后台：内容管理系统，专心的将内容发布做好，比如：复杂的工作流管理，复杂的模板规则等……  
     前台：页面的缓存管理则可以使用缓存系统实现
 
    

    
    
    
    ______________________             ___________________
|Squid Software cache|             |F5 Hardware cache|
----------------------             -------------------
            /                    /
             / ________________ /
               |ASP |JSP |PHP |
             Content Manage System
               ----------------

    
    
    
    所以分工后：内容管理和缓存管理2者，无论哪一方面可选的余地都是非常大的：软件（比如前台80端口使用SQUID对后台8080的内容发布管理系统进行缓存），缓存硬件，甚至交给akamai这样的专业服务商。


    
    
    
    面向缓存的站点规划
一个利用SQUID对多个站点进行做WEB加速http acceleration方案：
    
    
    
    
原先一个站点的规划可能是这样的：
    
    
    
    
200.200.200.207 www.chedong.com 
    
    
    
    
200.200.200.208 news.chedong.com 
    
    
    
    
200.200.200.209 bbs.chedong.com 
    
    
    
    
200.200.200.205 images.chedong.com
    
    
    
    
面向缓存服务器的设计中：所有站点都通过外部DNS指向到同一个IP：200.200.200.200/201这2台缓存服务器上（使用2台是为了冗余备份）

    
    
    
                              _____________________   ________
www.chedong.com  请求  / |       cache box     | |        |  / 192.168.0.4   www.chedong.com 
news.chedong.com 请求   -| 200.200.200.200/201 |-|firewall| -  192.168.0.4   news.chedong.com 
bbs.chedong.com  请求  / |   /etc/hosts        | |   box  |  / 192.168.0.3   bbs.chedong.com
                          ---------------------   --------

工作原理：
    
    
    
    
外部请求过来时，设置缓存根据配置文件进行转向解析。这样，服务器请求就可以转发到我们指定的内部地址上。
    
    
    
    
在处理多虚拟主机转向方面：mod_proxy比squid要简单一些：可以把不同服务转向后后台多个IP的不同端口上。
    
    
    
    
而squid只能通过禁用DNS解析，然后根据本地的/etc/hosts文件根据请求的域名进行地址转发，后台多个服务器必须使用相同的端口。
    
    
    
    
使用反向代理加速，我们不仅可以得到性能上的提升，而且还能获得额外的安全性和配置的灵活度：
    
    
    
    


    
    
    
     
     配置灵活性提高：可以自己在内部服务器上控制后台服务器的DNS解析，当需要在服务器之间做迁移调整时，就不用大量修改外部DNS配置了，只需要修改内部DNS实现服务的调整。  
     数据安全性增加：所有后台服务器可以很方便的被保护在防火墙内。  
     后台应用设计复杂程度降低：原先为了效率常常需要建立专门的图片服务器images.chedong.com和负载比较高的应用服务器 bbs.chedong.com分离，在反向代理加速模式中，所有前台请求都通过缓存服务器：实际上就都是静态页面，这样，应用设计时就不用考虑图片和应用本身分离了，也大大降低了后台内容发布系统设计的复杂程度，由于数据和应用都存放在一起，也方便了文件系统的维护和管理。
 
    

    
    
    
    基于Apache mod_proxy的反向代理缓存加速实现
Apache包含了mod_proxy模块，可以用来实现代理服务器，针对后台服务器的反向加速
    
    
    
    
安装apache 1.3.x 编译时：
    
    
    
    
--enable-shared=max --enable-module=most
    
    
    
    

    
    
    
    注：Apache 2.x中mod_proxy已经被分离成mod_proxy和mod_cache：同时mod_cache有基于文件和基于内存的不同实现
    
    
    
    
创建/var/www/proxy，设置apache服务所用户可写
    
    
    
    
mod_proxy配置样例：反相代理缓存＋缓存
    
    
    
    
架设前台的www.example.com反向代理后台的www.backend.com的8080端口服务。
    
    
    
    
修改：httpd.conf
    
    
    
    
<VirtualHost *>
    
    
    
    
ServerName www.example.com
    
    
    
    
ServerAdmin [email protected]
    
    
    
    
# reverse proxy setting
    
    
    
    
ProxyPass / http://www.backend.com:8080/
    
    
    
    
ProxyPassReverse / http://www.backend.com:8080/
    
    
    
    
# cache dir root
    
    
    
    
CacheRoot "/var/www/proxy"
    
    
    
    
# max cache storage
    
    
    
    
CacheSize 50000000
    
    
    
    
# hour: every 4 hour 
    
    
    
    
CacheGcInterval 4
    
    
    
    
# max page expire time: hour
    
    
    
    
CacheMaxExpire 240
    
    
    
    
# Expire time = (now - last_modified) * CacheLastModifiedFactor 
    
    
    
    
CacheLastModifiedFactor 0.1
    
    
    
    
# defalt expire tag: hour
    
    
    
    
CacheDefaultExpire 1
    
    
    
    
# force complete after precent of content retrived: 60-90%
    
    
    
    
CacheForceCompletion 80
    
    
    
    
CustomLog /usr/local/apache/logs/dev_access_log combined
    
    
    
    
</VirtualHost>
    
    
    
    


    
    
    
    基于Squid的反向代理加速实现
Squid是一个更专用的代理服务器，性能和效率会比Apache的mod_proxy高很多。
    
    
    
    
如果需要combined格式日志补丁：
    
    
    
    

    http://www.squid-cache.org/mail-archive/squid-dev/200301/0164.html
    
    
    
    
squid的编译：
    
    
    
    
./configure --enable-useragent-log  --enable-referer-log --enable-default-err-language=Simplify_Chinese / --enable-err-languages="Simplify_Chinese English" --disable-internal-dns  
    
    
    
    
make
    
    
    
    
#make install
    
    
    
    
#cd /usr/local/squid
    
    
    
    
make dir cache
    
    
    
    
chown squid.squid *
    
    
    
    
vi /usr/local/squid/etc/squid.conf
    
    
    
    
在/etc/hosts中：加入内部的DNS解析，比如：
    
    
    
    
192.168.0.4 www.chedong.com 
    
    
    
    
192.168.0.4 news.chedong.com
    
    
    
    
192.168.0.3 bbs.chedong.com
    
    
    
    
---------------------cut here----------------------------------
    
    
    
    
# visible name
    
    
    
    
visible_hostname cache.example.com
    
    
    
    
# cache config: space use 1G and memory use 256M
    
    
    
    
cache_dir ufs /usr/local/squid/cache 1024 16 256 
    
    
    
    
cache_mem 256 MB
    
    
    
    
cache_effective_user squid
    
    
    
    
cache_effective_group squid
    
    
    
    

    
    
    
    
http_port 80
    
    
    
    
httpd_accel_host virtual
    
    
    
    
httpd_accel_single_host off
    
    
    
    
httpd_accel_port 80
    
    
    
    
httpd_accel_uses_host_header on
    
    
    
    
httpd_accel_with_proxy on
    
    
    
    
# accelerater my domain only
    
    
    
    
acl acceleratedHostA dstdomain .example1.com
    
    
    
    
acl acceleratedHostB dstdomain .example2.com
    
    
    
    
acl acceleratedHostC dstdomain .example3.com
    
    
    
    
# accelerater http protocol on port 80
    
    
    
    
acl acceleratedProtocol protocol HTTP
    
    
    
    
acl acceleratedPort port 80
    
    
    
    
# access arc
    
    
    
    
acl all src 0.0.0.0/0.0.0.0
    
    
    
    
# Allow requests when they are to the accelerated machine AND to the
    
    
    
    
# right port with right protocol
    
    
    
    
http_access allow acceleratedProtocol acceleratedPort acceleratedHostA
    
    
    
    
http_access allow acceleratedProtocol acceleratedPort acceleratedHostB
    
    
    
    
http_access allow acceleratedProtocol acceleratedPort acceleratedHostC
    
    
    
    
# logging
    
    
    
    
emulate_httpd_log on
    
    
    
    
cache_store_log none
    
    
    
    
# manager
    
    
    
    
acl manager proto cache_object
    
    
    
    
http_access allow manager all
    
    
    
    
cachemgr_passwd pass all
    
    
    
    

    
    
    
    
----------------------cut here---------------------------------
    
    
    
    
创建缓存目录：
    
    
    
    
/usr/local/squid/sbin/squid -z
    
    
    
    
启动squid
    
    
    
    
/usr/local/squid/sbin/squid
    
    
    
    
停止squid：
    
    
    
    
/usr/local/squid/sbin/squid -k shutdown
    
    
    
    
启用新配置：
    
    
    
    
/usr/local/squid/sbin/squid -k reconfig
    
    
    
    
通过crontab每天0点截断/轮循日志：
    
    
    
    
0 0 * * * (/usr/local/squid/sbin/squid -k rotate) 
    
    
    
    


    
    
    
    可缓存的动态页面设计
什么样的页面能够比较好的被缓存服务器缓存呢？如果返回内容的HTTP HEADER中有"Last-Modified"和"Expires"相关声明，比如：
    
    
    
    
Last-Modified: Wed, 14 May 2003 13:06:17 GMT
    
    
    
    
Expires: Fri, 16 Jun 2003 13:06:17 GMT
    
    
    
    
前端缓存服务器在期间会将生成的页面缓存在本地：硬盘或者内存中，直至上述页面过期。
    
    
    
    
因此，一个可缓存的页面：

    
    
    
     
     页面必须包含Last-Modified: 标记
一般纯静态页面本身都会有Last-Modified信息，动态页面需要通过函数强制加上，比如在PHP中：
// always modified now
header("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT");

 
     必须有Expires或Cache-Control: max-age标记设置页面的过期时间：
对于静态页面，通过apache的mod_expires根据页面的MIME类型设置缓存周期：比如图片缺省是1个月，HTML页面缺省是2天等。
<IfModule mod_expires.c> 
    ExpiresActive on
    ExpiresByType image/gif "access plus 1 month"
    ExpiresByType text/css "now plus 2 day"
    ExpiresDefault "now plus 1 day"
</IfModule>

对于动态页面，则可以直接通过写入HTTP返回的头信息，比如对于新闻首页index.php可以是20分钟，而对于具体的一条新闻页面可能是1天后过期。比如：在php中加入了1个月后过期：
// Expires one month later
header("Expires: " .gmdate ("D, d M Y H:i:s", time() + 3600 * 24 * 30). " GMT");

 
     如果服务器端有基于HTTP的认证，必须有Cache-Control: public标记，允许前台  
    
ASP应用的缓存改造 首先在公用的包含文件中(比如include.asp)加入以下公用函数：
    
    
    
    
<%
    
    
    
    
' Set Expires Header in minutes
    
    
    
    
Function SetExpiresHeader(ByVal minutes) 
    
    
    
    
    ' set Page Last-Modified Header:
    
    
    
    
    ' Converts date (19991022 11:08:38) to http form (Fri, 22 Oct 1999 12:08:38 GMT)
    
    
    
    
    Response.AddHeader "Last-Modified", DateToHTTPDate(Now())
    
    
    
    
    
    
    
    
    
    ' The Page Expires in Minutes
    
    
    
    
    Response.Expires = minutes
    
    
    
    
    
    
    
    
    
    ' Set cache control to externel applications
    
    
    
    
    Response.CacheControl = "public"
    
    
    
    
End Function 
    
    
    
    
' Converts date (19991022 11:08:38) to http form (Fri, 22 Oct 1999 12:08:38 GMT)
    
    
    
    
Function DateToHTTPDate(ByVal OleDATE)
    
    
    
    
  Const GMTdiff = #08:00:00#
    
    
    
    
  OleDATE = OleDATE - GMTdiff
    
    
    
    
  DateToHTTPDate = engWeekDayName(OleDATE) & _
    
    
    
    
    ", " & Right("0" & Day(OleDATE),2) & " " & engMonthName(OleDATE) & _
    
    
    
    
    " " & Year(OleDATE) & " " & Right("0" & Hour(OleDATE),2) & _
    
    
    
    
    ":" & Right("0" & Minute(OleDATE),2) & ":" & Right("0" & Second(OleDATE),2) & " GMT"
    
    
    
    
End Function 
    
    
    
    
Function engWeekDayName(dt)
    
    
    
    
    Dim Out
    
    
    
    
    Select Case WeekDay(dt,1)
    
    
    
    
        Case 1:Out="Sun"
    
    
    
    
        Case 2:Out="Mon"
    
    
    
    
        Case 3:Out="Tue"
    
    
    
    
        Case 4:Out="Wed"
    
    
    
    
        Case 5:Out="Thu"
    
    
    
    
        Case 6:Out="Fri"
    
    
    
    
        Case 7:Out="Sat"
    
    
    
    
    End Select
    
    
    
    
    engWeekDayName = Out
    
    
    
    
End Function
    
    
    
    
Function engMonthName(dt)
    
    
    
    
    Dim Out
    
    
    
    
    Select Case Month(dt)
    
    
    
    
        Case 1:Out="Jan"
    
    
    
    
        Case 2:Out="Feb"
    
    
    
    
        Case 3:Out="Mar"
    
    
    
    
        Case 4:Out="Apr"
    
    
    
    
        Case 5:Out="May"
    
    
    
    
        Case 6:Out="Jun"
    
    
    
    
        Case 7:Out="Jul"
    
    
    
    
        Case 8:Out="Aug"
    
    
    
    
        Case 9:Out="Sep"
    
    
    
    
        Case 10:Out="Oct"
    
    
    
    
        Case 11:Out="Nov"
    
    
    
    
        Case 12:Out="Dec"
    
    
    
    
    End Select
    
    
    
    
    engMonthName = Out
    
    
    
    
End Function
    
    
    
    
%>
    
    
    
    
然后在具体的页面中，比如index.asp和news.asp的“最上面”加入以下代码：HTTP Header
    
    
    
    
<!--#include file="../include.asp"-->
    
    
    
    
<%
    
    
    
    
'页面将被设置20分钟后过期
    
    
    
    
SetExpiresHeader(20)
    
    
    
    
%>
    
    
    
    


    
    
    
    应用的缓存兼容性设计

    
    
    
    
经过代理以后，由于在客户端和服务之间增加了中间层，因此服务器无法直接拿到客户端的IP，服务器端应用也无法直接通过转发请求的地址返回给客户端。但是在转发请求的HTTD头信息中，增加了HTTP_X_FORWARDED_????信息。用以跟踪原有的客户端IP地址和原来客户端请求的服务器地址：
    
    
    
    
下面是2个例子，用于说明缓存兼容性应用的设计原则：
    
    
    
    


    
    
    
    ___FCKpd___2

    
    
    
    
注意：HTTP_X_FORWARDED_FOR如果经过了多个中间代理服务器，有何能是逗号分割的多个地址，
    
    
    
    
比如：200.28.7.155,200.10.225.77 unknown,219.101.137.3
    
    
    
    
因此在很多旧的数据库设计中（比如BBS）往往用来记录客户端地址的字段被设置成20个字节就显得过小了。
    
    
    
    
经常见到类似以下的错误信息：
    
    
    
    

    

    
    
    
    Microsoft JET Database Engine 错误 '80040e57' 

    
    
    
    字段太小而不能接受所要添加的数据的数量。试着插入或粘贴较少的数据。 

    
    
    
    /inc/char.asp，行236 
原因就是在设计客户端访问地址时，相关用户IP字段大小最好要设计到50个字节以上，当然经过3层以上代理的几率也非常小。
    
    
    
    
如何检查目前站点页面的可缓存性（Cacheablility）呢？可以参考以下2个站点上的工具：
    
    
    
    

    http://www.ircache.net/cgi-bin/cacheability.py
    
    
    
    


    
    
    
    附：SQUID性能测试试验

    
    
    
    
phpMan.php是一个基于php的man page server，每个man
    
    
    
    
page需要调用后台的man命令和很多页面格式化工具，系统负载比较高，提供了Cache
    
    
    
    
Friendly的URL，以下是针对同样的页面的性能测试资料：
    
    
    
    
测试环境：Redhat 8 on Cyrix 266 / 192M Mem 
    
    
    
    
测试程序：使用apache的ab(apache benchmark)：
    
    
    
    
测试条件：请求50次，并发50个连接
    
    
    
    
测试项目：直接通过apache 1.3 (80端口) vs squid 2.5(8000端口：加速80端口) 
    
    
    
    

    
    
    
    
测试1：无CACHE的80端口动态输出：
    
    
    
    
ab -n 100 -c 10 http://www.chedong.com:81/phpMan.php/man/kill/1
    
    
    
    
This is ApacheBench, Version 1.3d <$Revision: 1.2 $> apache-1.3
    
    
    
    
Copyright (c) 1996 Adam Twiss, Zeus Technology Ltd,
    
    
    
    
http://www.zeustech.net/
    
    
    
    
Copyright (c) 1998-2001 The Apache Group, http://www.apache.org/
    
    
    
    

    
    
    
    
Benchmarking localhost (be patient).....done
    
    
    
    
Server Software:       
    
    
    
    
Apache/1.3.23                                     
    
    
    
    
Server Hostname:        localhost
    
    
    
    
Server
    
    
    
    
Port:           
    
    
    
    
80
    
    
    
    

    
    
    
    
Document Path:         
    
    
    
    
/phpMan.php/man/kill/1
    
    
    
    
Document Length:        4655 bytes
    
    
    
    

    
    
    
    
Concurrency Level:      5
    
    
    
    
Time taken for tests:   63.164 seconds
    
    
    
    
Complete requests:      50
    
    
    
    
Failed requests:        0
    
    
    
    
Broken pipe errors:     0
    
    
    
    
Total transferred:      245900 bytes
    
    
    
    
HTML transferred:       232750 bytes
    
    
    
    
Requests per second:    0.79 [#/sec] (mean)
    
    
    
    
Time per request:       6316.40 [ms]
    
    
    
    
(mean)
    
    
    
    
Time per request:       1263.28 [ms]
    
    
    
    
(mean, across all concurrent requests)
    
    
    
    
Transfer rate:         
    
    
    
    
3.89 [Kbytes/sec] received
    
    
    
    

    
    
    
    
Connnection Times (ms)
    
    
    
    
             
    
    
    
    
min  mean[+/-sd] median   max
    
    
    
    
Connect:        0   
    
    
    
    
29  106.1      0   553
    
    
    
    

    
    
    
    Processing:  2942  6016
1845.4   6227 10796
    
    
    
    

    
    
    
    

    
    
    
    Waiting:    
2941  5999 1850.7   6226 10795
    
    
    
    

    
    
    
    

    
    
    
    Total:      
2942  6045 1825.9   6227 10796
    
    
    
    

    
    
    
    
Percentage of the requests served within a certain time (ms)
    
    
    
    
  50%   6227
    
    
    
    
  66%   7069
    
    
    
    
  75%   7190
    
    
    
    
  80%   7474
    
    
    
    
  90%   8195
    
    
    
    
  95%   8898
    
    
    
    
  98%   9721
    
    
    
    
  99%  10796
    
    
    
    
 100%  10796 (last request)
    
    
    
    

    
    
    
    
测试2：SQUID缓存输出
    
    
    
    
/home/apache/bin/ab -n50 -c5
    
    
    
    
"http://localhost:8000/phpMan.php/man/kill/1"
    
    
    
    
This is ApacheBench, Version 1.3d <$Revision: 1.2 $> apache-1.3
    
    
    
    
Copyright (c) 1996 Adam Twiss, Zeus Technology Ltd,
    
    
    
    
http://www.zeustech.net/
    
    
    
    
Copyright (c) 1998-2001 The Apache Group, http://www.apache.org/
    
    
    
    

    
    
    
    
Benchmarking localhost (be patient).....done
    
    
    
    
Server Software:       
    
    
    
    
Apache/1.3.23                                     
    
    
    
    
Server Hostname:        localhost
    
    
    
    
Server
    
    
    
    
Port:           
    
    
    
    
8000
    
    
    
    

    
    
    
    
Document Path:         
    
    
    
    
/phpMan.php/man/kill/1
    
    
    
    
Document Length:        4655 bytes
    
    
    
    

    
    
    
    
Concurrency Level:      5
    
    
    
    
Time taken for tests:   4.265 seconds
    
    
    
    
Complete requests:      50
    
    
    
    
Failed requests:        0
    
    
    
    
Broken pipe errors:     0
    
    
    
    
Total transferred:      248043 bytes
    
    
    
    
HTML transferred:       232750 bytes
    
    
    
    
Requests per second:    11.72 [#/sec] (mean)
    
    
    
    
Time per request:       426.50 [ms] (mean)
    
    
    
    
Time per request:       85.30 [ms] (mean,
    
    
    
    
across all concurrent requests)
    
    
    
    
Transfer rate:         
    
    
    
    
58.16 [Kbytes/sec] received
    
    
    
    

    
    
    
    
Connnection Times (ms)
    
    
    
    
             
    
    
    
    
min  mean[+/-sd] median   max
    
    
    
    
Connect:       
    
    
    
    
0     1   
    
    
    
    
9.5      0    68
    
    
    
    

    
    
    
    Processing:    
7    83  537.4     
7  3808
    
    
    
    

    
    
    
    

    
    
    
    Waiting:       
5    81  529.1     
6  3748
    
    
    
    

    
    
    
    

    
    
    
    Total:         
7    84  547.0     
7  3876
    
    
    
    

    
    
    
    
Percentage of the requests served within a certain time (ms)
    
    
    
    
  50%      7
    
    
    
    
  66%      7
    
    
    
    
  75%      7
    
    
    
    
  80%      7
    
    
    
    
  90%      7
    
    
    
    
  95%      7
    
    
    
    
  98%      8
    
    
    
    
  99%   3876
    
    
    
    
 100%   3876 (last request)
    
    
    
    

    
    
    
    
结论：No Cache / Cache = 6045 / 84 = 70
    
    
    
    
结论：对于可能被缓存请求的页面，服务器速度可以有2个数量级的提高，因为SQUID是把缓存页面放在内存里的（因此几乎没有硬盘I/O操作）。
    
    
    
    

    
    
    
    
小节：
    
    
    
    


    
    
    
     
     
 
     大访问量的网站应尽可能将动态网页生成静态页面作为缓存发布，甚至对于搜索引擎这样的动态应用来说，缓存机制也是非常非常重要的。 
 
     在动态页面中利用HTTP Header定义缓存更新策略。 
 
     利用缓存服务器获得额外的配置和安全性 
 
     日志非常重要：SQUID日志缺省不支持COMBINED日志，但对于需要REFERER日志的这个补丁非常重要：http://www.squid-cache.org/mail-archive/squid-dev/200301/0164.html


 
    

    
    
    
    
参考资料：
    
    
    
    

    HTTP代理缓存 
    
    
    
    
http://vancouver-webpages.com/proxy.html

    
    
    
     

    
    
    
    

    可缓存的页面设计
    
    
    
    
http://linux.oreillynet.com/pub/a/linux/2002/02/28/cachefriendly.html
    
    
    
    

    运用ASP.NET的输出缓冲来存储动态页面 -  开发者 - ZDNet China
    
    
    
    
http://www.zdnet.com.cn/developer/tech/story/0,2000081602,39110239-2,00.htm
    
    
    
    
 
   
   
   
   
SERVER["HTTP_X_FORWARDED_FOR"]) {
            $user_ip = 
   
   
   
   

    
    
    
    内容摘要：
对于一个日访问量达到百万级的网站来说，速度很快就成为一个瓶颈。除了优化内容发布系统的应用本身外，如果能把不需要实时更新的动态页面的输出结果转化成静态网页来发布，速度上的提升效果将是显著的，因为一个动态页面的速度往往会比静态页面慢2－10倍，而静态网页的内容如果能被缓存在内存里，访问速度甚至会比原有动态网页有2－3个数量级的提高。


    
    
    
     
     动态缓存和静态缓存的比较  
     基于反向代理加速的站点规划
 
     基于apache mod_proxy的反向代理加速实现  
     基于squid的反向代理加速实现  
     面向缓存的页面设计  
     应用的缓存兼容性设计：
HTTP_HOST/SERVER_NAME和REMOTE_ADDR/REMOTE_HOST需要用 HTTP_X_FORWARDED_HOST/HTTP_X_FORWARDED_SERVER代替  
    
后台的内容管理系统的页面输出遵守可缓存的设计，这样就可以把性能问题交给前台的缓存服务器来解决了，从而大大简化CMS系统本身的复杂程度。
    
    
    
    

   
   
   
   

   
   
   
   

    
    
    
    静态缓存和动态缓存的比较 

    
    
    
    静态页面的缓存可能有2种形式：其实主要区别就是CMS是否自己负责关联内容的缓存更新管理。

    
    
    
     
     静态缓存：是在新内容发布的同时就立刻生成相应内容的静态页面，比如：2003年3月22日，管理员通过后台内容管理界面录入一篇文章后，就立刻生成http://www.chedong.com/tech/2003/03/22/001.html这个静态页面，并同步更新相关索引页上的链接。

 
     动态缓存：是在新内容发布以后，并不预先生成相应的静态页面，直到对相应内容发出请求时，如果前台缓存服务器找不到相应缓存，就向后台内容管理服务器发出请求，后台系统会生成相应内容的静态页面，用户第一次访问页面时可能会慢一点，但是以后就是直接访问缓存了。

如果去ZDNet等国外网站会发现他们使用的基于Vignette内容管理系统都有这样的页面名称：0,22342566,300458.html。其实这里的0,22342566,300458就是用逗号分割开的多个参数：
第一次访问找不到页面后，相当于会在服务器端产生一个doc_type= 0&doc_id=22342566&doc_template=300458的查询，
而查询结果会生成的缓存的静态页面： 0,22342566,300458.html
 
    

    
    
    
    静态缓存的缺点：

    
    
    
     
     复杂的触发更新机制：这两种机制在内容管理系统比较简单的时候都是非常适用的。但对于一个关系比较复杂的网站来说，页面之间的逻辑引用关系就成为一个非常非常复杂的问题。最典型的例子就是一条新闻要同时出现在新闻首页和相关的3个新闻专题中，在静态缓存模式中，每发一篇新文章，除了这篇新闻内容本身的页面外，还需要系统通过触发器生成多个新的相关静态页面，这些相关逻辑的触发也往往就会成为内容管理系统中最复杂的部分之一。  
     旧内容的批量更新： 通过静态缓存发布的内容，对于以前生成的静态页面的内容很难修改，这样用户访问旧页面时，新的模板根本无法生效。  
    

    
    
    
    在动态缓存模式中，每个动态页面只需要关心，而相关的其他页面能自动更新，从而大大减少了设计相关页面更新触发器的需要。


    
    
    
    以前做小型应用的时候也用过类似方式：应用首次访问以后将数据库的查询结果在本地存成一个文件，下次请求时先检查本地缓存目录中是否有缓存文件，从而减少对后台数据库的访问。虽然这样做也能承载比较大的负载，但这样的内容管理和缓存管理一体的系统是很难分离的，而且数据完整性也不是很好保存，内容更新时，应用需要把相应内容的的缓存文件删除。但是这样的设计在缓存文件很多的时候往往还需要将缓存目录做一定的分布，否则一个目录下的文件节点超过3000，rm *都会出错。


    
    
    
    这时候，系统需要再次分工，把复杂的内容管理系统分解成：内容输入和缓存这2个相对简单的系统实现。


    
    
    
     
     后台：内容管理系统，专心的将内容发布做好，比如：复杂的工作流管理，复杂的模板规则等……  
     前台：页面的缓存管理则可以使用缓存系统实现
 
    

    
    
    
    ______________________             ___________________
|Squid Software cache|             |F5 Hardware cache|
----------------------             -------------------
            /                    /
             / ________________ /
               |ASP |JSP |PHP |
             Content Manage System
               ----------------

    
    
    
    所以分工后：内容管理和缓存管理2者，无论哪一方面可选的余地都是非常大的：软件（比如前台80端口使用SQUID对后台8080的内容发布管理系统进行缓存），缓存硬件，甚至交给akamai这样的专业服务商。


    
    
    
    面向缓存的站点规划
一个利用SQUID对多个站点进行做WEB加速http acceleration方案：
    
    
    
    
原先一个站点的规划可能是这样的：
    
    
    
    
200.200.200.207 www.chedong.com 
    
    
    
    
200.200.200.208 news.chedong.com 
    
    
    
    
200.200.200.209 bbs.chedong.com 
    
    
    
    
200.200.200.205 images.chedong.com
    
    
    
    
面向缓存服务器的设计中：所有站点都通过外部DNS指向到同一个IP：200.200.200.200/201这2台缓存服务器上（使用2台是为了冗余备份）

    
    
    
                              _____________________   ________
www.chedong.com  请求  / |       cache box     | |        |  / 192.168.0.4   www.chedong.com 
news.chedong.com 请求   -| 200.200.200.200/201 |-|firewall| -  192.168.0.4   news.chedong.com 
bbs.chedong.com  请求  / |   /etc/hosts        | |   box  |  / 192.168.0.3   bbs.chedong.com
                          ---------------------   --------

工作原理：
    
    
    
    
外部请求过来时，设置缓存根据配置文件进行转向解析。这样，服务器请求就可以转发到我们指定的内部地址上。
    
    
    
    
在处理多虚拟主机转向方面：mod_proxy比squid要简单一些：可以把不同服务转向后后台多个IP的不同端口上。
    
    
    
    
而squid只能通过禁用DNS解析，然后根据本地的/etc/hosts文件根据请求的域名进行地址转发，后台多个服务器必须使用相同的端口。
    
    
    
    
使用反向代理加速，我们不仅可以得到性能上的提升，而且还能获得额外的安全性和配置的灵活度：
    
    
    
    


    
    
    
     
     配置灵活性提高：可以自己在内部服务器上控制后台服务器的DNS解析，当需要在服务器之间做迁移调整时，就不用大量修改外部DNS配置了，只需要修改内部DNS实现服务的调整。  
     数据安全性增加：所有后台服务器可以很方便的被保护在防火墙内。  
     后台应用设计复杂程度降低：原先为了效率常常需要建立专门的图片服务器images.chedong.com和负载比较高的应用服务器 bbs.chedong.com分离，在反向代理加速模式中，所有前台请求都通过缓存服务器：实际上就都是静态页面，这样，应用设计时就不用考虑图片和应用本身分离了，也大大降低了后台内容发布系统设计的复杂程度，由于数据和应用都存放在一起，也方便了文件系统的维护和管理。
 
    

    
    
    
    基于Apache mod_proxy的反向代理缓存加速实现
Apache包含了mod_proxy模块，可以用来实现代理服务器，针对后台服务器的反向加速
    
    
    
    
安装apache 1.3.x 编译时：
    
    
    
    
--enable-shared=max --enable-module=most
    
    
    
    

    
    
    
    注：Apache 2.x中mod_proxy已经被分离成mod_proxy和mod_cache：同时mod_cache有基于文件和基于内存的不同实现
    
    
    
    
创建/var/www/proxy，设置apache服务所用户可写
    
    
    
    
mod_proxy配置样例：反相代理缓存＋缓存
    
    
    
    
架设前台的www.example.com反向代理后台的www.backend.com的8080端口服务。
    
    
    
    
修改：httpd.conf
    
    
    
    
<VirtualHost *>
    
    
    
    
ServerName www.example.com
    
    
    
    
ServerAdmin [email protected]
    
    
    
    
# reverse proxy setting
    
    
    
    
ProxyPass / http://www.backend.com:8080/
    
    
    
    
ProxyPassReverse / http://www.backend.com:8080/
    
    
    
    
# cache dir root
    
    
    
    
CacheRoot "/var/www/proxy"
    
    
    
    
# max cache storage
    
    
    
    
CacheSize 50000000
    
    
    
    
# hour: every 4 hour 
    
    
    
    
CacheGcInterval 4
    
    
    
    
# max page expire time: hour
    
    
    
    
CacheMaxExpire 240
    
    
    
    
# Expire time = (now - last_modified) * CacheLastModifiedFactor 
    
    
    
    
CacheLastModifiedFactor 0.1
    
    
    
    
# defalt expire tag: hour
    
    
    
    
CacheDefaultExpire 1
    
    
    
    
# force complete after precent of content retrived: 60-90%
    
    
    
    
CacheForceCompletion 80
    
    
    
    
CustomLog /usr/local/apache/logs/dev_access_log combined
    
    
    
    
</VirtualHost>
    
    
    
    


    
    
    
    基于Squid的反向代理加速实现
Squid是一个更专用的代理服务器，性能和效率会比Apache的mod_proxy高很多。
    
    
    
    
如果需要combined格式日志补丁：
    
    
    
    

    http://www.squid-cache.org/mail-archive/squid-dev/200301/0164.html
    
    
    
    
squid的编译：
    
    
    
    
./configure --enable-useragent-log  --enable-referer-log --enable-default-err-language=Simplify_Chinese / --enable-err-languages="Simplify_Chinese English" --disable-internal-dns  
    
    
    
    
make
    
    
    
    
#make install
    
    
    
    
#cd /usr/local/squid
    
    
    
    
make dir cache
    
    
    
    
chown squid.squid *
    
    
    
    
vi /usr/local/squid/etc/squid.conf
    
    
    
    
在/etc/hosts中：加入内部的DNS解析，比如：
    
    
    
    
192.168.0.4 www.chedong.com 
    
    
    
    
192.168.0.4 news.chedong.com
    
    
    
    
192.168.0.3 bbs.chedong.com
    
    
    
    
---------------------cut here----------------------------------
    
    
    
    
# visible name
    
    
    
    
visible_hostname cache.example.com
    
    
    
    
# cache config: space use 1G and memory use 256M
    
    
    
    
cache_dir ufs /usr/local/squid/cache 1024 16 256 
    
    
    
    
cache_mem 256 MB
    
    
    
    
cache_effective_user squid
    
    
    
    
cache_effective_group squid
    
    
    
    

    
    
    
    
http_port 80
    
    
    
    
httpd_accel_host virtual
    
    
    
    
httpd_accel_single_host off
    
    
    
    
httpd_accel_port 80
    
    
    
    
httpd_accel_uses_host_header on
    
    
    
    
httpd_accel_with_proxy on
    
    
    
    
# accelerater my domain only
    
    
    
    
acl acceleratedHostA dstdomain .example1.com
    
    
    
    
acl acceleratedHostB dstdomain .example2.com
    
    
    
    
acl acceleratedHostC dstdomain .example3.com
    
    
    
    
# accelerater http protocol on port 80
    
    
    
    
acl acceleratedProtocol protocol HTTP
    
    
    
    
acl acceleratedPort port 80
    
    
    
    
# access arc
    
    
    
    
acl all src 0.0.0.0/0.0.0.0
    
    
    
    
# Allow requests when they are to the accelerated machine AND to the
    
    
    
    
# right port with right protocol
    
    
    
    
http_access allow acceleratedProtocol acceleratedPort acceleratedHostA
    
    
    
    
http_access allow acceleratedProtocol acceleratedPort acceleratedHostB
    
    
    
    
http_access allow acceleratedProtocol acceleratedPort acceleratedHostC
    
    
    
    
# logging
    
    
    
    
emulate_httpd_log on
    
    
    
    
cache_store_log none
    
    
    
    
# manager
    
    
    
    
acl manager proto cache_object
    
    
    
    
http_access allow manager all
    
    
    
    
cachemgr_passwd pass all
    
    
    
    

    
    
    
    
----------------------cut here---------------------------------
    
    
    
    
创建缓存目录：
    
    
    
    
/usr/local/squid/sbin/squid -z
    
    
    
    
启动squid
    
    
    
    
/usr/local/squid/sbin/squid
    
    
    
    
停止squid：
    
    
    
    
/usr/local/squid/sbin/squid -k shutdown
    
    
    
    
启用新配置：
    
    
    
    
/usr/local/squid/sbin/squid -k reconfig
    
    
    
    
通过crontab每天0点截断/轮循日志：
    
    
    
    
0 0 * * * (/usr/local/squid/sbin/squid -k rotate) 
    
    
    
    


    
    
    
    可缓存的动态页面设计
什么样的页面能够比较好的被缓存服务器缓存呢？如果返回内容的HTTP HEADER中有"Last-Modified"和"Expires"相关声明，比如：
    
    
    
    
Last-Modified: Wed, 14 May 2003 13:06:17 GMT
    
    
    
    
Expires: Fri, 16 Jun 2003 13:06:17 GMT
    
    
    
    
前端缓存服务器在期间会将生成的页面缓存在本地：硬盘或者内存中，直至上述页面过期。
    
    
    
    
因此，一个可缓存的页面：

    
    
    
     
     页面必须包含Last-Modified: 标记
一般纯静态页面本身都会有Last-Modified信息，动态页面需要通过函数强制加上，比如在PHP中：
// always modified now
header("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT");

 
     必须有Expires或Cache-Control: max-age标记设置页面的过期时间：
对于静态页面，通过apache的mod_expires根据页面的MIME类型设置缓存周期：比如图片缺省是1个月，HTML页面缺省是2天等。
<IfModule mod_expires.c> 
    ExpiresActive on
    ExpiresByType image/gif "access plus 1 month"
    ExpiresByType text/css "now plus 2 day"
    ExpiresDefault "now plus 1 day"
</IfModule>

对于动态页面，则可以直接通过写入HTTP返回的头信息，比如对于新闻首页index.php可以是20分钟，而对于具体的一条新闻页面可能是1天后过期。比如：在php中加入了1个月后过期：
// Expires one month later
header("Expires: " .gmdate ("D, d M Y H:i:s", time() + 3600 * 24 * 30). " GMT");

 
     如果服务器端有基于HTTP的认证，必须有Cache-Control: public标记，允许前台  
    
ASP应用的缓存改造 首先在公用的包含文件中(比如include.asp)加入以下公用函数：
    
    
    
    
<%
    
    
    
    
' Set Expires Header in minutes
    
    
    
    
Function SetExpiresHeader(ByVal minutes) 
    
    
    
    
    ' set Page Last-Modified Header:
    
    
    
    
    ' Converts date (19991022 11:08:38) to http form (Fri, 22 Oct 1999 12:08:38 GMT)
    
    
    
    
    Response.AddHeader "Last-Modified", DateToHTTPDate(Now())
    
    
    
    
    
    
    
    
    
    ' The Page Expires in Minutes
    
    
    
    
    Response.Expires = minutes
    
    
    
    
    
    
    
    
    
    ' Set cache control to externel applications
    
    
    
    
    Response.CacheControl = "public"
    
    
    
    
End Function 
    
    
    
    
' Converts date (19991022 11:08:38) to http form (Fri, 22 Oct 1999 12:08:38 GMT)
    
    
    
    
Function DateToHTTPDate(ByVal OleDATE)
    
    
    
    
  Const GMTdiff = #08:00:00#
    
    
    
    
  OleDATE = OleDATE - GMTdiff
    
    
    
    
  DateToHTTPDate = engWeekDayName(OleDATE) & _
    
    
    
    
    ", " & Right("0" & Day(OleDATE),2) & " " & engMonthName(OleDATE) & _
    
    
    
    
    " " & Year(OleDATE) & " " & Right("0" & Hour(OleDATE),2) & _
    
    
    
    
    ":" & Right("0" & Minute(OleDATE),2) & ":" & Right("0" & Second(OleDATE),2) & " GMT"
    
    
    
    
End Function 
    
    
    
    
Function engWeekDayName(dt)
    
    
    
    
    Dim Out
    
    
    
    
    Select Case WeekDay(dt,1)
    
    
    
    
        Case 1:Out="Sun"
    
    
    
    
        Case 2:Out="Mon"
    
    
    
    
        Case 3:Out="Tue"
    
    
    
    
        Case 4:Out="Wed"
    
    
    
    
        Case 5:Out="Thu"
    
    
    
    
        Case 6:Out="Fri"
    
    
    
    
        Case 7:Out="Sat"
    
    
    
    
    End Select
    
    
    
    
    engWeekDayName = Out
    
    
    
    
End Function
    
    
    
    
Function engMonthName(dt)
    
    
    
    
    Dim Out
    
    
    
    
    Select Case Month(dt)
    
    
    
    
        Case 1:Out="Jan"
    
    
    
    
        Case 2:Out="Feb"
    
    
    
    
        Case 3:Out="Mar"
    
    
    
    
        Case 4:Out="Apr"
    
    
    
    
        Case 5:Out="May"
    
    
    
    
        Case 6:Out="Jun"
    
    
    
    
        Case 7:Out="Jul"
    
    
    
    
        Case 8:Out="Aug"
    
    
    
    
        Case 9:Out="Sep"
    
    
    
    
        Case 10:Out="Oct"
    
    
    
    
        Case 11:Out="Nov"
    
    
    
    
        Case 12:Out="Dec"
    
    
    
    
    End Select
    
    
    
    
    engMonthName = Out
    
    
    
    
End Function
    
    
    
    
%>
    
    
    
    
然后在具体的页面中，比如index.asp和news.asp的“最上面”加入以下代码：HTTP Header
    
    
    
    
<!--#include file="../include.asp"-->
    
    
    
    
<%
    
    
    
    
'页面将被设置20分钟后过期
    
    
    
    
SetExpiresHeader(20)
    
    
    
    
%>
    
    
    
    


    
    
    
    应用的缓存兼容性设计

    
    
    
    
经过代理以后，由于在客户端和服务之间增加了中间层，因此服务器无法直接拿到客户端的IP，服务器端应用也无法直接通过转发请求的地址返回给客户端。但是在转发请求的HTTD头信息中，增加了HTTP_X_FORWARDED_????信息。用以跟踪原有的客户端IP地址和原来客户端请求的服务器地址：
    
    
    
    
下面是2个例子，用于说明缓存兼容性应用的设计原则：
    
    
    
    


    
    
    
    ___FCKpd___2

    
    
    
    
注意：HTTP_X_FORWARDED_FOR如果经过了多个中间代理服务器，有何能是逗号分割的多个地址，
    
    
    
    
比如：200.28.7.155,200.10.225.77 unknown,219.101.137.3
    
    
    
    
因此在很多旧的数据库设计中（比如BBS）往往用来记录客户端地址的字段被设置成20个字节就显得过小了。
    
    
    
    
经常见到类似以下的错误信息：
    
    
    
    

    

    
    
    
    Microsoft JET Database Engine 错误 '80040e57' 

    
    
    
    字段太小而不能接受所要添加的数据的数量。试着插入或粘贴较少的数据。 

    
    
    
    /inc/char.asp，行236 
原因就是在设计客户端访问地址时，相关用户IP字段大小最好要设计到50个字节以上，当然经过3层以上代理的几率也非常小。
    
    
    
    
如何检查目前站点页面的可缓存性（Cacheablility）呢？可以参考以下2个站点上的工具：
    
    
    
    

    http://www.ircache.net/cgi-bin/cacheability.py
    
    
    
    


    
    
    
    附：SQUID性能测试试验

    
    
    
    
phpMan.php是一个基于php的man page server，每个man
    
    
    
    
page需要调用后台的man命令和很多页面格式化工具，系统负载比较高，提供了Cache
    
    
    
    
Friendly的URL，以下是针对同样的页面的性能测试资料：
    
    
    
    
测试环境：Redhat 8 on Cyrix 266 / 192M Mem 
    
    
    
    
测试程序：使用apache的ab(apache benchmark)：
    
    
    
    
测试条件：请求50次，并发50个连接
    
    
    
    
测试项目：直接通过apache 1.3 (80端口) vs squid 2.5(8000端口：加速80端口) 
    
    
    
    

    
    
    
    
测试1：无CACHE的80端口动态输出：
    
    
    
    
ab -n 100 -c 10 http://www.chedong.com:81/phpMan.php/man/kill/1
    
    
    
    
This is ApacheBench, Version 1.3d <$Revision: 1.2 $> apache-1.3
    
    
    
    
Copyright (c) 1996 Adam Twiss, Zeus Technology Ltd,
    
    
    
    
http://www.zeustech.net/
    
    
    
    
Copyright (c) 1998-2001 The Apache Group, http://www.apache.org/
    
    
    
    

    
    
    
    
Benchmarking localhost (be patient).....done
    
    
    
    
Server Software:       
    
    
    
    
Apache/1.3.23                                     
    
    
    
    
Server Hostname:        localhost
    
    
    
    
Server
    
    
    
    
Port:           
    
    
    
    
80
    
    
    
    

    
    
    
    
Document Path:         
    
    
    
    
/phpMan.php/man/kill/1
    
    
    
    
Document Length:        4655 bytes
    
    
    
    

    
    
    
    
Concurrency Level:      5
    
    
    
    
Time taken for tests:   63.164 seconds
    
    
    
    
Complete requests:      50
    
    
    
    
Failed requests:        0
    
    
    
    
Broken pipe errors:     0
    
    
    
    
Total transferred:      245900 bytes
    
    
    
    
HTML transferred:       232750 bytes
    
    
    
    
Requests per second:    0.79 [#/sec] (mean)
    
    
    
    
Time per request:       6316.40 [ms]
    
    
    
    
(mean)
    
    
    
    
Time per request:       1263.28 [ms]
    
    
    
    
(mean, across all concurrent requests)
    
    
    
    
Transfer rate:         
    
    
    
    
3.89 [Kbytes/sec] received
    
    
    
    

    
    
    
    
Connnection Times (ms)
    
    
    
    
             
    
    
    
    
min  mean[+/-sd] median   max
    
    
    
    
Connect:        0   
    
    
    
    
29  106.1      0   553
    
    
    
    

    
    
    
    Processing:  2942  6016
1845.4   6227 10796
    
    
    
    

    
    
    
    

    
    
    
    Waiting:    
2941  5999 1850.7   6226 10795
    
    
    
    

    
    
    
    

    
    
    
    Total:      
2942  6045 1825.9   6227 10796
    
    
    
    

    
    
    
    
Percentage of the requests served within a certain time (ms)
    
    
    
    
  50%   6227
    
    
    
    
  66%   7069
    
    
    
    
  75%   7190
    
    
    
    
  80%   7474
    
    
    
    
  90%   8195
    
    
    
    
  95%   8898
    
    
    
    
  98%   9721
    
    
    
    
  99%  10796
    
    
    
    
 100%  10796 (last request)
    
    
    
    

    
    
    
    
测试2：SQUID缓存输出
    
    
    
    
/home/apache/bin/ab -n50 -c5
    
    
    
    
"http://localhost:8000/phpMan.php/man/kill/1"
    
    
    
    
This is ApacheBench, Version 1.3d <$Revision: 1.2 $> apache-1.3
    
    
    
    
Copyright (c) 1996 Adam Twiss, Zeus Technology Ltd,
    
    
    
    
http://www.zeustech.net/
    
    
    
    
Copyright (c) 1998-2001 The Apache Group, http://www.apache.org/
    
    
    
    

    
    
    
    
Benchmarking localhost (be patient).....done
    
    
    
    
Server Software:       
    
    
    
    
Apache/1.3.23                                     
    
    
    
    
Server Hostname:        localhost
    
    
    
    
Server
    
    
    
    
Port:           
    
    
    
    
8000
    
    
    
    

    
    
    
    
Document Path:         
    
    
    
    
/phpMan.php/man/kill/1
    
    
    
    
Document Length:        4655 bytes
    
    
    
    

    
    
    
    
Concurrency Level:      5
    
    
    
    
Time taken for tests:   4.265 seconds
    
    
    
    
Complete requests:      50
    
    
    
    
Failed requests:        0
    
    
    
    
Broken pipe errors:     0
    
    
    
    
Total transferred:      248043 bytes
    
    
    
    
HTML transferred:       232750 bytes
    
    
    
    
Requests per second:    11.72 [#/sec] (mean)
    
    
    
    
Time per request:       426.50 [ms] (mean)
    
    
    
    
Time per request:       85.30 [ms] (mean,
    
    
    
    
across all concurrent requests)
    
    
    
    
Transfer rate:         
    
    
    
    
58.16 [Kbytes/sec] received
    
    
    
    

    
    
    
    
Connnection Times (ms)
    
    
    
    
             
    
    
    
    
min  mean[+/-sd] median   max
    
    
    
    
Connect:       
    
    
    
    
0     1   
    
    
    
    
9.5      0    68
    
    
    
    

    
    
    
    Processing:    
7    83  537.4     
7  3808
    
    
    
    

    
    
    
    

    
    
    
    Waiting:       
5    81  529.1     
6  3748
    
    
    
    

    
    
    
    

    
    
    
    Total:         
7    84  547.0     
7  3876
    
    
    
    

    
    
    
    
Percentage of the requests served within a certain time (ms)
    
    
    
    
  50%      7
    
    
    
    
  66%      7
    
    
    
    
  75%      7
    
    
    
    
  80%      7
    
    
    
    
  90%      7
    
    
    
    
  95%      7
    
    
    
    
  98%      8
    
    
    
    
  99%   3876
    
    
    
    
 100%   3876 (last request)
    
    
    
    

    
    
    
    
结论：No Cache / Cache = 6045 / 84 = 70
    
    
    
    
结论：对于可能被缓存请求的页面，服务器速度可以有2个数量级的提高，因为SQUID是把缓存页面放在内存里的（因此几乎没有硬盘I/O操作）。
    
    
    
    

    
    
    
    
小节：
    
    
    
    


    
    
    
     
     
 
     大访问量的网站应尽可能将动态网页生成静态页面作为缓存发布，甚至对于搜索引擎这样的动态应用来说，缓存机制也是非常非常重要的。 
 
     在动态页面中利用HTTP Header定义缓存更新策略。 
 
     利用缓存服务器获得额外的配置和安全性 
 
     日志非常重要：SQUID日志缺省不支持COMBINED日志，但对于需要REFERER日志的这个补丁非常重要：http://www.squid-cache.org/mail-archive/squid-dev/200301/0164.html


 
    

    
    
    
    
参考资料：
    
    
    
    

    HTTP代理缓存 
    
    
    
    
http://vancouver-webpages.com/proxy.html

    
    
    
     

    
    
    
    

    可缓存的页面设计
    
    
    
    
http://linux.oreillynet.com/pub/a/linux/2002/02/28/cachefriendly.html
    
    
    
    

    运用ASP.NET的输出缓冲来存储动态页面 -  开发者 - ZDNet China
    
    
    
    
http://www.zdnet.com.cn/developer/tech/story/0,2000081602,39110239-2,00.htm
    
    
    
    
 
   
   
   
   
SERVER["HTTP_X_FORWARDED_FOR"];
        }
    }

注意：HTTP_X_FORWARDED_FOR如果经过了多个中间代理服务器，有何能是逗号分割的多个地址，
比如：200.28.7.155,200.10.225.77 unknown,219.101.137.3
因此在很多旧的数据库设计中（比如BBS）往往用来记录客户端地址的字段被设置成20个字节就显得过小了。
经常见到类似以下的错误信息：

Microsoft JET Database Engine 错误 '80040e57'

字段太小而不能接受所要添加的数据的数量。试着插入或粘贴较少的数据。

/inc/char.asp，行236

原因就是在设计客户端访问地址时，相关用户IP字段大小最好要设计到50个字节以上，当然经过3层以上代理的几率也非常小。
如何检查目前站点页面的可缓存性（Cacheablility）呢？可以参考以下2个站点上的工具：
http://www.ircache.net/cgi-bin/cacheability.py

附：SQUID性能测试试验

phpMan.php是一个基于php的man page server，每个man
page需要调用后台的man命令和很多页面格式化工具，系统负载比较高，提供了Cache
Friendly的URL，以下是针对同样的页面的性能测试资料：
测试环境：Redhat 8 on Cyrix 266 / 192M Mem
测试程序：使用apache的ab(apache benchmark)：
测试条件：请求50次，并发50个连接
测试项目：直接通过apache 1.3 (80端口) vs squid 2.5(8000端口：加速80端口)

测试1：无CACHE的80端口动态输出：
ab -n 100 -c 10 http://www.chedong.com:81/phpMan.php/man/kill/1
This is ApacheBench, Version 1.3d <$Revision: 1.2 $> apache-1.3
Copyright (c) 1996 Adam Twiss, Zeus Technology Ltd,
http://www.zeustech.net/
Copyright (c) 1998-2001 The Apache Group, http://www.apache.org/

Benchmarking localhost (be patient).....done
Server Software:
Apache/1.3.23
Server Hostname:        localhost
Server
Port:
80

Document Path:
/phpMan.php/man/kill/1
Document Length:        4655 bytes

Concurrency Level:      5
Time taken for tests:   63.164 seconds
Complete requests:      50
Failed requests:        0
Broken pipe errors:     0
Total transferred:      245900 bytes
HTML transferred:       232750 bytes
Requests per second:    0.79 [#/sec] (mean)
Time per request:       6316.40 [ms]
(mean)
Time per request:       1263.28 [ms]
(mean, across all concurrent requests)
Transfer rate:
3.89 [Kbytes/sec] received

Connnection Times (ms)

min mean[+/-sd] median   max
Connect:        0
29 106.1      0   553
Processing: 2942 6016
1845.4   6227 10796

Waiting:
2941 5999 1850.7   6226 10795

Total:
2942 6045 1825.9   6227 10796

Percentage of the requests served within a certain time (ms)
50%   6227
66%   7069
75%   7190
80%   7474
90%   8195
95%   8898
98%   9721
99% 10796
100% 10796 (last request)

测试2：SQUID缓存输出
/home/apache/bin/ab -n50 -c5
"http://localhost:8000/phpMan.php/man/kill/1"
This is ApacheBench, Version 1.3d <$Revision: 1.2 $> apache-1.3
Copyright (c) 1996 Adam Twiss, Zeus Technology Ltd,
http://www.zeustech.net/
Copyright (c) 1998-2001 The Apache Group, http://www.apache.org/

Benchmarking localhost (be patient).....done
Server Software:
Apache/1.3.23
Server Hostname:        localhost
Server
Port:
8000

Document Path:
/phpMan.php/man/kill/1
Document Length:        4655 bytes

Concurrency Level:      5
Time taken for tests:   4.265 seconds
Complete requests:      50
Failed requests:        0
Broken pipe errors:     0
Total transferred:      248043 bytes
HTML transferred:       232750 bytes
Requests per second:    11.72 [#/sec] (mean)
Time per request:       426.50 [ms] (mean)
Time per request:       85.30 [ms] (mean,
across all concurrent requests)
Transfer rate:
58.16 [Kbytes/sec] received

Connnection Times (ms)

min mean[+/-sd] median   max
Connect:
0     1
9.5      0    68
Processing:
7    83 537.4
7 3808

Waiting:
5    81 529.1
6 3748

Total:
7    84 547.0
7 3876

Percentage of the requests served within a certain time (ms)
50%      7
66%      7
75%      7
80%      7
90%      7
95%      7
98%      8
99%   3876
100%   3876 (last request)

结论：No Cache / Cache = 6045 / 84 = 70
结论：对于可能被缓存请求的页面，服务器速度可以有2个数量级的提高，因为SQUID是把缓存页面放在内存里的（因此几乎没有硬盘I/O操作）。

小节：

大访问量的网站应尽可能将动态网页生成静态页面作为缓存发布，甚至对于搜索引擎这样的动态应用来说，缓存机制也是非常非常重要的。
在动态页面中利用HTTP Header定义缓存更新策略。
利用缓存服务器获得额外的配置和安全性
日志非常重要：SQUID日志缺省不支持COMBINED日志，但对于需要REFERER日志的这个补丁非常重要：http://www.squid-cache.org/mail-archive/squid-dev/200301/0164.html

参考资料：
HTTP代理缓存
http://vancouver-webpages.com/proxy.html

可缓存的页面设计
http://linux.oreillynet.com/pub/a/linux/2002/02/28/cachefriendly.html
运用ASP.NET的输出缓冲来存储动态页面 - 开发者 - ZDNet China
http://www.zdnet.com.cn/developer/tech/story/0,2000081602,39110239-2,00.htm

你可能感兴趣的:(apache,Web,cache,服务器,benchmarking,缓存服务器)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
webpack图片等资源的处理 dmengmeng
需要的loaderfile-loader（让我们可以引入这些资源文件）url-loader（其实是file-loader的二次封装）img-loader（处理图片所需要的）在没有使用任何处理图片的loader之前，比如说css中用到了背景图片，那么最后打包会报错的，因为他没办法处理图片。其实你只想能够使用图片的话。只加一个file-loader就可以，打开网页能准确看到图片。{test:/\.(p
「豆包Marscode体验官」 | 云端 IDE 启动 & Rust 体验张风捷特烈 ide rust 开发语言后端
theme:cyanosis我正在参加「豆包MarsCode初体验」征文活动MarsCode可以看作一个运行在服务端的远程VSCode开发环境。对于我这种想要学习体验某些语言，但不想在电脑里装环境的人来说非常友好。本文就来介绍一下在MarsCode里，我的体验rust开发体验。一、MarsCode是什么它的本质是:提供代码助手和云端IDE服务的web网站，可通过下面的链接访问https://www
Python神器！WEB自动化测试集成工具 DrissionPage 亚丁号 python 开发语言
一、前言用requests做数据采集面对要登录的网站时，要分析数据包、JS源码，构造复杂的请求，往往还要应付验证码、JS混淆、签名参数等反爬手段，门槛较高。若数据是由JS计算生成的，还须重现计算过程，体验不好，开发效率不高。使用浏览器，可以很大程度上绕过这些坑，但浏览器运行效率不高。因此，这个库设计初衷，是将它们合而为一，能够在不同须要时切换相应模式，并提供一种人性化的使用方法，提高开发和运行效率
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Android应用性能优化轻口味 Android
Android手机由于其本身的后台机制和硬件特点，性能上一直被诟病，所以软件开发者对软件本身的性能优化就显得尤为重要；本文将对Android开发过程中性能优化的各个方面做一个回顾与总结。Cache优化ListView缓存：ListView中有一个回收器，Item滑出界面的时候View会回收到这里，需要显示新的Item的时候，就尽量重用回收器里面的View；每次在getView函数中inflate新
Python多线程实现大规模数据集高效转移 sand&wich 网络 python 服务器
背景在处理大规模数据集时，通常需要在不同存储设备、不同服务器或文件夹之间高效地传输数据。如果采用单线程传输方式，当数据量非常大时，整个过程会非常耗时。因此，通过多线程并行处理可以大幅提升数据传输效率。本文将分享一个基于Python多线程实现的高效数据传输工具，通过遍历源文件夹中的所有文件，将它们移动到目标文件夹。工具和库这个数据集转移工具主要依赖于以下Python标准库：os：用于文件系统操作，如
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
Vue( ElementUI入门、vue-cli安装) m0_l5z elementui vue.js
一.ElementUI入门目录：1.ElementUI入门1.1ElementUI简介1.2Vue+ElementUI安装1.3开发示例2.搭建nodejs环境2.1nodejs介绍2.2npm是什么2.3nodejs环境搭建2.3.1下载2.3.2解压2.3.3配置环境变量2.3.4配置npm全局模块路径和cache默认安装位置2.3.5修改npm镜像提高下载速度2.3.6验证安装结果3.运行n
Spring MVC 全面指南：从入门到精通的详细解析一杯梅子酱技术栈学习 spring mvc java
引言：SpringMVC，作为Spring框架的一个重要模块，为构建Web应用提供了强大的功能和灵活性。无论是初学者还是有一定经验的开发者，掌握SpringMVC都将显著提升你的Web开发技能。本文旨在为初学者提供一个全面且易于理解的学习路径，通过详细的知识点分析和实际案例，帮助你快速上手SpringMVC，让学习过程既深刻又高效。一、SpringMVC简介1.1什么是SpringMVC？Spri
Spring Boot中实现跨域请求 BABA8891 spring boot 后端 java
在SpringBoot中实现跨域请求（CORS，Cross-OriginResourceSharing）可以通过多种方式，以下是几种常见的方法：1.使用@CrossOrigin注解在SpringBoot中，你可以在控制器或者具体的请求处理方法上使用@CrossOrigin注解来允许跨域请求。在控制器上应用：importorg.springframework.web.bind.annotation.
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
最简单将静态网页挂载到服务器上(不用nginx) 全能全知者服务器 nginx 运维前端 html 笔记
最简单将静态网页挂载到服务器上(不用nginx)如果随便弄个静态网页挂在服务器都要用nignx就太麻烦了，所以直接使用Apache来搭建一些简单前端静态网页会相对方便很多检查Web服务器服务状态：sudosystemctlstatushttpd#ApacheWeb服务器如果发现没有安装web服务器：安装Apache：sudoyuminstallhttpd启动Apache：sudosystemctl
阿里云服务器4核8G配置购买及价格类文章汇总（10篇）阿里云最新优惠和活动汇总
阿里云服务器4核8G配置如何购买？价格是多少？4核8G配置的阿里云服务器可以通过云服务器产品页购买也可以通过阿里云活动去下单购买，一般通过活动购买的用户比较多，但是不同实例规格的阿里云服务器价格不一样，带宽不同价格也不一样，本文为大家汇总了10篇关于阿里云服务器4核8G配置购买教程文章和价格类文章，分为购买类文章和价格类文章，以供大家参考如何购买阿里云服务器4核8G配置和最新优惠价格是多少。阿里云
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &