因业务需求经常会有抢购业务,因此需要在负载均衡前端进行限流错误。本文同样也适用于防止CC.

    limit_req_zone $server_name zone=sname:10m rate=1r/s;               #限制服务器每秒只能有一次访问成功
        #limit_req_zone $binary_remote_addr zone=one:3m rate=1r/s;        #限制IP,每秒只能访问一次
        #limit_req_zone $binary_remote_addr$uri zone=two:3m rate=1r/s;    #限制IP和路径不带参数,
        #limit_req_zone $binary_remote_addr$request_uri zone=thre:3m rate=1r/s;   #限制IP和带参数的路径 

    server {
        listen       80;
        server_name  www.abc.com;
        location / {
                include host/proxy.cnf;
                proxy_pass http://backend;
        }
        location /api/createOrder {
                limit_req zone=sname;    #不带突发,只能有一次正常请求
                limit_req_status 503;       #设置返回的状态码是503
                #limit_req zone=sname burst=5 nodelay;   #最大并发是5,并且实时处理
                include host/proxy.cnf;
                proxy_pass http://backend;
                error_page 503 =200 /50x.html;      #这里很重要,可以将错误的状态码503,返回结果的时候是200
        }
        location = /50x.html {
                if ($http_user_agent ~* "mobile|android|iPhone|iphone|ios|iOS"){
                        #default_type application/json;
                        return 200 '{"msg": "活动过于火爆,请稍后重试!","data": {},"code": -1}';   #设置移动端返回错误的信息显示
                }
                root   html;     #如果是PC端返回一个HTML页面
        }
        }

重点: 正常情况下,如果设置了限流,返回是503的状态码,这对于移动端来说即便是你返回JSON数据但是客户端时不认的,这个时候巧妙的通过 error_page 403 =200 /50x.html;将状态码设置为200

以上只是使用了ngx_limit_req_module,同时也可以使用ngx_limit_conn_module模块。

以上参考:https://gist.github.com/simlegate/75b18359316cc33d8e20

特别是一些咨询类网站如果备爬虫盯上,服务器可能会被爬虫给干死(小网站就是这样)
那么怎么办呢,我们可以使用变量去做

#全局配置
limit_req_zone $spider zone=spider:60m rate=200r/m;    #限制爬虫每分钟只能跑200次
#某个server中
limit_req zone=spider burst=5 nodelay;
if ($http_user_agent ~* “spider|bot”) {
    set $spider $http_user_agent;      #设置变量,进入这里的就进行限速
}