nginx 的 HTTP 负载均衡

编译自:
load_balancing

目录

  • 负载均衡方法
  • 默认负载均衡配置
  • 基于最小连接数的负载均衡
  • 会话保持
  • 给负载均衡添加权重
  • 健康检测
  • 进一步阅读

简介


负载均衡是普遍使用的技术,使用负载均衡架构有很多优点:

  • 可提高资源利用率
  • 增加系统吞吐量的上限
  • 降低响应延迟
  • 可保证容错的配置

nginx 可用作一个非常高效的 HTTP 负载均衡调度器,将访问流量分发给多个应用服务器。这样可以提升 web 应用的性能,以及可扩展性和可靠性。

负载均衡方法


nginx 支持三种均衡策略:

  1. 轮询
  2. 最小连接数
  3. **ip-hash - 源地址 hash **

默认负载均衡配置


最简单的负载均衡配置如下:

http {
    upstream myapp1 {
        server srv1.example.com;
        server srv2.example.com;
        server srv3.example.com;
    }

    server {
        listen 80;

        location / {
            proxy_pass http://myapp1;
        }
    }
}

在这个例子中,提供了三个相同的应用实例 srv1-srv3。如果未指定均衡方法,默认采用“轮询”策略。所有请求被转发给一个服务器组 myapp1,nginx 使用 HTTP 负载均衡策略将访问请求分发给组内的应用实例。

nginx 所实现的反向代理可为如下的协议做负载均衡:

HTTP, HTTPS, FastCGI, uwsgi, SCGI, and memcached.

如果要为 HTTPS 访问的配置负载均衡,使用 “https” 替换 “http” 作为地址协议即可。

如果为 FastCGI, uwsgi, SCGI, memcached 设置负载均衡,分别使用 fastcgi_pass、uwsgi_pass、scgi_pass、memcached_pass 指令。

基于最小连接数的负载均衡


当一些访问请求所需要时间较长,使用“最小连接数”策略可使访问更平均的分配到应用服务器,nginx 会尝试把新的请求发给负担较小的应用服务器。

在配置中,使用 least_conn 指令激活“最小连接数”策略,将该指令放入 server group:

upstream myapp1 {
    least_conn;
    server srv1.example.com;
    server srv2.example.com;
    server srv3.example.com;
}

会话保持


基于 “轮询” 或 “最小连接数”策略时,来自同一个 client 的访问请求可能被分发给不同的服务器。不能保证来自同一个 client 的访问定向至同一个应用服务器。

如果需要将来自同一个 client 的访问定向至同一个应用服务器,可使用 ip-hash 策略。

ip-hash 策略会把 client IP 地址作为 hash key,用于决定将来自该 client 的访问请求定向至某个应用服务器。因为相同的 IP 地址总是计算出相同的 hash 值,所以 来自同一个 client 的访问总是被定向至同一个应用服务器,除非该服务器除了问题。

配置基于 ip_hash 的负载均衡,使用 ip_hash 指令:

upstream myapp1 {
    ip_hash;
    server srv1.example.com;
    server srv2.example.com;
    server srv3.example.com;
}

给负载均衡添加权重


对于基本的三种负载均衡策略,可为其添加权重影响流量分配倾向。

如果应用服务器没有配置权重,被认为拥有相同的权重。

考虑如下的例子:

upstream myapp1 {
    server srv1.example.com weight=3;
    server srv2.example.com;
    server srv3.example.com;
}

这个服务器组没有显式定义均衡策略,默认采用“轮询”策略,srv1 具有值为 3 的权重。
假设有 5 个访问请求,3 个请求会分配给 srv1,1 个请求分配给 srv2,1 个请求分配给 srv3。

在最近的 nginx 版本中,同样也可以在基于“最小连接数”和 ip-hash 的负载均衡中使用权重。

健康检测


nginx 所实现的反向代理包含“被动”的服务器健康检测功能。

如果 nginx 对于后端服务器的检查,收到了包含错误的失败响应,nginx 将其标记为 failed,
并且在一段时间内不再分发请求给该服务器。

max_fail 指令用于设置:在 fail_timeout 期间内,发生几次连续失败检测,才认定该服务器为失效。max_fail 默认设置为 1。当设置为 0,意味着不对该服务器进行健康检查。

fail_timeout 也定义了在多久没有收到来自应用服务器的响应后,将其标记为 failed。

当一个服务器被标记为 failed,等过了 fail_timeout 时间之后,nginx 又 开始尝试分发用户请求给该服务器,以测试该服务器是否可正常服务,如果成功,该服务器被标记为 live。

进一步阅读

在 nginx 中,还有很多对于负载均衡进行控制的指令,比如:

[proxy_next_upstream][10]
[10]: http://nginx.org/en/docs/http/ngx_http_proxy_module.html#proxy_next_upstream

[backup][11]
[11]: http://nginx.org/en/docs/http/ngx_http_upstream_module.html#server

[down][12]
[12]: http://nginx.org/en/docs/http/ngx_http_upstream_module.html#server

[keepalive][13]
[13]: http://nginx.org/en/docs/http/ngx_http_upstream_module.html#keepalive

更多信息请参考:http://nginx.org/en/docs/


版权信息
本文编译自 nginx.org 的部分,遵循其原来的 licence 声明: 2-clause BSD-like license

你可能感兴趣的:(nginx 的 HTTP 负载均衡)