nginx 的 HTTP 负载均衡

编译自：
load_balancing

负载均衡方法
默认负载均衡配置
基于最小连接数的负载均衡
会话保持
给负载均衡添加权重
健康检测
进一步阅读

简介

负载均衡是普遍使用的技术，使用负载均衡架构有很多优点：

可提高资源利用率
增加系统吞吐量的上限
降低响应延迟
可保证容错的配置

nginx 可用作一个非常高效的 HTTP 负载均衡调度器，将访问流量分发给多个应用服务器。这样可以提升 web 应用的性能，以及可扩展性和可靠性。

负载均衡方法

nginx 支持三种均衡策略：

轮询
最小连接数
**ip-hash - 源地址 hash **

默认负载均衡配置

最简单的负载均衡配置如下：

http {
    upstream myapp1 {
        server srv1.example.com;
        server srv2.example.com;
        server srv3.example.com;
    }

    server {
        listen 80;

        location / {
            proxy_pass http://myapp1;
        }
    }
}

在这个例子中，提供了三个相同的应用实例 srv1-srv3。如果未指定均衡方法，默认采用“轮询”策略。所有请求被转发给一个服务器组 myapp1，nginx 使用 HTTP 负载均衡策略将访问请求分发给组内的应用实例。

nginx 所实现的反向代理可为如下的协议做负载均衡：

HTTP, HTTPS, FastCGI, uwsgi, SCGI, and memcached.

如果要为 HTTPS 访问的配置负载均衡，使用 “https” 替换 “http” 作为地址协议即可。

如果为 FastCGI, uwsgi, SCGI, memcached 设置负载均衡，分别使用 fastcgi_pass、uwsgi_pass、scgi_pass、memcached_pass 指令。

基于最小连接数的负载均衡

当一些访问请求所需要时间较长，使用“最小连接数”策略可使访问更平均的分配到应用服务器，nginx 会尝试把新的请求发给负担较小的应用服务器。

在配置中，使用 least_conn 指令激活“最小连接数”策略，将该指令放入 server group:

upstream myapp1 {
    least_conn;
    server srv1.example.com;
    server srv2.example.com;
    server srv3.example.com;
}

会话保持

基于 “轮询” 或 “最小连接数”策略时，来自同一个 client 的访问请求可能被分发给不同的服务器。不能保证来自同一个 client 的访问定向至同一个应用服务器。

如果需要将来自同一个 client 的访问定向至同一个应用服务器，可使用 ip-hash 策略。

ip-hash 策略会把 client IP 地址作为 hash key，用于决定将来自该 client 的访问请求定向至某个应用服务器。因为相同的 IP 地址总是计算出相同的 hash 值，所以来自同一个 client 的访问总是被定向至同一个应用服务器，除非该服务器除了问题。

配置基于 ip_hash 的负载均衡，使用 ip_hash 指令：

upstream myapp1 {
    ip_hash;
    server srv1.example.com;
    server srv2.example.com;
    server srv3.example.com;
}

给负载均衡添加权重

对于基本的三种负载均衡策略，可为其添加权重影响流量分配倾向。

如果应用服务器没有配置权重，被认为拥有相同的权重。

考虑如下的例子：

upstream myapp1 {
    server srv1.example.com weight=3;
    server srv2.example.com;
    server srv3.example.com;
}

这个服务器组没有显式定义均衡策略，默认采用“轮询”策略，srv1 具有值为 3 的权重。
假设有 5 个访问请求，3 个请求会分配给 srv1，1 个请求分配给 srv2，1 个请求分配给 srv3。

在最近的 nginx 版本中，同样也可以在基于“最小连接数”和 ip-hash 的负载均衡中使用权重。

健康检测

nginx 所实现的反向代理包含“被动”的服务器健康检测功能。

如果 nginx 对于后端服务器的检查，收到了包含错误的失败响应，nginx 将其标记为 failed，
并且在一段时间内不再分发请求给该服务器。

max_fail 指令用于设置：在 fail_timeout 期间内，发生几次连续失败检测，才认定该服务器为失效。max_fail 默认设置为 1。当设置为 0，意味着不对该服务器进行健康检查。

fail_timeout 也定义了在多久没有收到来自应用服务器的响应后，将其标记为 failed。

当一个服务器被标记为 failed，等过了 fail_timeout 时间之后，nginx 又开始尝试分发用户请求给该服务器，以测试该服务器是否可正常服务，如果成功，该服务器被标记为 live。

进一步阅读

在 nginx 中，还有很多对于负载均衡进行控制的指令，比如：

[proxy_next_upstream][10]
[10]: http://nginx.org/en/docs/http/ngx_http_proxy_module.html#proxy_next_upstream

[backup][11]
[11]: http://nginx.org/en/docs/http/ngx_http_upstream_module.html#server

[down][12]
[12]: http://nginx.org/en/docs/http/ngx_http_upstream_module.html#server

[keepalive][13]
[13]: http://nginx.org/en/docs/http/ngx_http_upstream_module.html#keepalive

更多信息请参考：http://nginx.org/en/docs/

版权信息：
本文编译自 nginx.org 的部分，遵循其原来的 licence 声明： 2-clause BSD-like license