编译自:
load_balancing
目录:
- 负载均衡方法
- 默认负载均衡配置
- 基于最小连接数的负载均衡
- 会话保持
- 给负载均衡添加权重
- 健康检测
- 进一步阅读
简介
负载均衡是普遍使用的技术,使用负载均衡架构有很多优点:
- 可提高资源利用率
- 增加系统吞吐量的上限
- 降低响应延迟
- 可保证容错的配置
nginx 可用作一个非常高效的 HTTP 负载均衡调度器,将访问流量分发给多个应用服务器。这样可以提升 web 应用的性能,以及可扩展性和可靠性。
负载均衡方法
nginx 支持三种均衡策略:
- 轮询
- 最小连接数
- **ip-hash - 源地址 hash **
默认负载均衡配置
最简单的负载均衡配置如下:
http {
upstream myapp1 {
server srv1.example.com;
server srv2.example.com;
server srv3.example.com;
}
server {
listen 80;
location / {
proxy_pass http://myapp1;
}
}
}
在这个例子中,提供了三个相同的应用实例 srv1-srv3。如果未指定均衡方法,默认采用“轮询”策略。所有请求被转发给一个服务器组 myapp1,nginx 使用 HTTP 负载均衡策略将访问请求分发给组内的应用实例。
nginx 所实现的反向代理可为如下的协议做负载均衡:
HTTP, HTTPS, FastCGI, uwsgi, SCGI, and memcached.
如果要为 HTTPS 访问的配置负载均衡,使用 “https” 替换 “http” 作为地址协议即可。
如果为 FastCGI, uwsgi, SCGI, memcached 设置负载均衡,分别使用 fastcgi_pass、uwsgi_pass、scgi_pass、memcached_pass 指令。
基于最小连接数的负载均衡
当一些访问请求所需要时间较长,使用“最小连接数”策略可使访问更平均的分配到应用服务器,nginx 会尝试把新的请求发给负担较小的应用服务器。
在配置中,使用 least_conn 指令激活“最小连接数”策略,将该指令放入 server group:
upstream myapp1 {
least_conn;
server srv1.example.com;
server srv2.example.com;
server srv3.example.com;
}
会话保持
基于 “轮询” 或 “最小连接数”策略时,来自同一个 client 的访问请求可能被分发给不同的服务器。不能保证来自同一个 client 的访问定向至同一个应用服务器。
如果需要将来自同一个 client 的访问定向至同一个应用服务器,可使用 ip-hash 策略。
ip-hash 策略会把 client IP 地址作为 hash key,用于决定将来自该 client 的访问请求定向至某个应用服务器。因为相同的 IP 地址总是计算出相同的 hash 值,所以 来自同一个 client 的访问总是被定向至同一个应用服务器,除非该服务器除了问题。
配置基于 ip_hash 的负载均衡,使用 ip_hash 指令:
upstream myapp1 {
ip_hash;
server srv1.example.com;
server srv2.example.com;
server srv3.example.com;
}
给负载均衡添加权重
对于基本的三种负载均衡策略,可为其添加权重影响流量分配倾向。
如果应用服务器没有配置权重,被认为拥有相同的权重。
考虑如下的例子:
upstream myapp1 {
server srv1.example.com weight=3;
server srv2.example.com;
server srv3.example.com;
}
这个服务器组没有显式定义均衡策略,默认采用“轮询”策略,srv1 具有值为 3 的权重。
假设有 5 个访问请求,3 个请求会分配给 srv1,1 个请求分配给 srv2,1 个请求分配给 srv3。
在最近的 nginx 版本中,同样也可以在基于“最小连接数”和 ip-hash 的负载均衡中使用权重。
健康检测
nginx 所实现的反向代理包含“被动”的服务器健康检测功能。
如果 nginx 对于后端服务器的检查,收到了包含错误的失败响应,nginx 将其标记为 failed,
并且在一段时间内不再分发请求给该服务器。
max_fail 指令用于设置:在 fail_timeout 期间内,发生几次连续失败检测,才认定该服务器为失效。max_fail 默认设置为 1。当设置为 0,意味着不对该服务器进行健康检查。
fail_timeout 也定义了在多久没有收到来自应用服务器的响应后,将其标记为 failed。
当一个服务器被标记为 failed,等过了 fail_timeout 时间之后,nginx 又 开始尝试分发用户请求给该服务器,以测试该服务器是否可正常服务,如果成功,该服务器被标记为 live。
进一步阅读
在 nginx 中,还有很多对于负载均衡进行控制的指令,比如:
[proxy_next_upstream][10]
[10]: http://nginx.org/en/docs/http/ngx_http_proxy_module.html#proxy_next_upstream
[backup][11]
[11]: http://nginx.org/en/docs/http/ngx_http_upstream_module.html#server
[down][12]
[12]: http://nginx.org/en/docs/http/ngx_http_upstream_module.html#server
[keepalive][13]
[13]: http://nginx.org/en/docs/http/ngx_http_upstream_module.html#keepalive
更多信息请参考:http://nginx.org/en/docs/
版权信息:
本文编译自 nginx.org 的部分,遵循其原来的 licence 声明: 2-clause BSD-like license