什么是负载均衡

  负载均衡(Load Balance)建立在现有网络结构之上,提供了一种廉价有效且透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。负载均衡有两方面的含义:首先,大量的并发访问或数据流量分担到多台节点设备上做并行处理,减少用户等待响应的时间;其次,单个重负载的运算分担到多台节点设备上做并行处理,每个节点设备处理结束后,将结果汇总,返回给用户,系统处理能力得到大幅度提高。
简单讲就是:

  1. 将大量的并发处理转发给后端多个节点处理,减少工作响应时间;
  2. 将单个繁重的工作转发给后端多个节点处理,处理完再返回给负载均衡中心,在返回给用户。

负载均衡的优点

  1. 可以在对用户无感知的情况下,做Web服务器的动态水平扩展
  2. 解决单机故障,增加业务并发访问及处理能力
  3. 降低公网IP地址,节省IP支出成本
  4. 配置简单,有固定格式的配置文件
  5. 功能丰富,支持四层和七层负载,对四层性能更好,支持动态下线主机
  6. 隐藏内部服务器IP,提高内部服务器的安全性
  7. 性能强,并发数可达数万至数十万

四层负载均衡

  基于IP+端口的负载均衡:从传输层开始是,使用“ip + port”接受请求,在转发到对应的服务器。

七层负载均衡

  基于虚拟的URL或主机IP的负载均衡:在四层负载均衡的基础上,通过应用层协议实现负载均衡。

常见负载均衡的软硬件

四层负载均衡

  1. LVS
  2. HAProxy
  3. Nginx

七层负载均衡

  1. HAProxy
  2. Nginx

硬件负载均衡

  1. F5
  2. Netscaler

LVS、Nginx、HAProxy的区别

LVS

  1. 抗负载能力强。抗负载能力强、性能高,能达到F5硬件的60%;对内存和cpu资源消耗比较低
  2. 工作在网络4层,通过vrrp协议转发(仅作分发之用),具体的流量由linux内核处理,因此没有流量的产生。
  3. 稳定性、可靠性好,自身有完美的热备方案;(如:LVS+Keepalived)
  4. 应用范围比较广,可以对所有应用做负载均衡;
  5. 不支持正则处理,不能做动静分离。
  6. 支持负载均衡算法:rr(轮循)、wrr(带权轮循)、lc(最小连接)、wlc(权重最小连接)
  7. 配置 复杂,对网络依赖比较大,稳定性很高。

Ngnix:

  1. 工作在网络的7层之上,可以针对http应用做一些分流的策略,比如针对域名、目录结构;
  2. Nginx对网络的依赖比较小,理论上能ping通就就能进行负载功能;
  3. Nginx安装和配置比较简单,测试起来比较方便;
  4. 也可以承担高的负载压力且稳定,一般能支撑超过1万次的并发;
  5. 对后端服务器的健康检查,只支持通过端口来检测,不支持通过url来检测。
  6. Nginx对请求的异步处理可以帮助节点服务器减轻负载;
  7. Nginx仅能支持http、https和Email协议,这样就在适用范围较小。
  8. 不支持Session的直接保持,但能通过ip_hash来解决。
  9. 支持负载均衡算法:Round-robin(轮循)、Weight-round-robin(加权轮循)、Ip-hash(Ip哈希)
  10. Nginx还能做Web服务器即Cache功能。

HAProxy的特点是:

  1. TCP(四层)和HTTP(七层)做反向代理,支持虚拟主机
  2. 可平衡负载至后端服务器,并支持持久连接
  3. 支持基于cookie进行调度
  4. 支持所有主服务器故障切换至备用服务器
  5. 支持专用端口实现监控服务
  6. 支持不影响现有连接情况下停止接受新连接请求
  7. 可以在双向添加,修改或删除HTTP报文首部
  8. 支持基于pattern实现连接请求的访问控制
  9. 通过特定的URI为授权用户提供详细的状态信息
  10. 可以针对HTTP请求添加cookie,进行路由后端服务器

三大主流软件负载均衡器适用业务场景:

  1. 网站建设初期,可以选用Nigix/HAproxy作为反向代理负载均衡(或者流量不大都可以不选用负载均衡),因为其配置简单,性能也能满足一般的业务场景。如果考虑到负载均衡器是有单点问题,可以采用Nginx+Keepalived/HAproxy+Keepalived避免负载均衡器自身的单点问题。
  2. 网站并发达到一定程度之后,为了提高稳定性和转发效率,可以使用LVS、毕竟LVS比Nginx/HAproxy要更稳定,转发效率也更高。不过维护LVS对维护人员的要求也会更高,投入成本也更大。