架构笔记:负载均衡SLB,互联网架构大剖析

文章目录

  • 前言
  • 关于负载均衡
  • 常见互联网slb方案
    • 第一层:客户端到反向代理层
    • 第二层:反向代理层到站点层
    • 第三层:站点层到服务层
    • 第四层:访问数据层
      • 数据的均衡
      • 请求的均衡
      • range水平切分
        • 优点:
      • 不足:
      • id哈希水平切分
        • 优点:
        • 不足:
  • 总结

前言

此篇是读公众号有感所写,写的过程也是学习和整理。但是作为初学者,难免有疏漏,这里也请各位斧正。

关于负载均衡

关于负载均衡,其实在网上有许多的定义。而作为云计算的从业者,最经常接触到的就是云负载均衡SLB,我总结了两个特点和作用:分流和灾备;
负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它通常是指,将请求/数据均匀分摊到多个操作单元上执行,负载均衡的关键在于 分发 !!!
各种负载均衡的算法,也都是为了满足这个分发二字;

常见互联网slb方案

架构笔记:负载均衡SLB,互联网架构大剖析_第1张图片

根据上图,可以分为:

  • 客户端层
  • 反向代理层
  • 站点层
  • 服务层
  • 数据层

根据请求的自顶向下,每一层上游请求可以调用多个下游服务。根据负载均衡的调度算法,将请求分发给下层的服务。

第一层:客户端到反向代理层

架构笔记:负载均衡SLB,互联网架构大剖析_第2张图片
客户端-》反向代理层的负载均衡。这里主要是通过 ”DNS轮询“实现。

通俗来讲,即DNS-server对于一个域名设置多个解析IP(这里指负载均衡的IP),这里的主要的算法是利用了”轮询算法。

第二层:反向代理层到站点层

架构笔记:负载均衡SLB,互联网架构大剖析_第3张图片
反向代理,即将客户端的请求转发到服务器上,然后服务器返回的结果转发给客户端。
反向代理层到站点层的负载均衡主要是通过”nginx“本身实现(七层转发),nginx是泛指反向代理,但是也是应用最广泛的反向代理服务器。

而转发的规则(算法),主要是通过修改nginx.conf的配置文件实现:
这里介绍主要几种算法:

  1. 请求轮询
  2. 最少连接数
  3. 加权

画外音:站点层可以存储session,但强烈不建议这么做,站点层无状态是分布式架构设计的基本原则之一,session最好放到数据层存储。

第三层:站点层到服务层

架构笔记:负载均衡SLB,互联网架构大剖析_第4张图片

服务层也叫中间层,通过增加抽象,解耦两个交互的逻辑关系。服务层只提供有限的通用接口,理论上服务集群能够提供无限性能,性能出现瓶颈,服务层一处集中优化

站点层到服务层的负载均衡,是通过“服务连接池”实现的。
上游连接池会建立与下游服务多个连接,每次请求会“随机”选取连接来访问下游服务。除了负载均衡,服务连接池还能够实现***故障转移、超时处理、限流限速、ID串行化***等诸多功能。

第四层:访问数据层

在数据量很大的情况下,由于数据层(db/cache)涉及数据的水平切分,所以数据层的负载均衡更为复杂一些,它分为“数据的均衡”,与“请求的均衡”。

数据的均衡

数据的均衡是指:水平切分后的每个服务(db/cache),数据量是均匀的。

请求的均衡

请求的均衡是指:水平切分后的每个服务(db/cache),请求量是均匀的。

同时,根据水平切分的方式,主要又分为range水平切分和ID哈希水平切分。

range水平切分

架构笔记:负载均衡SLB,互联网架构大剖析_第5张图片
每一个数据服务,存储一定范围的数据:

  • user0服务:存储uid范围1-1kw
  • user1服务:存储uid范围1kw-2kw

优点:

  • 规则简单,service只需判断一下uid范围就能路由到对应的存储服务
  • 数据均衡性较好
  • 比较容易扩展,可以随时加一个uid[2kw,3kw]的数据服务

不足:

  • 请求的负载不一定均衡,一般来说,新注册的用户会比老用户更活跃,大range的服务请求压力会更大

id哈希水平切分

架构笔记:负载均衡SLB,互联网架构大剖析_第6张图片
每一个数据服务,存储某个key值hash后的部分数据:
user0服务:存储偶数uid数据
user1服务:存储奇数uid数据

优点:

  • 规则简单,service只需对uid进行hash能路由到对应的存储服务
  • 数据均衡性较好
  • 请求均匀性较好

不足:

  • 不容易扩展,扩展一个数据服务,hash方法改变时候,可能需要进行数据迁移

总结

负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它通常是指,将请求/数据均匀分摊到多个操作单元上执行,其的关键在于均匀:

  • 反向代理层的负载均衡,是通过“DNS轮询”实现的
  • 站点层的负载均衡,是通过“nginx”实现的
  • 服务层的负载均衡,是通过“服务连接池”实现的
  • 数据层的负载均衡,要考虑“数据的均衡”与“请求的均衡”两个点,常见的方式有“按照范围水平切分”与“hash水平切分”

最后声明,本文转载,不涉及任何利益关系!

你可能感兴趣的:(架构)