什么是高可用
高可用 HA(High Availability)是分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计减少系统不能提供服务的时间。
如何保障系统的高可用
冗余(多个节点) + 自动故障转移
什么是高并发
高并发(High Concurrency)是互联网分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计保证系统能够同时并行处理很多请求。
如何提升系统的并发能力
- 垂直扩展:提升单机处理能力。
- 水平扩展:只要增加服务器数量,就能线性扩充系统性能。
常见的互联网分层架构
- 客户端层:典型调用方是浏览器或者手机应用
- 反向代理层:系统入口,反向代理
- 站点应用层:实现核心应用逻辑,返回 HTML
- 服务层:如果实现了服务化,就有这一层
- 数据-缓存层:缓存加速访问存储
- 数据-数据库层:数据库固化数据存储
分层高可用架构实践
【客户端层->反向代理层】的高可用
【客户端层】到【反向代理层】的高可用,是通过
反向代理层的冗余 来实现的。
以 nginx 为例:有两台 nginx,一台对线上提供服务,另一台冗余以保证高可用,常见的实践是 keepalived 存活探测,相同 virtual IP 提供服务。
自动故障转移:当 nginx 挂了的时候,keepalived 能够探测到,会自动的进行故障转移,将流量自动迁移到 shadow-nginx,由于使用的是相同的 virtual IP,这个切换过程对调用方是透明的。
【反向代理层->站点层】的高可用
【反向代理层】到【站点层】的高可用,是通过 站点层的冗余 来实现的。
假设反向代理层是 nginx,nginx.conf 里能够配置多个 web 后端,并且 nginx 能够探测到多个后端的存活性。
自动故障转移:当 web-server 挂了的时候,nginx 能够探测到,会自动的进行故障转移,将流量自动迁移到其他的 web-server,整个过程由 nginx 自动完成,对调用方是透明的。
【站点层->服务层】的高可用
【站点层】到【服务层】的高可用,是通过
服务层的冗余 来实现的。
“服务连接池”会建立与下游服务多个连接,每次请求会“随机”选取连接来访问下游服务。
自动故障转移:当 service 挂了的时候,service-connection-pool 能够探测到,会自动的进行故障转移,将流量自动迁移到其他的 service,整个过程由连接池自动完成,对调用方是透明的。
【服务层->缓存层】的高可用
【服务层】到【缓存层】的高可用,是通过
缓存数据的冗余 来实现的。
缓存层的数据冗余又有几种方式:第一种是利用客户端的封装,service 对 cache 进行双读或者双写。
缓存层也可以通过支持主从同步的缓存集群来解决缓存层的高可用问题。
以 redis 为例,redis 天然支持主从同步,redis 官方也有 sentinel 哨兵机制,来做 redis 的存活性检测。
自动故障转移:当 redis 主挂了的时候,sentinel 能够探测到,会通知调用方访问新的 redis,整个过程由 sentinel 和 redis 集群配合完成,对调用方是透明的。
【服务层->数据库层】的高可用
大部分互联网技术,数据库层都用了 主从同步,读写分离 架构。
所以数据库层的高可用,又分为 读库高可用 与 写库高可用 两类。
读库高可用
【服务层】到【数据库读】的高可用,是通过
读库的冗余 来实现的。
既然冗余了读库,一般来说就至少有 2 个从库,“数据库连接池”会建立与读库多个连接,每次请求会路由到这些读库。
自动故障转移:当读库挂了的时候,db-connection-pool 能够探测到,会自动的进行故障转移,将流量自动迁移到其他的读库,整个过程由连接池自动完成,对调用方是透明的。
写库高可用
【服务层】到【数据库写】的高可用,是通过
写库的冗余 来实现的。
以 mysql 为例,可以设置两个 mysql 双主同步,一台对线上提供服务,另一台冗余以保证高可用,常见的实践是 keepalived 存活探测,相同 virtual IP 提供服务。
自动故障转移:当写库挂了的时候,keepalived 能够探测到,会自动的进行故障转移,将流量自动迁移到 shadow-db-master,由于使用的是相同的 virtual IP,这个切换过程对调用方是透明的。
分层水平扩展架构实践
反向代理层的水平扩展
反向代理层的水平扩展,是通过
DNS轮询 实现的:dns-server 对于一个域名配置了多个解析 ip,每次DNS 解析请求来访问 dns-server,会轮询返回这些 ip。
当 nginx 成为瓶颈的时候,只要增加服务器数量,新增 nginx 服务的部署,增加一个外网 ip,就能扩展反向代理层的性能,做到理论上的无限高并发。
站点层的水平扩展
站点层的水平扩展,是通过 nginx 实现的。通过修改 nginx.conf,可以设置多个 web 后端。当 web 后端成为瓶颈的时候,只要增加服务器数量,新增 web 服务的部署,在 nginx 配置中配置上新的 web 后端,就能扩展站点层的性能,做到理论上的无限高并发。
服务层的水平扩展
服务层的水平扩展,是通过
服务连接池 实现的。
站点层通过 RPC-client 调用下游的服务层 RPC-server 时,RPC-client 中的连接池会建立与下游服务多个连接,当服务成为瓶颈的时候,只要增加服务器数量,新增服务部署,在 RPC-client 处建立新的下游服务连接,就能扩展服务层性能,做到理论上的无限高并发。