目录
一、全局站点方案综述 1
二、全局站点双活解决方案 1
2.1 互联网区站点双活方案 1
2.2 互联网区站点故障切换 1
2.2.1 站点级故障切换 1
【专业术语说明】
GSLB: 全局站点负载均衡设备
SLB:本地服务器负载均衡
LLB: 多链路负载均衡
全局站点的高可靠性规划主要目的是当主站点或某一个站点的某个环节或全部发生故障后,可以智能或手工进行故障切换,保证线业务的高可靠;
针对多站点之间和站点内多链路之间的高可靠性保证和负载均衡,我们建议在主站点和备站点分别部署专业的GSLB设备和多链路负载均衡LLB设备以实现站点级别的智能故障切换和站点内链路级别的智能故障切换;
另外在B中心双活数据中心架构下的业务引导和业务智能切换,GSLB设备起到关键性的作用;
我们建议在两个数据中心采用全局负载均衡、链路负载均衡和本地负载均衡整体解决方案,实现B中心双活数据中心建设;
在双活数据中心设计时,在业务访问层面主要考虑两个重点:
第一:如何选择最佳站点,将外部用户的访问同时引导至两个数据中心;
第二:业务的连续性,即如何保障业务的故障切换;
灾备切换需要考虑以下两点:
业务层面的切换:当某一数据中心故障后,所有得业务需要手动或自动切换到另一个数据中心,保证业务能够继续运行。针对业务层面的容灾切换,全局负载均衡技术是最佳的选择,全局负载均衡技术可以智能的将业务请求切换到正常的数据中心,保证数据中心的高可用性。
数据层面的切换:数据层面目前采用主中心单一数据库,无需考虑切换问题。
本环节主要讨论数据中心业务层面的故障切换,故障切换主要从一下几点分析:
整个站点故障主要是指站点接入链路故障或整个数据中心因自然灾难或掉电引起的故障;。
访问方式:基于域名访问的B/S模式
实现技术:主域授权DNS配合GSLB设备的智能DNS 解析
业务模型设计:互联网WEB层基于域名访问设计;
工作原理:当用户在浏览器访问www.xxx.com时,首先要进行DNS 解析,即查找出www.xxx.com对应的A纪录IP 地址,然后用户与该IP地址建立TCP连接访问网站内容。在部署全局负载均衡设备后,具体的DNS解析过程交给GSLB全局负载均衡设备来完成,需要在域xxx.com的授权DNS服务器上增加多笔NS记录,即www.xxx.com的NS 纪录指向位于双站点的GSLB设备的接口IP地址,对www.xxx.com的解析将由该GSLB设备负责完成;
授权DNS服务器域名解析配置(以双站点双链路接入为例):
www.xxx.com NS A中心 ISP1 IP(10.10.10.10)
www.xxx.com NS A中心 ISP2 IP(11.11.11.11)
www.xxx.com NS B中心 ISP1 IP(12.12.12.12)
www.xxx.com NS B中心 ISP2 IP(13.13.13.13)
【备注:以下GSLB处理流程及DNS处理机制以阿里云DNS为例】
假定A中心站点作为万网DNS的首选NS查询记录,DNS解析的整个过程分析如下:
【备注:客户端被GSLB设备解析到B中心站点的访问与上述业务流程相同;】
站点级故障切换包括的因素:
以上各环节,其中任何一个环节出现问题都会导致整个站点无法提供服务;
站点级故障的业务切换主要是靠LocalDNS查询授权DNS响应的NS记录实现,如下图中第5步LocalDNS请求同时查询两个站点的GSLB的NS地址,假设A中心为故障站点,对NS查询请求无法响应,自然由B中心站点GSLB设备回应A记录实现所有用户到B中心 站点的访问;
【故障分析】
假设LocalDNS在查询时A中心站点瘫痪,B中心 站点工作正常,继续解析A记录;
假设A中心站点故障后,B中心 站点的GSLB设备收到DNS查询请求后会进行多链路层面的静态或动态的就近性判断,为客户端解析最佳的运营商线路;并将该链路对应的业务地址作为A记录返回给LocalDNS。
【备注:B中心 站点故障切换过程与上述一致;】