分钟级故障恢复的高可用保障

概要
高可用是网站能否为用户提供优质服务的一个重要考核标准,但到底是什么是高可用,目前是缺少一个这样的标准的,国家在系统的容灾能力方面有一个国标,为可用性做了一定的标准定义,但互联网行业需要一个更加适合和贴近的标准。 阿里集团是一个业务多元化的集团,每个业务领域也都是完全不同的,这个高可用的标准定义用于指导各业务领域的系统的高可用的能力建设,不仅仅是评估各业务领域目前能做到的高可用能力级别,同时还将结合业务发展状况制定一个长期的高可用能力提升的建设方案,例如如何应对单机房中各种基础设施(交换机、电力等)的故障,如何应对地域级的基础设施故障等等。 这个topic将分享我们所定义的高可用标准,以及要达到标准中不同的能力级别可采用的技术方案。

个人简介

梁耀斌,花名追源,来自“追本溯源”,2013年加入到阿里技术保障部架构工具团队,负责淘宝的下一代异地多活架构的实施和相关架构工具系统开发等工作,关注架构优化,自动化运维等领域的技术。

QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、杭州、旧金山召开。自2007年3月份首次举办以来,已经有包括传统制造、金融、电信、互联网、航空航天等领域的近万名架构师、项目经理、团队领导者和高级开发人员参加过QCon大会。

你可能感兴趣的:(分钟级故障恢复的高可用保障)