2008年,王坚从微软亚洲技术研究院空降阿里,担任首席架构师。这个在阿里内部尊称为“博士”的首席架构师所学却是一个心理学博士,是一个不会写代码的架构师。但王坚初到阿里,却提出了令业界震惊的阿里“去IOE”计划,准备在阿里的系统中去除IBM小型机、Oracle数据库及EMC存储设备。
这一大胆的计划,在阿里内部掀起轩然大波,很多人对此持有异议,再加上王坚并非科班出身的背景,这无疑给阿里的“去IOE”前景蒙上了一层浓重的阴影。但当时,阿里业务的飞速发展和对计算的指数级增长需求造成的技术与业务之间的巨大鸿沟,为阿里“去IOE”找到了充足的理由。阿里高层清楚地意识到,如果没有技术的创新和进步,必将影响阿里未来的发展。
于是,在阿里高层的支持下,阿里的“去IOE”计划得以顺利的进行下去。实质上,“去IOE”就是以商业化的x86服务器、开源数据库和分布式存储组成更加灵活、易于扩展、成本更优的适合互联网需求的新型IT基础架构。从更深层次的意义上说,“去IOE”的目的实际上是为阿里构建一个足够灵活,足够开放、足够高效的能够适应阿里业务飞速发展的系统架构,而这实际上与当时方兴未艾的云计算的理念不谋而合,而这,也为阿里云的诞生铺平了道路。
2009年,在阿里去“IOE”取得初步成果的基础上,阿里云成立,从此拉开了阿里云“开挂的人生”,也开启了中国的云时代。时至今日,在IDC最新发布的《全球公有云服务市场(2018下半年)跟踪》报告中,阿里云已经位居全球三甲,仅次于全球云计算始祖AWS、谷歌和微软Azure。
阿里云的成功,当然离不开王坚博士的高瞻远瞩,但从技术层面来看,广泛采用开源、开放的云原生技术,才是阿里云能够获得迅速成长的关键要素。
所谓云原生,是指一种构建和运行应用程序的方法,它利用了云计算交付模型的优势。云原生是关于如何创建和部署应用程序,而与在何处创建与部署无关。它适用于公有云和私有云。云原生架构充分利用按需交付、全球部署、弹性和更高级别的服务,极大提高了开发人员的工作效率、业务灵活性、可扩展性、可用性、利用率和成本节约。
可以看到,云原生技术与云计算有着千丝万缕的紧密联系,也会对创建云上应用提供诸多益处,而这也是云原生技术之所以能够促进阿里云迅猛发展的原因之一。实际上,从更广阔的角度来看,企业的云化不仅仅是基础设施和平台的升级,应用也需要摒弃传统的设计方法,从架构设计、开发方式到部署维护整个软件生命周期都基于云的特点设计,从而构建原生为云而设计的应用,这样才能在云上以最佳姿势运行,充分利用和发挥云平台的弹性以及分布式优势。正因为如此,云原生才会受到众多企业用户的青睐。而Gartner报告也证明了这一点——到2020年,将有50%的传统老旧应用被以云原生化的方式改造,到2022年,将有75%的全球化企业将在生产中使用云原生的容器化应用。
作为中国云计算的先行者,从“去IOE”开始,阿里就是云原生技术与应用的先驱者,是国内最早布局云原生技术的公司;拥有国内最丰富的云原生产品家族;拥有业界最大规模的云原生应用实践;云原生客户数国内第一。
2011年11月,阿里巴巴率先在国内布局容器技术。2015年12月, 阿里云对外提供容器服务和容器镜像服务 。2016年7月,业界首个大规模公共云容器案例,助力中信集团互联网+转型 。2017年11月,阿里云成为全球首批通过Kubernetes一致性认证的云厂商。2018年8月,阿里云开源Arena深度学习加速器被Kubeflow社区接受。2019年1月,CNCF 技术监督委员会首添中国面孔,阿里巴巴李响入选全球9人名单 。同年,阿里云成国内唯一入选Gartner《公有云容器服务竞争格局》报告企业……。
这些成绩充分说明,经过十年的发展,阿里云已经跻身成为国内云原生领域的领先者。
阿里云认为,云原生首先可以支持互联网规模应用,可以更加快速地创新和低成本试错;其次,云原生屏蔽了底层基础架构的差异和复杂性;同时,服务网格、无服务计算等新的计算范型的不断涌现,给整体IT架构能力带来了极致弹性,从而更好地服务于业务。用户可以基于阿里云容器服务构建面向领域的云原生框架,如面向机器学习的Kubeflow、面向无服务器的Knative等等。而在日前结束的阿里云峰会上海站上,阿里云智能总裁张建锋也表示,全面上云的拐点已来,而对企业来说云原生就是上云核心的考量因素之一。
基于此,阿里云为企业用户提供了国内最丰富的云原生产品家族,覆盖八大类别20余款产品, 涵盖底层基础设施、数据智能、分布式应用等。这些产品可以完美搭配适用各种场景。
基因数据处理(容器+存储)可以解决基因计算存储管理、分发共享、计算分析、安全合规四大困难。通过云原生的方式,实现AGS工作流,支持并发、循、重试,为存储、弹性带来巨大支持。软件环境标准化、数据融会贯通、资源调度共享、提高资源利用率、降低成本、提高市场竞争力。
视频直播互动场景(边缘容器+CDN)具备大带宽、低时延、大连接的特点。具体而言,在主播和CDN之间加入边缘计算节点。直接在就近边缘节点完成直播流接入、转码以及就近CDN节点分发。 媒体流不再路经中心云端,无中心瓶颈,时效性提高,带宽和存储成本降低。在管控端,进行边缘节点和边缘应用的管理等。
智慧楼宇项目解决方案(边缘容器+IoT)可以实现云边一致的云原生DevOps,边缘算力、边缘应用统一编排、调度;边缘端实现边缘节点接入,边缘节点自治、网络自治,边缘业务高可用保障。
电商大促(容器+PolarDB)可以从容应对短时间内的海量并发,在峰值时计算能力需要弹性伸缩快速,整个期间通过自动化方式快速扩容和缩容。容器实现应用层面快速弹性,PolarDB实现数据层面快速弹性。
产品方面,阿里云ACK同时支持公共云、专有云和混合云模式,优化整合阿里云基础能力,使得容器应用轻松地利用底层强大的计算、存储、网络等能力。除此之外,在阿里云Kubernetes基础架构之上,结合Istio服务网格,支持多云、混合云,针对微服务提供有效的治理能力,并以Kubernetes和Istio为基础,提供针对特定应用负载的不同支持,例如针对Kubeflow服务的流量治理、为Knative提供负载的路由管理能力等。并且经过不断打磨,阿里巴巴在Kubernetes规模与性能上取得了显著成果:将存储object的数量提升25倍,支持的节点数从5000提升到上万,在端到端调度延迟从5s变为100ms等等。
而这些产品和解决方案为企业用户应用和实践云原生技术提供了一整套完整的软件生命周期解决方案,帮助企业轻松拥抱云原生:
工业领域的百年老店西门子,通过云原生满足了上线周期、扩容、运维等方面的高要求,仅用数月时间就完成了MindSphere基于阿里云平台的开发、部署。
日活用户超过2亿的微博,借助云原生搭建起高效稳定的机器学习平台,分钟级创建上百节点的GPU计算集群、秒级启动大规模分布式AI训练任务。
家居行业巨头居然之家,两年前将渲染服务迁移至阿里云,通过云原生等技术服务,降低IT计算成本50%,系统可用性却提高到99.96%。
事实上,除了积极帮助企业拥抱云原生,阿里云也一直致力于回馈社区、积极拥抱开源,是国内在云原生领域的开源贡献最全面的科技公司,涵盖编排调度、作业管理、无服务器框架等多个领域。
云原生基金会(CNCF)的多个明星项目 ,如etcd、containerd、dragonfly 等的发展均由阿里云主导维护,并且已有超过10 个项目进入CNCF landscape;在项目建设层面,阿里云积极建设Kubernetes 项目,贡献量位居全球前10。阿里云还是CNCF、OCI、CDF 等多个基金会的顶级会员。截至2019年6月,阿里共开源近700个项目,收获近40万Star,聚拢全球3.3万开发者,其中Star数位列全球企业前四,国内第一。今年1 月,阿里云资深技术专家李响更是成为首个入选全球顶级开源社区CNCF 技术监督委员会的中国工程师,推动云原生技术的落地。
阿里云智能容器平台负责人丁宇表示:“云原生正在重塑整个软件生命周期,容器、Kuberentes、云原生成为云时代的三个重要标准。阿里云将继续加大云原生技术栈产品体系的研发,并持续回馈开源社区,与生态合作伙伴一起,共同推动云原生标准制定以及应用的落地。”
对于一家技术公司来讲,十年,已经可以称得上一家“老”公司了,但对于阿里云来说,这条云之路可能才刚刚开始,随着云计算下半场的到来,顶着云原生引领者的光环,在未来等待着阿里云的,将是更广阔的星辰和大海。