条漫设计 | 付费下载自稿定设计
条漫文案/正文 | 胡巍巍
PPT | 阿里云王志坤
出品 | CSDN(ID:CSDNnews)
性能普遍提升2-3成,RT大幅下降,业务丝般顺滑——这是神龙在2019双11大促的概括性表现。
2019年双11期间,神龙”扇动两翼“,充分发挥出两大优势。第一大优势,神龙实现了虚拟化卸载,以高负载压力下某电商应用为例,凭靠神龙,该应用实现30%的QPS上升、以及96.3%的RT下降。第二大优势,神龙实现了物理网络、存储和计算的完全解耦,从而避免资源争抢。
故事的起源,要从弹性计算开始。
2014年开始,阿里在双11大促中,开始使用公共云,即把大促的峰值流量,引入到公共云来承载,这种方式就叫弹性计算。
这里不得不提阿里云的云原生改造改造。几年前的阿里云,已经完成基于云的云原生改造。但这些改造,共同发挥效率时,开销会非常大。
2016年,现任阿里巴巴集团CTO张建锋(花名行癫),在当年的内部技术复盘会上说,如果要使用公有云,那么云计算的性能损耗能否成为零?
当时技术团队有点打嘀咕,因为他们感觉以当时的技术而言,云一定是有性能损耗的。军令如山,收到任务的技术团队,还是做出了行癫想要的。
今天阿里用的公有云,不仅没有虚拟化性能损耗,而且适应性更好。这其中,用到的“神器”便是阿里巴巴自研的神龙云服务器架构(以下简称“神龙”)。
神龙,是阿里云在过去两年间,一直面向的一个场景,也是阿里自研的软硬融合虚拟化的一个体系。
阿里云认为,在纯软件技术方面,行业已经把能做的技术,都做到极致了,但却仍会遇到很多挑战。
因此他们选择以软硬融合的方式来做神龙。截至目前,神龙已经发展到第三代。
2016年底,神龙开始立项。2017年10月,第一代神龙服务器发布。神龙一代,用一句英文来描述,它就是One Card for Everything,它还是裸金属虚拟化的先行者。
它不仅能提供类虚拟机管理接口,还能像管理虚机一样管理物理机,其具备的自研神龙芯片,可实现超高速IO,并能提供虚拟机存储和网络接口。
此外,神龙一代还拥有芯片加速的IO引擎,可以无缝接入VPC网络、EBS存储,还支持从镜像启动,并能实现快速交付。
一言以蔽之,神龙一代拥有超越物理机的性能和虚拟机的体验。
在研发第二代神龙时,技术团队已经对于某些产品形态,完成了从0到1的转变。
神龙的新目标,是让拿到的每一份资源,都没有任何性能损耗。
第二代神龙,发布于2018年9月,它是融合虚拟化的践行者,它具备技术融合和资源并池的功能,一套软硬件,就可以实现三种服务:即裸金属服务器、虚拟机服务和容器服务。
归纳来说,神龙二代,有三大优势。
第一,超轻薄,它的内存小于1MB/VM,CPU小于0.1%;
第二,超平稳,几乎零抖动,计算平稳性达到99.9999%,这几乎接近物理机的调度延迟;
第三,超平滑,神龙二代可以兼容原有KVM架构,并实现虚拟机互迁移。
2018年神龙二代发布之后,阿里云越来越显著地感受到互联网的变革、以及云原生时代的到来。
云原生时代到来以后,整个云端资源交付界面,都已发生变化。在云原生时代,你可能会用EVS来管理资源。
过去,你可能还得申请一个两核、四核、甚至八核的VM。今天,你只需拥有一个子机、一台母金属,上面就会呈现出你的KVS和上百个容器。
这时,所有的资源,都由你自己掌控。但是,这也给神龙,提出了更高挑战。
2018年下半年,在研发神龙三代时,阿里团队在整个底层IO层面,把所有的东西全部压缩,同时给硬件做了更多提升,这使得IO的合理性和稳定性更好。
2019年9月,暌违一年,神龙三代终于发布。
迭代三次的神龙,已经能让芯片实现IO引擎,还可实现硬件级QoS管理,并拥有增强型融合网络,也能实现2x50GbE双上联网络。此外,其还拥有增强型硬件列队。
人种的是什么,收的就是什么。
今天的神龙,已经被定义为面向云原生时代的弹性产品。
回望过去三年,这或许是一段备受煎熬的雕刻时光。
一位位程序员,就像工匠一样,拿起小锤一笔笔刻画着神龙的鳞片。
也因此,双11的追光灯,注定会打在他们身上。
人生短短几十年,打工也好,创业也好,总得有能拿出手的作品。
这个作品,可能是你曾开发的软件、参与的项目、拿下的单子......
总之,生而为人,你得创造点什么。