日前,ZStack发布了 2.6.0版本,推出裸金属纳管服务。裸金属服务为应用提供专属的物理服务器,保障核心应用的高性能和稳定性,支持自定义安装操作系统,并提供裸金属主机的全生命周期管理,裸金属服务以单独的功能模块形式提供给用户。今天我们邀请到ZStack技术专家分享《私有云的裸金属》。
近几年云计算市场迅猛发展,彻底改变了传统的IT服务方式。进入2018年,一个传统IT服务中的概念–裸金属又渐渐的恢复了热度。什么是裸金属,它与云计算是什么关系,裸金属主机与虚拟机有什么区别,各公有云厂商如何实现的,有哪些特点,在私有云中实现裸金属与公有云应该有哪些不同的侧重点,让我们一起了解一下。
首先让我们来回顾一下虚拟化。虚拟化是云计算的核心技术。随着服务器硬件技术发展越来越成熟,硬件资源在很多情况下对比软件是相对过剩的,设备不能被充分利用,有力没处使。为应对这种情况,降低使用成本,虚拟化技术就出现了。它最初是出现在超算和大型机上,硬件的发展很多使得普通的服务器也有了虚拟化的需求。它可以把一台物理服务器虚拟化为多台虚拟服务器,每台虚拟服务器单独运行服务。
不言而喻,虚拟化的作用是显而易见的,有效的提高了服务器的利用率,也就是变相降低了单位服务器的价格,加速了软件服务的普及。但每一种技术都不是万能的。虚拟化在一些场合也是有局限的。比如,一些无法虚拟化的硬件设备,在虚拟机里面是无法识别的,如果想使用这些设备,应用程序就只能跑在没有虚拟化的物理服务器上;再比如,虚拟化本身是有一定资源损耗的,对于一些确实需要占用较多资源的应用,对性能延迟和密集I/O敏感的业务,工作负载大的数据库应用,机器学习等,跑在虚拟机上不但不能提供资源利用率,反而会导致性能损失,也是不合算的;还有一些对安全性、可靠性以及可控性要求比较高的场景,虚拟化也不是好的解决方案。
怎么解决这些问题呢,就该我们刚才提出的新角色裸金属出场了。所谓裸金属主机,就是真实的物理服务器。把真实的服务器直接添加到云平台的资源池,就像虚拟机那样,可以让用户直接申请、部署和使用。对于核心的、高IO高负载的或者数据库类的应用,直接跑在裸金属主机上,没有中间商赚差价,速度快性能足。除了性能方面的考虑,物理安全隔离、可以再次虚拟化、支持异构、支持容器、高稳定性和高可控性都是裸金属主机的优势。
由于裸金属主机不可替代的优势,在虚拟化蓬勃发展了多年以后,各大公有云厂商纷纷“回归原始”,陆续都推出了裸金属服务。来看下国内各大公有云厂商的情况。
17年10月份,国内公有云头把交椅的阿里在云栖大会上发布了自己的裸金属服务器 – 神龙弹性裸金属服务器,定义为同时兼具虚拟机弹性和物理机性能及特性的新型计算类产品。据了解,它的核心技术是通过安装在服务器上的定制硬件芯片X-Dragon MOC卡,实现与虚拟云主机无差别的裸金属直接弹性伸缩功能和使用体验。
17年11月份华为发布了自己的裸金属服务器,主打极速发放、共享卷存储,经初步了解,他们的实现是通过他们自主研发的SDI卡,跳过传统的PXE安装过程,直接从云硬盘镜像启动裸金属主机,可以实现5分钟快速发放。数据存放在云硬盘,自动挂载、扩容,可以摆脱本地存储的各种束缚。
腾讯云也有类似的产品,黑石物理服务器 (CPM),下面是从腾讯云官网截取的产品优势图,可见只是跟IDC方式进行对比,满足了云计算裸金属的定义,没有看到太多亮点,中规中矩。 4小时交付、控制台、云API等,算是某厂商云口中的裸金属服务器的传统实现方式吧。
此外,天翼云、紫光云、小鸟云等云厂商也号称提供裸金属主机服务,没有过多了解,不做详谈。
主流的公有云都已经有了裸金属服务,那么私有云呢,私有云需要裸金属吗?答案是肯定的。很多公有云裸金属适用的应用场景,在私有云中也同样存在,自然也有裸金属的需求。
那么,私有云的裸金属应该怎么做呢?首先我们来研究下私有云的特点:
私有云相对于公有云,一般规模较小、设备少、一般在千台以下。对裸金属主机的需求也比较简单,要么用来部署高IO高性能要求的应用;要么用来运行无法虚拟化的硬件需要执行的工作;要么用来处理高性能运算。很少像公有云那样,客户是不确定的,需要同时满足各种不同的应用场景。私有云中裸金属主机在整个平台中占比也不会太大,所以云平台管理的裸金属主机的量级也不高。私有云的提供者和使用者一般不是提供商与客户的关系,对于申请到使用的时效性要求没有那么高,公有云的极速部署,分钟级交付在私有云上没有太大的吸引力。
除了上面提到的差别,公有云和私有云的裸金属服务有更多的相似性。都需要与虚拟机互联,共享网络和存储,能外带控制裸金属主机的开关机、监控裸金属主机资源使用情况,创建镜像、备份和灾备等。
总结下来,下面是私有云裸金属应该实现的功能点:
1.裸金属主机申请及自动交付
用户可以通过填写工单申请裸金属主机,申请通过后,用户可以自主选择安装相应的操作系统及软件。
2.裸金属主机状态监控
能实时监控裸金属主机的系统使用情况,包括CPU、内存、存储以及网络等,当出现异常是可以及时提醒用户或者管理员进行处理。
3.管理节点提供部署服务
规模比较小的时候,部署服务如DHCP服务、TFTP服务、PXE服务等可以由管理节点提供,而不需要单独配置一台部署服务器,大部分时间又用不上,造成资源浪费;当然,达到一定规模,单独配置部署服务器还是有必要的,可以减轻管理节点压力,专机专用。
4.与虚拟机便捷互联
在裸金属主机支持多种方式与虚拟机互联,可以建立虚拟私有网络(VPC),也可以通过扁平网络,以满足不同网络安全需求。
5.镜像与备份
支持云主机镜像创建金属主机,支持裸金属主机创建镜像、克隆,支持裸金属主机镜像备份以及恢复。
6.带外控制
远程管理物理机,实现物理机的开机关机功能。
7.支持容器或其他云平台
可以在裸金属主机上部署容器,享受容器技术带来的便利,也可以在上面部署其它的云平台。
随着虚拟机技术的日趋成熟,虚拟机所带来的性能损耗会越来越少,一些基于性能考虑而选择裸金属的需要未来可能会越来越少。但在一些特殊场合,针对一些特殊设备如龙芯或其他不能虚拟化的设备中,云平台以裸金属形式纳管这些设备一定时间内还会长期存在。针对这种形式的裸金属设备,提供通用的管控接口,智能调度和状态监控也许是未来私有云裸金属管理方面发展的重点。