Longhorn项目是Rancher Labs推出的开源的基于云和容器部署的分布式块存储新方式。Longhorn遵循微服务的原则,利用容器将小型独立组件构建为分布式块存储,并使用容器编排来协调这些组件,形成弹性分布式系统。
2017年4月Longhorn初发布。2018年3月Longhorn v0.2发布,支持任何Kubernetes集群的持久化存储实现。过去一个多季度以来,Longhorn研发团队基于用户的反馈与建议,进一步打磨Longhorn,并于今天正式发布Longhorn v0.3,在新版本中带来了新UI、CSI支持、S3备份目标、在多磁盘上提供基于容量的调度、基础镜像功能、iSCSI前端支持、零停机升级等酷炫功能。
Why Longhorn
如今,基于云和容器的部署规模日益扩大,分布式块存储系统也正变得越来越复杂,单个存储控制器上的volume数量在不断增加。2000年代初,存储控制器上的volume数量只有几十个,但现代云环境却需要数万到数百万的分布式块存储卷。存储控制器变成了高度复杂的分布式系统。
分布式块存储本身比其他形式的分布式存储(如文件系统)更简单。无论系统中有多少volume,每个volume只能由单个主机进行装载。正因如此,我们设想,是否可以将大型块存储控制器分割成多个较小的存储控制器?若想要如此分割,我们需要保证这些volume仍然是从公共磁盘池构建的,并且我们需要有办法来编排这些存储控制器,让它们可以协同工作。
为了将这一想法发挥到极限,我们创建了Longhorn项目。这是一个我们认为值得探索的方向,每个控制器上只有一个volume,这将大大简化存储控制器的设计。因为控制器软件的故障域仅限于单个volume,所以控制器若崩溃,也只会影响一个volume。
Longhorn充分利用了近年来关于如何编排大量的容器和虚拟机的核心技术。例如,Longhorn并没有构建一个可以扩展到100,000个volume的高度复杂的控制器,而是出于让存储控制器简单轻便的考虑,创建了100,000个单独的控制器。然后,我们可以利用像Kubernetes这样的最先进的编排系统来调度这些独立的控制器,共享一组磁盘中的资源,协同工作,形成一个弹性的分布式块存储系统。
Longhorn基于微服务的设计还有很多其他优势。因为每个volume都有自己的控制器,在升级每个volume的控制器和replica容器时,是不会导致IO操作明显的中断的。Longhorn可以创建一个长期运行的工作来编排所有live volume的升级,同时确保不会中断系统正在进行的操作。为确保升级不会导致意外的问题,Longhorn可以选择升级一小部分volume,并在升级过程中出现问题时回滚到旧版本。这些做法在现代微服务应用中已得到广泛应用,但在存储系统中并不常见。我们希望Longhorn可以助力于微服务在存储领域的更多应用。
Longhorn功能概述
共享资源池:将本地磁盘或安装在计算或专用存储主机中的网络存储形成共享资源池。
为容器和虚拟机创建块存储卷:你可以指定volume的大小,IOPS的需求,以及你想要的跨主机的同步replica的数量(这里的主机是指那些为volume提供存储资源的主机)。replica是在底层磁盘或网络存储上精简配置的。
为每个volume创建一个专用的存储控制器:这可能是与大多数现有的分布式存储系统相比,Longhorn最具特色的功能。大多数现有的分布式存储系统通常采用复杂的控制器软件来服务于从数百到数百万不等的volume。但Longhorn不同,每个控制器上只有一个volume,Longhorn将每个volume都转变成了微服务。
跨计算或存储主机调度多个replica:Longhorn会监测每一个replica的健康状况,对问题进行维修,并在必要时重新生成replica。
以Docker容器的形式操作存储控制器和replica:例如,一个volume有三个replica,就意味着有四个容器。
为每个volume分配多个存储“前端”:常见的前端包括Linux内核设备(映射到/ dev / longhorn)和iSCSI目标。 Linux内核设备适用于支持Docker volume,而iSCSI目标更适合支持QEMU / KVM和VMware volume。
创建volume快照和AWS EBS风格的备份:您可以为每个volume创建多达254个快照,这些快照可以逐个备份到NFS或S3兼容的辅助存储中。只有更改的字节会在备份操作期间被复制和存储。
指定定期快照和备份操作的计划:您可以指定这些操作的频率(每小时,每天,每周,每月和每年)、执行这些操作的确切时间(例如,每个星期日凌晨3:00),以及保留多少个循环快照和备份集。
Longhorn v0.3新功能
Longhorn v0.3的UI得到了极大的优化,为用户提供了更为优异的操作体验:
用户可以在仪表板中查看系统的状态
为volume添加了多选和组操作
支持websocket支持,用户不再需要刷新页面来更新UI。当后端状态发生变化时,UI会自动更新
Dashboard
Node界面
Volume界面
在Longhorn v0.2中,有不少用户反馈Flexvolume driver目录位置的配置错误问题,这可能导致Kubernetes无法连接到Longhorn Driver。Kubernetes不提供有关Flexvolume driver位置的信息,用户需要手动操作识别。在v0.3中,我们添加了对最新Container Storage Interface的支持,该接口无需事先进行配置即可安装。关于如何使用CSI驱动程序安装Longhorn的详细信息,可参见此链接:
https://github.com/rancher/longhorn/tree/v0.3-rc#kubernetes-driver-requirements。
若您计划继续使用Flexvolume并且必须弄清楚volume插件的位置,我们为您准备的这个脚本可以提供一些帮助:
https://github.com/rancher/longhorn/tree/v0.3-rc#kubernetes-driver-requirements
Longhorn的一个很关键的功能就是volume备份,它可以备份本地快照并将其传输到辅助存储,如NFS。v0.2发布之后,用户呼声最高的、希望能在下一版本中实现的功能之一,就是支持使用S3作为备份目标。v0.3中,这一功能已实现!请参阅此处了解如何使用S3作为Longhorn的备份目标:
https://github.com/rancher/longhorn/blob/v0.3-rc/README.md#backup。
在Longhorn v0.2中,无论可用的磁盘空间如何,Longhorn v0.2都会在磁盘上随机放置volume。而v0.3支持每个节点多个磁盘,并且我们重写了调度程序,现提供基于容量的调度。用户现在可以启用/禁用任何节点或磁盘的调度,并知晓有多少磁盘正在使用。我们还为用户提供了各种选项,以自定义Longhorn如何在可用磁盘空间之上调度卷。请参阅此处了解详情:
https://github.com/rancher/longhorn/blob/v0.3-rc/docs/multidisk.md
v0.3支持基础镜像功能。Longhorn中的基础镜像是一个打包的Docker镜像,遵循RancherVM(https://github.com/rancher/vm)镜像规范。因此,如果用户有一些只读镜像,希望其在多个卷之间共享,则可以使用基础镜像功能来完成。请参阅此处了解如何创建和使用基础镜像功能:
https://github.com/rancher/longhorn/blob/v0.3-rc/docs/base-image.md。
Longhorn v0.3支持iSCSI前端。以前我们只支持使用块设备作为前端来访问volume内容。我们相信添加对iSCSI前端的支持,将有利于将iSCSI作为块设备接口的传统虚拟机管理程序。有关iSCSI前端支持的详细信息,请参见此处:
https://github.com/rancher/longhorn/blob/v0.3-rc/docs/iscsi.md。
在v0.3中,我们设置了一个框架,在升级Longhorn引擎时可以不影响volume。Longhorn引擎包括一个控制器和多个副本。现在,当volume运行时,我们可以换掉旧版本的控制器和副本,并在运行中添加新版本。如此一来,您可以实现在volume零停机的情况下部署新版本的Longhorn存储软件。
但需要注意的是,零停机升级适用于从v0.3升级至未来的所以新版本,但不适用于从v0.2升级到v0.3。
如何升级Longhorn
利用Kubernetes的特性,Longhorn v0.3的所有软件组件都可以升级。请在此处查看升级说明:https://github.com/rancher/longhorn/blob/v0.3-rc/docs/upgrade.md。
使用Rancher Catalog安装了Longhorn v0.1的用户请务必注意,请勿在UI中使用upgrade按钮。目前暂无法通过Rancher Catalog为早期版本的Longhorn进行一键自动升级,请按照上面的说明来手动升级旧的Longhorn系统。
一切开源,欢迎体验
始终秉承开源理念的Rancher Labs,推出的Longhorn依然是100%的开源软件。您可以在GitHub上下载Longhorn:https://github.com/rancher/longhorn,也可以通过Rancher Catalog部署它。
直到今日,Longhorn依然在持续不断的优化更新之中,我们暂不倡议您将其用于生产环境。欢迎在GitHub上或Rancher微信群中为Rancher团队提供宝贵的意见与反馈❤️