在互联网、物联网、大数据的伴随下,数据呈指数增长,每天增加百万兆字节的数据是很常见的,随之而来将会面临的是更多的存储需求和挑战。传统的解决方案不足以满足这些存储需求,迫切需要一种有效的解决方案,软件定义存储是解决这些问题的常用方案。
SDS起源
在IT基础架构领域的软件定义,最早出现的是:软件定义网络(SDN)。SDN起源于2006年斯坦福大学的Clean Slate研究课题。2009年,Mckeown教授正式提出了SDN概念。通过将网络设备的控制平面与数据平面分离开来,并实现可编程化控制,实现了网络流量的灵活控制,为核心网络及应用的创新提供了良好的平台。
2012年,VMware在其vForum大会上首次提出软件定义数据中心(SDDC)的概念。作为VMware软件定义数据中心五大组成部分(计算、存储、网络、管理和安全)之一,软件定义存储(SDS)的概念也首次被提出。
EMC公司在当年的EMC World发布大会上也发布了SDS战略,引发了业界对SDS的大讨论,SDS迅速成为存储业界的研究热点。而SDS的概念则是最近几年随着华为、杉岩数据等企业产品的逐渐成熟而兴起的。
SDS是个啥?
2012年8月,VMware首次提出软件定义存储的概念。VMware认为软件定义的存储产品是一个将硬件抽象化的解决方案,它使你可以轻松地将所有资源池化并通过一个友好的用户界面(UI)或API来提供给消费者。一个软件定义的存储的解决方案使得你可以在不增加任何工作量的情况下进行纵向扩展(Scale-Up)或横向扩展(Scale-Out)。
实际上,SDS的定义出现至今已经三年多了,但仍没有统一的标准。贡献最大的SNIA认为SDS允许异构的或者专有的平台。必须满足的是,这个平台能够提供部署和管理其虚拟存储空间的自助服务接口。除此之外,SDS应该包括:
自动化:简化管理,降低维护存储架构的成本;
标准接口:提供应用编程接口,用于管理、部署和维护存储设备和存储服务;
虚拟数据路径:提供块、文件和对象的接口,支持应用通过这些接口写入数据;
扩展性:无需中断应用,也能提供可靠性和性能的无缝扩展;
透明性:提供存储消费者对存储使用状况及成本的监控和管理。
SNIA认为,存储服务的接口需要允许数据拥有者(存储用户)同时表达,对于数据和所需服务水准的需求。数据的需求,就是SDS建立在数据路径(Data Path)的虚拟化,而控制路径(Control Path)也需要被抽象化成为存储服务。云、数据中心和存储系统,或者数据管理员能够被用于部署这个服务(指Control Path)。
SDS对于初学者需要注意啥?
尽管SDS概念很简单,但过渡到技术既复杂又具有挑战性。随着自动化,灵活性,存储容量的增加和提高工作效率的综合诱惑,SDS已变为主流,银行,制造,制药,医疗保健,媒体和政府等企业迅速转向该技术。
入门
成功的SDS用户首先会选择离散用例作为起点。在企业内部,通常将备份和归档等第2层应用程序视为存储大规模任务关键型数据的最佳方式,这些是展示SDS的可扩展性,可用性和成本优势的完美方式。随着时间的推移,更多的用例包括大数据和深度学习可以上线,进一步提高SDS的经济优势。
最近转向超融合基础设施(HCI)的企业已经开始使用SDS,对于这些公司来说,首先评估一下HCI是否对公司有益这是一个很好开端。如果HCI对公司有益,就要考虑是否需要扩大数据中心的SDS覆盖范围。即使没有采用HCI的公司通常也已在他们的环境中使用了某种类型的虚拟化技术。
VMware,HyperV实际上是软件定义的计算解决方案,软件定义的存储产品将虚拟化优势扩展到数据层,但采用者还需要仔细检查是否支持基础架构。任何企业,当他们进入下一个基础架构更新周期时,都应该需要评估更新的技术所带来的风险。
找到能够满足当前和未来存储要求的SDS产品非常重要,特别是在合规性和安全性等关键领域。要区别对待并找到一种能够降低IT部门复杂性和任务的解决方案,然后开始迁移最容易迁移的工作负载,或者是具有当前未满足特殊要求的数据集,例如加密,性能或可访问性。企业应该评估他们未来几年的技术路线图,并考虑转向SDS解决方案,如果现有环境需要新的存储管理员,那么可能考虑雇用精通软件定义存储的新系统管理员。
潜在陷阱
企业在计划向SDS转型时经常会犯的一个错误是将技术看作是“点产品”。VMware副总裁Lee Caswell说:“软件定义的解决方案是一个更大的堆栈的理想组成部分,它为计算、存储、网络和云提供了一个通用的操作模型。“
对于企业和从事SDS的技术人员来说,最大的问题可能是操之过急。一些企业会后悔他们的决定,因为要么过于突然,要么事前没有适当的规划。那些没有适当技能的人会感到沮丧,或许他们会觉得任何存储管理员或云的从业者都能在一夜之间掌握这些知识和培训。
SDS新手犯的最大错误也许是相信这项技术对所有工作负载来说都是“万灵丹”。所有的企业都可以从大量的工作负载中受益,但真正重要的还是利用可用的it资源来分析业务需求,从而提出操作的最佳解决方案。
SDS应用场景
多年前,麦当劳希望可以通过问卷的方式从消费者口得知“要怎么改进奶昔,你才会买更多?你想要这款奶昔再便宜点吗?巧克力味再多点怎么样?”等问题答案。于是,麦当劳请了哈佛商学院教授 Clayton Christensen 和他的团队一起解决这个问题。后来发现原来所有买奶昔的顾客每天一大早都要开很久的车去上班,路上很无聊,开车时就需要做些事情让路程变得有意思一点;其次就是防止午饭前肚子咕咕叫。那么,在这个场景下,奶昔的作用就发挥出来了
同样在对于软件定义的存储,我们也会好奇它在什么场景下适用呢。
VDI场景,目前最被人接受的场景,传统虚拟桌面环境(VDI)的共享存储,在进行扩展的时,需要增添服务器和存储阵列;而采用SDS作为VDI存储的时候,可与虚拟化平台进行融合部署,仅需要扩展服务器,依靠服务器内的本地存储来增加虚拟共享存储容量。可以说,VDI的存储包含在单独的服务器里,纵向可以通过添加磁盘进行扩展,横向可以通过增加新的服务器节点。
私有云场景,在这个场景中,软件定义存储可与同样基于软件定义的计算、网络进行深度融合于一体,软件定义存储的大容量、高安全性、高扩展性、性能线性增长等特性简直完美贴合私有云需要的存储特性。
企业内部开发测试场景,对于企业的开发测试环境、学习实验环境、云计算数据中心,分布式存储技术同样受用。比如,OLAP(联机分析处理)和OLTP(联机事物处理)。在具体工作中,通过分布式客户端缓存,降低存储时延,满足OLTP需求,亦可满足OLAP所要求的大并发MBPS,高计算和存储带宽、高IOPS并发的要求。
数据高可用需求场景,就像有人天生就是靠脸吃饭一样,有些业务天生就需要分布式的。软件定义存储天然可以将数据进行切分然后松耦合运行,采用无中心节点的设计,将数据进行切分以多副本的形式存放在不同的硬盘、节点、机架上,即使某个节点出现故障,业务也可以正常运行,进而保证数据的高可用性。
数据备份场景借助软件定义存储自身的分布式特点,可独立或与备份软件相配合,为生产系统的主用存储提供更为安全的数据备份服务。
以上的场景只是目前已经被验证的场景,但是相信,随着科学技术的发展,软件定义的存储应用场景不仅仅止于这些。
SDS面临的挑战
软件定义存储从国内外的预测来看,在2020年左右也会迎来比较大的发展期。致力于信息技术研究和分析的公司Gartner预测,2020年企业的采纳率会达到35%,其中文件存储应用占比较大的份额,块存储和对象存储紧随其后。
我国软件定义的存储市场也在蓬勃发展,新兴市场驱动着大批企业进一步推动产业发展。“虽然SDS增长势头强劲,但仍存在一些问题。”栗蔚表示。
就中国市场而言,目前的挑战主要在于首先统一管理和调度的问题,很多用户数据中心的存储是万国俱乐部对此,业界针对性推出了存储虚拟化的解决方案,如ViPR、SVC等,基本上就是这样目的。在没有软件定义存储的时代,都提存储虚拟化。以至于后来,软件定义存储出现之后,很多认为不过存储虚拟化的翻版,旧瓶装新酒。
其次还有一个需求就是存储的软件和硬件分离,从紧耦合到松耦合,让软件和硬件无关。其带来的好处在于,让应用融合变得更加简单。以SAN和 NAS为例,很多用户希望一台设备同时提供SAN、NAS的需求,所谓统一存储。如果软件和硬件不分离,就需要额外增加NAS网关。 随着对象存储应用需求的出现,软件定义存储会让应用的支持变得简单,灵活。应该说,这是软件定义存储主要解决的问题。
原文发布时间为:2018-07-17
本文来自云栖社区合作伙伴“SDNLAB”,了解相关信息可以关注“SDNLAB”