2017华为全联接大会HUAWEI CONNECT,华为重磅发布了CloudFabric解决方案,首次在数据中心领域提出面向应用场景的模型化组网概念,并发布面向高可用(High Availability)、超大规模(Hyperscale)、高性能计算(HPC,High Performance Computing)三个特定场景的数据中心Fabric模型。同时发布了华为400G数据中心互联解决方案, 解决海量数据在数据中心之间的迁移需求,大幅提升DC间的带宽利用率。
针对CloudFabric方案的提出背景、项目解读、应用前景等疑问,我们邀请到华为网络产品线副总裁李向军、华为数据中心网络解决方案总监俞涛、华为路由器与电信以太产品线副总裁马烨进行了全面解答。
行业数字化转型极大加速了企业DC云化。预计到2025年85%的企业应用将部署到云上,届时云计算必将成为各行各业的基本能力,行业云兴起、企业成为云化主角。如何快速构建一个支撑数字化转型的云数据中心便成为企业的当务之急,而数据中心网络作为构建云的基石,理所当然地成为行业数字化转型的关键制约因素。
李向军表明,目前行业内的大部分数字化转型方案都存在着不可忽视的弊端。一方面架构设计复杂,面对10+供应商、上千款产品,企业往往无从选择,而且方案设计周期动辄几个月。另一方面,项目部署周期长,从需求梳理、手工配置再到上线调测至少需要耗费几周。此外还有故障定位难的问题,近10年来网络规模增加了50倍,导致管理对象指数级增加,随着自动化程度的增加网络成为了黑盒,一旦出现故障,难以定位。
华为CloudFabric重新定义了数据中心Fabric的设计、部署、运维和互联,打造极简云数据中心网络。面向高可用、超大规模组网、高性能计算等场景发布的Hyperscale Fabric、High Availability Fabric、HPC Fabric三大Fabric模型,覆盖从设计、部署到运维全周期,实现快速灵活方案设计、自动化网络部署和智能化网络运维,为企业构建一张极简设计、极简部署和极简运维的云数据中心网络。
对于三大Fabric模型的方案介绍、能力解读、合作伙伴建设,李向军一一做了详细介绍。
HPC(高性能计算)是一类特别的计算和应用场景,硬件上有大量的并行超级计算机集群,通过网络进行密集的通信和级联。HPC系统能够快速准确计算出结果,有助于解决商业和科学研究中面临的问题,所以HPC系统越来越多的被科研机构、政府部门、商业组织所采用。但是HPC网络的现状却不容乐观,面临着多重挑战。一是计算网络要求低时延、零丢包;二是无法构建大型网络,面临规模瓶颈;三是网络架构多样,运维成本高。
基于华为独家创新算法,华为推出了业界首家基于以太网架构达到Infiniband同等性能的HPC网络解决方案,专为需要高性能计算的数据中心所设计,具备多种独特优势。一是低时延、零丢包:通过VIQ(Virtual Input Queue,虚拟输入队列)、动态ECN(Explicit Congestion Notification,明确拥塞通告)等华为独家创新拥塞调度算法,实现流量调度和负载均衡,网络零丢包,时延降低90%, HPC业务计算时长降低40%;整体性能达到Infiniband架构同等水平。二是5K超大组网能力:基于Spine-leaf 100GE以太网络架构,灵活扩展可支持多达5千台服务器接入,组网规模比专用网络提升5倍。三是架构归一化管理:实现传输、管理、计算三网架构归一;基于华为SDN控制器Agile Controller,可构建统一网络资源池并灵活调度,实现HPC as a service。
市场中某些行业对于安全性要求极高,金融行业为典型,也就对数据中心网络的可靠性、安全性、运维能力提出了更高要求。
华为High Availability Fabric数据中心网络方案,专为高可靠,高安全和智能运维场景的数据中心网络所设计,在可用性上具备多种能力。其一网络高可靠,业务零中断。通过硬件BFD(Bidirectional Forwarding Detection,双向转发检测)技术,实现毫秒级链路状态检测;设备上通过核心交换机CE12800 99.999%的电信级可靠性、TOR交换机M-LAG(Multichassis Link Aggregation Group)备份机制,确保业务零中断。其二应用高安全,随需精准管控。CloudFabric支持微分段,安全策略从原来的子网级细化到VM级,保证应用间东西向流量安全;基于GUI界面拖拽式操作,可在数分钟内完成安全策略的自动部署。其三智能运维,分钟级故障定位。FabricInsight网络智能分析平台,基于100%全网真实流采集分析,实时呈现应用与网络健康度,风险主动预测;基于大数据平台实现百亿条历史数据秒级检索、百万报文秒级分析,完成历史故障精准回放。应用异常应用自动关联故障链路,实现分钟级故障定位。
以互联网行业为例,随着业务的蓬勃发展,ISP数据中心网络规模持续扩张,带来数据中心弹性扩展与网络性能压力、网络自动化部署压力、多云协同管理压力等挑战。
华为Hyperscale Fabric数据中心网络方案,专为具备大规模高扩展无阻塞网络、自动化管理云和多云混合场景的数据中心网络所设计,具备如下能力:一方面,5万台服务器可以无阻塞接入,业界80倍端到端大缓存。核心交换机CE12800具备业界最高1032T交换容量,通过动态CLOS组网架构和信元交换技术,可支持多达5万台服务器的无阻塞接入;同时具备业界首款100GE短距双纤光模块,节省75%布线,简化管理。CE12800核心交换机单板支持24GB大缓存,CE6870接入交换机支持4GB超大缓存,端到端大缓存轻松应对网络突发流量。另一方面,网络全自动,分钟级上线业务。华为SDN控制器Agile Controller提供拖拽式网络自动化编排,业务上线时间从周缩短到分钟级,同时支持业界自动化管理工具(Ansible、Puppet等)的对接,实现物理网络的自动配置。再者,能够多云协同,OPEX降低80%。支持物理机、虚拟机、docker等多种计算资源接入,支持多种云化资源的统一管理;华为SDN控制器Agile Controller可与主流厂商或标准组织云平台的无缝对接,实现网络与IT资源统一管理,并可支持多DC、公有云、私有云统一管理。
在合作伙伴上,华为HPC Fabric、High Availability Fabric、High Availability Fabric三大模型能够在云平台、控制器和管理工具、网络设备、计算虚拟化等多个层面与主流厂商实进行无缝对接,良好实现了网络与IT资源统一管理、业务统一编排和自动化运维管理、数据中心物理网络与虚拟网络的统一联动,部署效率大大提升。
马烨表示:“在企业业务全面云化趋势下,为实现面向未来的云网协同,建设400G超宽、智能、节能的数据中心互联网络已逐渐成为趋势,华为400G数据中心互联解决方案将有力推动企业和服务提供商实现业务创新和快速云化转型,助力客户商业成功。”
当前大型的云数据中心要求服务器数量以万为单位来增长,服务器数据总量都在1000PB以上,互联网业务云化导致数据中心双活、灾备建设需求越来越多,带来多重挑战。互联网业务云化和数字化转型,流量增长迅猛;传统网络业务部署周期长,网络利用率低下;传统网络架构和设备不适配数据中心环境,运维成本高。
无阻塞、低时延的互联网络自然成为了数据中心网络的发展趋势。本次HC大会中发布的400G数据中心互联解决方案能够为客户带来海量带宽、智能随需、绿色节能三大价值。一是大容量:凭借400G的超大带宽,提升带宽利用率达到50%,有效解决DC互联方面遇到的困难及挑战,帮助企业打造可靠高效的数据中心互联网络。二是智能化:华为采用Agile Controller流量调优技术可以对整网流量进行监控并实时调整,从而实现链路间的负载均衡,除了能将带宽利用率从30%提升到80%之外,还能基于时延等因素进行流量调整,保障客户的应用体验。三是绿色节能:华为提供的400G 数据中心互联解决方案设备具有超高集成度和超低功耗(约业界平均标准的一半),采用了业界领先的浮动散热和碳纳米导热垫等专利技术,大容量单板的散热和设备功耗问题得到有效解决,节省了客户的运营成本。