基于算网大脑的探索和实践

2022年2月,国家正式发布消息,同意在内蒙古、贵州、甘肃、宁夏等地启动建设国家算力枢纽节点,标志着,”东数西算“工程已全面启动。 “东数西算”战略是一项长期的策略,并非是一时的热点,跟“南水北调”工程很类似,本质上都是为了解决国内资源不平均,算力供需不平衡的问题,同时促进国内数据中心高质量发展,并带动数字经济相关产业可持续性发展。

现状及场景需求

当前东部在市场、技术、人才等方面有更多优势,西部在资源、电力、自然条件等方面有更多优势,两者结合,能在一定程度上破解东部捉襟见肘的资源困境和成本压力。当然“东数西算”并不意味着所有数据都放到西部地区进行处理。毕竟受限网络长距离传输造成的时延以及相关配套设施等因素影响,西部数据中心并不能满足所有算力需求。“东数西算”一定是建立在满足业务的需求之上,再实现资源的最优配置,是实际业务需求来驱动的。尤其是对那些实时性要求较高的业务如工业互联网、金融证券、灾害预警、远程医疗、视频通话、人工智能推理等,就不太适合布局在西部。相反,对于后台数据加工清洗、离线数据分析、存储备份、视频渲染等对计算能力密集度要求高,但对网络实时性要求不高的业务则由西部数据中心来承接更为合适。

算力网络需求的落地面临着诸多挑战

挑战1 - 融合架构

在“东数西算”的整个布局中除了西部的数据中心建设外,必不可少的就是建设数据中心之间的高速网络通道,整合“网、云、数、智、边、端、链”多层次算力资源,构成融合架构,并充分利用融合架构的优势,扩展计算资源、存储资源、安全防护及各类丰富的应用等。
让用户请求按照距离就近、访问质量较优线路的数据中心接入,再通过数据中心之间的互联互通的线路通信和数据传输,逐步让算力成为与水电一样,可“一点接入、即取即用”的社会级服务,达成“网络无所不达、算力无所不在、智能无所不及”的愿景。当然,算力网络还涉及多学科、多领域的融合,仅仅只是简单的叠加,那么融合深度、广度都是远远不够的。

挑战2 - 多层级协同

随着各层级、各场景的互联互通,则需要网随算动,无论是算网连接能力还是调度能力均需持续提升,通过实时感知、协同编排、算网一体的协同智能调度等能力实现网络服务和算力服务的同开、同停、同监控,并各取所需,按需分配,智能调配等动态适应并承载不同应用的能力,构建稳定可靠的算力互访平台,以有限资源换取无线空间,超越人工智能与大数据,实现最大价值。

挑战3 - 一体化服务

从推动信息基础设施布局角度看,全国一体化大数据中心与传统数据中心不同,是将数据中心、通信网、云计算、大数据、人工智能和安全融为一体,构建新型的体系。所以除了有硬件及网络的强大支撑外,提供更为便捷、易用的一体化服务也是很大挑战。

挑战4 - 可扩展及灵活性

算力成为整个数字信息社会发展的关键,超大的规模部署、大量且多样化的数据、海量的服务等,场景越来越复杂,但对灵活性要求却越来越高。性能和灵活性,鱼和熊掌,全部都要。因此对算力的能力也提出更高的要求:通过横向扩展来提升系统的服务能力,并且各种云服务的架构逐渐微服务化以及可扩展处理器的发布等用新技术赋能“东数西算”。

挑战5 - 安全

“东数西算”显然让数据实现东西部数据中心之间的迁移或传输,那跨越千山万水中间的安全问题也成为其挑战。在数据传输过程中是否有被窃取和篡改的风险、是否会遭受各种病毒入侵或攻击等导致数据损坏、业务中断等。因此需要对网端、云上、数据、应用的安全防护实现同步规划、同步建设、同步运营;以安全事件预警、分析研判和响应处置为核心,建设安全大脑以及运营中心,保障一体化大数据中心持续安全运营。除了安全,还有业务和数据的合规、审计等需求。

三大运营商、各专业领域厂商积极参与和推动算力网络整体演进与能力落地

基于上述几大挑战,各大运营商、云商、相关领域的厂商也积极地提出专业见解、解决方案或新技术创新等来应对挑战,积极投入到整个算力网络的研究当中,并在标准领域积极布局,推动国际、国内算力网络标准的形成。

  1. 中国电信认为,通过三个阶段将边缘计算、云计算等多级算力节点与网络完全融合,实现云网融合下的资源供给,为用户提供最优的服务以及运营保障,并逐步消除“计算”、“网络”、“存储”三大资源池之间的显著隔离,将基于云网资源的“云网统一服务”成为数字化平台的标准件。
  2. 中国联通基于云网融合1.0工作基础上,结合未来业务形态的变化,在云、网、芯3个层面持续推进研发,实现SDN和NFV的深度协同,服务算力网络时代各种新业态,迈向算网一体的云网融合2.0阶段。
  3. 中国移动计划把算力网络的发展分为三个阶段,即:起步阶段(泛在协同)、发展阶段(融合统一)和跨越阶段(一体内生)。早在2021年11月,在中国移动全球合作伙伴大会上,中国移动携手华为、中兴通讯、浪潮、飞腾、新华三、英特尔等合作伙伴,共同发布《中国移动算力网络白皮书》,提出了“算力网络”全新发展理念,并联合向业界提出算力网络发展倡议,掀起了算力网络发展新高潮。

结合三大运营商的演进思路来看,算力网络的实现即将算力融入网络,以网络作为桥梁,使得算力通过网络连接实现云-边-端的最优化协同与调度。业界普遍认为算力网络的能力落地主要包括:算网基础设施层、编排管理层、运营服务层。
基于算网大脑的探索和实践_第1张图片

(图一 *来自中国移动算力网络白皮书)

算网基础设施层:提供融合的算网底座,未来计算、存储遍布网络,需要以网络为根基,提供普遍服务,将网、云、数、智、安、边、端(ABCD-NETS)等深度融合、提供一体化服务的新型信息基础设施层。

运营服务层:承载泛在计算各类能力及应用,并将用户业务对融合型资源提出的需求如算力要求和网络SLA要求等,传递给编排管理层,实现算网产品的一体化服务供给,使客户享受便捷的一站式服务和智能无感的体验。

编排管理层:算网大脑,即算力网络的控制核心。算网大脑向下实现算网全领域资源拉通,向上实现算网融合类全业务支撑,融合人工智能、大数据技术,实现算网统一编排、调度、管理、运维,打造算力网络资源一体化设计、全局编排、灵活调度、高效优化的能力。未来,算网大脑还将融合意图引擎、数字孪生等技术,实现自学习、自进化,升级为真正智慧内生的超级算网大脑。

算网大脑:控制整个网络、云资源信息,编排整体算网调度的核心
在新华三认为,落地智能大脑的方案演进分为3个阶段:协同融合一体
1、 起步阶段,核心理念“协同”:云和网在资源形态、技术手段、承载方式等方面彼此相对独立,但可以通过两者在云网基础设施层的“对接”,统一资源视图,实现网随算动、协同编排、协同运营和一站式云网订购服务。
2、 发展阶段,核心理念“融合”:算与网逐步融合发展,但还是两个身体,负责管理编排的“大脑”融合统一,实现算网资源层面的统一管理、智能编排和融合服务。
3、 跨越阶段,核心理念“一体”:算网边界被彻底打破,形成算网一体化基础设施,为用户提供融合多技术要素的一体化服务。

除此之外,整体架构应统一技术路线、目标架构、标准体系;实现统一封装、灵活调用,为各行各业打造更便捷的决策工具,并开放、标准的编程模型和访问接口,满足多种外部对接,营造良好的生态环境。

当前新华三是以二阶段为主,并结合三阶段需求,构造新华三的算网大脑落地。

算网大脑作为算力网络的控制核心,在新华三的落地实践是AD-NET应用驱动网络解决方案。AD-NET凭借内生的6大关键能力:云智原生、复合孪生、意图驱动、全域融合、全栈透视和自主构建,在编排层构建起了统一编排、智慧内生的算网大脑。

  1. 云智原生的统一底盘提供算网融合的基础能力,打造敏捷灵活的算网编排底座;
  2. 复合孪生不仅能提供物理网络全生命周期的仿真验证、模拟推演,迭代优化,同时还能将仿真优化配置应用到实际网络网络中,进行网络的优化调配,提升了算网运行的可靠性;
  3. 意图驱动能力利用分析引擎和自动化引擎进行信息交互和闭环处理,基于意图自动翻译、策略构建和自动实施,智能高效实现算力资源整合和选择,持续交付服务意图的网络;
  4. 全域融合打通了不同领域的边界,为算力资源和网络资源的协同部署、编排、调度及可视、端到端的统一管理提供了基础;
  5. 全栈透视能力让我们能够实时感知网络和算力的状态、通过AI、大数据加持,能够做到算网自优化、自闭环,提供客户不间断业务;
  6. 自主构建为客户提供可定义可扩展的集成应用框架,包含可视化页面定制和可视化业务编排能力等,便于客户定制算网融合的服务需求,实现算网统一编排、部署和保障;

在整个算网系统中,AD-NET对接多云平台,收集算力和网络关键数据,形成算网地图。服务层提供协同编排的统一入口,给用户提交应用业务特征及应用所需的算力和网络要求,再由服务层调用AD-NET的标准接口,传递应用特征、算力和网络需求后,AD-NET基于当前算网地图,将算力、网络需求作为调度因子,未来还可结合成本、能耗、均衡性等调度因子,为应用快速计算并自动部署到最佳部署点,同时通过承载网的引流和调度技术,为应用及时部署端到端的最佳传输路径。与此同时,AD-NET也会对云、网资源及应用等多维度的实时监控并呈现,一旦资源紧张或者网络异常时,会及时产生告警,并且自动执行用户提前定义的应对策略,及时保障应用的服务质量。

对于阶段三,其核心需求和理念是“一体”:算网一体、智能算网、算力一体、运营一体。
 算网一体:算力和网络在协议层面一体化,通过更新路由协议,算力资源信息被写到路由信息中,网络设备在扩散路由的同时,分发、传播算力信息,实现转发即计算。
 智能算网:算网大脑引入更多的AI和大数据技术,实现智能感知、分析业务需求,提供安全、运维等多种智能服务,构建整个云网架构的智慧大脑;
算力一体:提供算力管理、算力计算、算力交易以及算力可视等能力,算力网络可像电力网络一样,吸纳全社会不同类型的算力资源,实现用户对算力资源的随取随用;
运营一体:提供云、算、网、数、智、链、安一体的融合运营平台,为客户提供最合适的一体化服务,并可以实时了 解服务提供进度,服务提供质量等各项内容;

基于算网大脑的探索和实践_第2张图片

图二 新华三提供全方位算力能力

结合阶段三的需求,新华三当前正以算网大脑为核心,通过试点、技术合作等多种模式,为运营商和政企客户提供泛在的算网一体化服务。包括算网一体化大屏、一体化监控、一体化拓扑、算网资源的统一分发、算网资源统一调度,并可以结合新华三的VDI云桌面等业务应用,进行更深层次的协调联动,从而也就保障了更为优质的业务使用体验。同时华三“融合”和“创新”上深度研究和耕耘:“融合”指的是算网智用一体化,从而让算力和智能实现无处不在,“创新”指的是算力度量、分级算网大脑架构、智能AI等技术创新,既适用于本地化区域中心控制运维,也支持“东数西算”的宏观调度。

结尾:

“东数西算”已逾周年,这一年来,数据中心项目加紧推进,算力产业底座持续夯实,算力资源架构日趋完善。新华三将持续关注、参与新技术、新标准的讨论与投入,和各行各业一起,探讨和实践算力产业高质量发展之路,真正赋能千行百业,为实现“东数西算”提升国家算力水平、促进绿色发展、扩大有效投资、推进区域协调发展的战略初心,贡献企业的社会责任。

你可能感兴趣的:(网络,算力,东数西算,算网大脑)