5G时代,网络运维面临越来越多的挑战。从价值目标来说,网络运维是从节约成本到收益的转变,网络运维更像是流量管理。传统的网络运维是典型的“人流量”人工运维模式,具有半人工半自动化的特点,也在朝着全自动化的目标努力演进。网络运维首先要改变的是传统的思维方式,从开发运维分离到开发运维一体化。这就要求运营商运维部门具备DevOps能力,网络运维将从传统的CT运维走向多元化的ICT运维。
在云计算快速发展的时代,OTT通过云原生架构保障云服务体验的设计理念深刻影响了运营商的网络建设模式。无论是运营商强调云前自下而上的网络,还是自上而下的OTT网络,战略选择差异背后共同的驱动因素是企业的数字化转型正在加速云网络融合的需求。网络与云的融合意味着运营商和企业都需要根据自己的需求灵活定制,以满足未来的业务场景。
在传统的“人流量”人工操作维护模式下,操作人员面临以下痛点:
面对网络运维的严峻挑战,开放可编程系统以YANG模型驱动为基础,提供了端到端的开放可编程能力:设备驱动可编程、网络业务可编程、开放设备和业务北向接口,并且提供了安全可靠的保障机制。
图表 2 适合人群
运营商和企业网络一般都有多厂商设备共存的场景(如多厂商5G站自动上线、多厂商CPE配置等)。缺乏统一的管理和控制。新设备集成慢,自动化程度低,开通周期长,成为端到端业务交付的瓶颈。开放式可编程系统通过YANG接口自动识别并读取设备的YANG模型文件,生成网元驱动包并加载到系统中,一天即可完成一个新的设备适配管,适配效率提高90%。
新服务的推出依赖于OSS系统和厂商控制器的版本更新,受API接口集成不足、定制成本高的问题困扰,导致推出周期长,难以满足业务场景灵活变化的需求。开放式可编程系统支持自定义业务YANG模型和业务逻辑,自动生成北行API接口,实现与OSS系统的快速集成,完成设备和网络服务的添加、删除、修改和检查等操作。开发时间从6-9个月发布缩短到1个月按需发布,业务上线周期缩短80%。
存量网络运维存在大量业务迁移变更的诉求,基本依赖人工操作或命令行脚本,出错率高。海量脚本维护困难,网络变更风险高,正确率难以保证。开放可编程系统提供Dryrun、回滚、事务、并发等安全可靠机制保障,网络变更正确率提升到99.9%。
面对5G网络切片与智能运维的场景,基于用户自定义网络业务模型,除了实现业务发放可编程外,开放可编程系统还提供控制算路与智能分析可编程能力,最大程度支持运营商业务面向未来网络演进。
图表 3以Windows为例,客户对网络操作平台能力诉求
通过编写和加载软件包,实现新设备的快速纳管和新业务的快速构建。
图表 4 AOC开放可编程平台所需具备的架构和能力
系统提供的软件包包括:
Jinja2模板描述了业务的数据结构,并使用Jinja2语法完成了诸如插值、条件判断、循环等操作。
Python映射脚本描述了如何将用户提交的数据填充到模板,并映射到网元数据结构中。
业务YANG模型描述了业务的相关参数,按照业务输入,构建业务YANG模型。
系统通过加载业务包,可以进行业务配置下发,实现新业务的快速构建。
系统提供了事务机制,配置变化支持在一个原子事务里提交,保证开放可编程系统中的数据和转发器的数据一致性。同一个事务里的数据会并发下发到多台设备,要么全部成功,要么全部回退,没有部分数据成功。
图表6事务机制:失败自动回滚,保障配置安全
开放可编程系统保存了下发到设备数据的副本,能够采集设备数据,发现设备数据和开放可编程系统上数据的差异并在界面呈现,可以以开放可编程系统为准或者以设备为准进行数据同步。
图表 7 数据一致性:多头管理及时发现
对于配置到开放可编程系统上的数据,在下发到设备前,用户可以进行配置预览,查看将要下发到设备上的报文以及新旧配置数据的差异信息。
用户配置到开放可编程系统上的数据可以基于YANG模型以及YANG模型提供的检查语法,进行相关的配置校验检查。
图表10 高效的业务配置
图表 11 数据溯源:配置可追溯
图表 12 配置历史:历史操作完全掌控
备注:本文整理自DevRun开发者沙龙华为云直播《初探数通网络开放可编程》,点击可以回看。
参考文档
https://devzone.huawei.com/cn/enterprise/aoc/quickStart.html
https://devzone.huawei.com/cn/enterprise/aoc/apiDoc.html
https://bbs.huaweicloud.com/videos/103845