网络运营 (NetOps)

什么是网络运营

整个组织依靠IT网络来产生收入,但如果网络不依赖人工干预来执行其功能呢?这听起来像是一个有趣的主张,而这正是网络自动化所提供的。网络操作,也称为NetOps 1.0,是一个术语,涵盖了传统的网络管理方法,这些方法没有自动化的奢侈。然而,当务之急只是以最短的停机时间维护本地硬件时,这种作案手法是最可行的。

NetOps 1.0 的表现如何

NetOps 1.0 完全依赖于 CLI 脚本来执行和部署网络任务。CLI 是一个纯粹基于文本的界面。它用于更改网络的配置,以及从网络中的设备和接口中提取信息。

CLI 脚本通常存储为 CSV 文件,这些脚本用于通过在 CLI 中输入命令来对网络进行故障排除,该命令与系统的外壳交互。这是一项繁琐的任务,而且整个网络管理过程本质上也是被动的,这增加了面向硬件的网络的复杂性。当从所采用的技术转移到需要敏捷的商业模式时,就需要另一种可持续的网络管理模式,这需要改变 IT 运营团队和开发团队交互以部署应用程序的方式。DevOps 与 NetOps 1.0 的集成催生了当前模式,该模式受到分布在全球的 IT 部门的青睐。

网络运营(NetOps)2.0

网络运营(NetOps)2.0旨在消除网络崩溃的所有根本原因。

NetOps 旨在通过与 DevOps 的核心原则保持一致,为网络运营带来自动化和敏捷性。通过人工智能和机器学习的结合,现在可以对重复的网络监控过程进行分组,并且从这些自动化过程收集的数据用于使整个NetOps过程成为数据驱动。

DevOps 和 NetOps 之间有很强的相似之处,因为这两种实践都具有可观察性和自动化的特征,现代分布式混合网络比传统网络复杂得多。

NetOps 的更新版本非常需要网络监控工具的帮助,该工具可以提供对网络状态的深入可见性,并抢占可能影响网络的任何问题。

影响网络运营的因素

网络运营 (NetOps)_第1张图片

  • 性能下降: 由于性能滞后而导致的网络瓶颈和拥塞可能导致客户流失和品牌声誉严重受损。
  • 缺乏RCA:整个网络的表面可见性可能会使技术人员对导致设备故障和网络停机的微小潜在故障视而不见。
  • 没有主动警报:仅在发生网络事件(无论是性能滞后还是任何其他问题)后才向技术人员发出警报,可能会增加严重性,甚至使网络经历停机。
  • 设备故障:温度激增、服务器过载或影响父设备的高 CPU 使用率等因素也会影响依赖设备并导致网络操作中断。

可能影响网络的问题

  • 异常高的内存利用率:分布式网络由多个设备组成,除非所有设备都处于完美状态,否则网络无法以最佳方式运行。Bug 可能会耗尽设备中的可用内存并导致其重新启动,从而导致依赖设备和应用程序停止其服务。当大量数据包流通过慢速接口时,也会出现同样的情况,这会导致数据包排队并消耗宝贵的 CPU 内存。
  • 互联网流量拥堵:恶意软件可以控制网络并通过充斥垃圾邮件来削弱网络。这会耗尽服务器资源,导致过度使用和互联网流量拥塞。
  • 路线摆动:这可能是由网络中的硬件或配置错误引起的,导致路由器交替将网络目标可用性声明为打开或关闭。这会降低在网络中运行的应用程序的性能,因为数据包采用不合适的路径到达目的地,这甚至可能导致数据包丢失的情况。
  • 网络电话质量差:由于过度使用带宽而导致网络中的抖动、延迟和数据包丢失可能会损害通过网络进行的语音呼叫的质量。
  • 不正确的防火墙规则集:应定期修改防火墙规则,因为防火墙内的多个规则集可能与违反组织的流量筛选策略的规则相矛盾。
  • 无法更新配置更改:业务组织必须严格遵守 SLA,SLA 是各种技术定义的合并,以及与每个定义关联的特定量词。SLA 中的任何更改都需要立即更新;否则,将违反合规规则,使组织承担财务责任。
  • 双工不匹配:双工是两点之间通信系统的名称,其中两点都可以充当源和目标。双工系统又分为半双工和全双工。如果两个连接设备的双工模式不同,则会出现双工不匹配,从而留下低效的通信链路。

健全的网络运营

NetOps 2.0 适用于旨在实现敏捷性、可扩展性和可编程性的网络。网络的这三个核心价值以NetOps 2.0的形式结合在一起,它促进了虚拟化,自动化,无缝API集成,并同时部署和监控安全操作,从而可以识别和消除可能侵入网络并影响其运营的威胁。

NetOps 2.0 推动了传统网络监控的僵化和静态性质的背离,在此过程中,它强调主动监控和提供对动态环境的高度可见性。NetOps 的主要优点是:

  • 最大限度地利用网络资源:当有效观察网络中的所有设备和接口时,可以预测所有可能影响网络的潜在故障,并可以自动采取措施来防止它们,从而确保健康的网络正常运行时间。
  • 敏捷:与DevOps周期中更快的开发和部署类似,NetOps提高了网络中更新和修复的速度,数据分析提供了帮助。
  • 恢复:关键弹性指标是事先确定的,并应用于在发生故障时需要保护的服务(例如,网络故障排除期间发生的安全配置错误)。

网络运营监控

OpManager Plus使管理员能够通过广泛的功能深入了解网络信息,这些功能可以消除手动和冗余流程,使管理员能够:

  • 监控网络的带宽使用情况,并获取有关哪些应用程序正在耗尽带宽的报告。这可以防止在网络上运行的关键应用程序停止。
  • 跟踪数据包。这些数据包根据最短路径查找器算法生成的结果采用网络路径,该算法由开放最短路径优先协议采用。通过网络路径分析查找源和目标之间的中断通道,以防止数据丢失。
  • 通过分析网络上的数据包丢失、抖动和延迟来衡量 VoIP 的质量,确保重要业务应用程序的服务质量不会长期受到影响。
  • 定期评估防火墙规则,以确保符合策略并防止阻止合法流量。
  • 将设备和接口配置为所有监视活动的前导。必须进行配置监视,以确保所有保存的配置都符合组织策略。
  • 检测恶意设备。网络中的所有流氓设备都将列在OpManager Plus中,管理员可以根据设备的状态为其分配角色。管理员还决定是否将设备移动到受监视设备列表中。

OpManager Plus包含高级网络管理功能,可以监控网络、服务器、IP地址和交换机端口,管理带宽和网络配置,并在存档前分析防火墙日志。

你可能感兴趣的:(网络管理,网络运营,网络管理)