网络运维模型

最简单的的网络运维模型包括以下几个方面:

故障管理

        故障管理包括具有对故障的检测、快速定位、隔离故障点并进行修复等功能,其功能涉及本端及远端的所有网络元素。能将维护消息及时通知有关用户。
        在故障管理标准中,网络问题被发现并修正。潜在的未来问题被识别,并防止它们发生或复发。这种方式下,网络能保持运作并把停止工作时间减到最小。
         故障处理流程,故障升级流程是故障管理的重要组成部分。故障处理流程能够确保故障发生时,有工程师处理;当故障无法解决时,故障升级可以确保故障能得到足够的资源进行优先处理。
        故障管理最重要的实现方式是告警管理。告警当前常见门限告警和故障告警两种模式,门限告警是指预先定义监控项门限,监控系统按一定的时间间隔采集监项信息,如果达到门限则生成告警,通常使用常使用snmp采集监控项信息;故障告警是设备发生故障时,自动将告警发送至监控平台,通常使用snmp-trap和syslog实现。
        在维护超大规模网络时,如何在海量告警及时发现和处理告警变得尤其重要,常见的办法是告警分级,先将设备按照重要性进行分级,再优先关注重要设备的严重告警。
        常用开源网络管理软件包括Zabbix, cacti。

配置管理

        配置管理包括:变更流程管理,设备配置备份,配置权限分级。
        变更流程管理是指当网络中需要变更时,所需要经过的准备和审核,流程,验证过程。变更流程管理有利于减少人为失误,不规范配置造成的网络故障,同时有利于在故障排查时进行回溯分析。
        设备配置备份是指定期备份设备配置,有利于在设备损坏,网络故障时,恢复或对比配置。
        配置权限管理是指,不同人员具有设备不同的配置权限。常用的实现手段包括radius,tacast。

资产管理

        资产包括有形资产和无形资产,有型资产包括网络设备,光纤,辅料,无形资产包括网络拓扑图,IP地址,软件版本管理等。CMDB通常用于设备和配置的管理。是实现自动化的基础。

性能管理

        性能管理是指,及时发现性能瓶颈,在用户感知前,造成故障前将性能瓶颈消除。性能管理主要通过监控来实现。常见的监控技术手段包括snmpwalk ,snmp trap, syslog,以及最新的telemetry。
        性能管理中,常见的监控项包括链路带宽利用率,CPU,内存利用率,防火墙会话数,NAT地址池利用率,F5 pool member status,吞吐量等

安全管理

        安全包括设备本身安全和设备访问安全。保证设备本身安全是指确保设备不被破坏,例如偷窃,损坏,设备安全是指设备确保所有的设备访问和操作都经过授权。

你可能感兴趣的:(网络管理)