网管必学-故障排查分析模型

对网管来说最实用的文章
除网络故障的技术在各个不同的工程师之间也是有明显区别的. 他们有一部分是科学修养,有一部分则是艺术修养. 一个优秀的网络工程师应该同时具备线型思考的能力(对于一个事件从头到尾都遵循一个逻辑性的表达)和横向思考的能力(能够考虑对手头问题没有直接关系但有可能有影响的事件).
一般而言,并没有一个决定故障最根本原因的准确方法.但是,您可以遵循以下一些指导原则:
1. 尽可能决定您试图要解决什么问题,并且在该问题上要集中全力.网络与汽车十分类似:您开始检查一个故障的原因,同时发现还要对其它十个部件需要加以注意. 请对所有不相关问题做出一个笔记,但应该把主要精力集中在主要问题上.
2. 如果同时有几个用户从网络不同的区域报告问题,极有可能他们在报告一个相同问题的各个方面. 请一次只注意问题的一个方面. 如果一次有100个或者更多用户报告出现故障,是一件令人头疼的事,但如果仅仅是相同问题在网络的若干部分不断地重复发生,那么您就只需要仔细地思考一次.
3.在任何可能地情况下,要尝试在实验室中模拟故障并排除该故障. 通常,排除网络故障地过程与最初地网络故障相比,它对终端用户地负面影响要更大.
4.如果任何测试需要对设备进行重新设置,您要确保在测试完成后能恢复到修改以前的设置状态,否则您会发现您将处于一个很困难的境地而且无法再进行任何操作.
5.请使用尽可能少的测试去确定并定义故障的类型.
6.要确保测试的结果不是含糊不清的.
7.通过对测试结果至少重复两次来证实该测试结果. 要注意运行一个验证配置参数的命令并不是这种意义上的测试,因此也不需要执行两次.
8.用文档记录下进行的测试以及结果(以防止出现一个错误).
9.在给网络排除故障的过程中,请用文档记录下任何对网络所做的修改,从而网络能够恢复到它最初的状态.
10.请适当地记录所做地任何工作过程,从而其他支持人员能够知道网络是如何被修改以及被修改地原因.
附:其实网络的Troubleshooting主要还是的是要按OSI的七层模型,从物理层开始检查,一直向上到应用层。步步为进,才能事半功倍。

你可能感兴趣的:(网络,故障,模型,休闲,排除)