一次不同寻常的DHCP网络故障分析定位与排

一次不同寻常的DHCP网络故障分析定位与排错

李前 中国

周一上午9点半,我接到一个朋友的求助电话,他是三个月以前应聘进入X公司负责网络技术支持,随赶到朋友的公司现场并了解情况。经朋友介绍,得知

X公司是某集团公司A的下属子公司之一,A与X的网络均是采用Windows 2003域的管理模式,由于历史的原因, A与X并不是处于同一个域名空间内,而是分属于不同的域空间(A为hc.com,X为xtc.com),在逻辑上相对独立。为了便于统一管理,公司所属集团IT部门决定重新对X公司域名进行规划将其作为一个子域来管理,X公司的域名将重新定义:hc.com(原域名)->hc.xtc.com(新域名)。

在进行迁移域的过程中,为了保证正常的业务不受影响,X公司网管技术人员决定将新域控制器存放在新的子网10.10.10.0/24中,并配置好DNS及路由.采用双域并存的方案来实现用户电脑分批转移到新域hc.xtc.com中。在由旧域向新域过渡中,仍用旧域的DHCP(192.168.1.101/255.255.255.0)为已加入新域部分的用户或尚在旧域未完成迁移的用户电脑提供分配地址。

X公司电脑用户虽然只有900个,但整个IT网络小组成员不到5人,所以整个工程耗时近2个月时间,但一切都还进展顺利,虽然中间出了些小麻烦,但都无大碍,在迁移完成后过了一周,一个意想不到的情况发生了。一个周一的早上,IT部门电话铃声大作。从电话中得知用户网络全部中断了,IT技术人员经过一番检查后,确认是DHCP服务器出现了问题,远程登录到dhcp上一看,原来是授权过期了,旧域中dhcp因未在新域中被授权而停止服务了。

问题看似比较简单,只要在新域中重新搭建一个DHCP服务器不就可以了吗?于是IT技术人员很快在hc.xtc.com中找了一空闲的服务器配置成一台新的DHCP(ip 10.10.10.1/255.255.255.0,由于新的域服务器都处于10.10.10.0/255.255.255.0中 ),在完成授权并按原来的方式配置好作用域后,结果出乎意料,用户并未象他们期望的那样顺利地获得IP address,顿时朋友连同部门其它几个年轻的 IT工程师被这奇怪的问题弄得傻眼了。于是朋友就拨通了我的电话。。。

到了X公司现场后,我花了2分钟仔细检查了一下10.10.10.1的DHCP配置,确认无误,接下来我又仔细查阅了一下X公司的 DHCP网络拓扑图(如图 1),对问题故障进行了初步确认与分析,可能是新的DHCP与原有用户端网络不在同一网段造成的,可能是在交换机h3c s5100的DHCP部分配置没有更新。其原因是用户端的DHCP广播请求包在到达交换机时就直接被丢弃,没有到达 DHCP服务器(10.10.10.1)上,自然也就无法获得当前地址池的IP地

址了。为了验证我的想法,我们一起将DHCP与pc1同时接到另一交换机上,用ping 测试了下网络是通的。

图一一次不同寻常的DHCP网络故障分析定位与排_第1张图片

这一结果初步验证了我们的猜测,原因就在交换机H3C 5100上。为了进一步加以证实这种猜测,然后我们通过抓包软件wireshark分别在交换机两铡进行抓包分析,图2为用户接入交换机端进行抓包的结果显示(No.412为接收到的 DHCP请求包):

图 2一次不同寻常的DHCP网络故障分析定位与排_第2张图片

而我们在交换机的另一端输出到DHCP服务器的端口上进行抓包结果显示并没有 收到 DHCP协议请求,这就很好的验证了我的先前的判断。现在我们已经可以将问题的范围锁定到H3C s5100这台交换机上。接下来我们将DHCP与pc1重新连接回H3C s5100交换机上。

Telnet到交换机H3C s5100,使用 system view命令进入系统视图:用命令 display current检查下当前的交换机配置,结果是没有配置dhcp relay,这就是为何DHCP协议请求数据包没有到达DHCP服务器的真实原因,

我立马果断地皽入下列三行命令:

dhcp relay server-group 1 ip 10.10.10.1

在vlan接口模式下输入以下两个命令

dhcp select relay

dhcp relay server-select 1

现在整个网络已经恢复正常,再以命令save保存刚才的配置。从这次网络故障中我们可以有以下新的认识:

1. 网络故障排查不可以对问题孤立地进行分析,一定要将出现的问题放在整个网络环境中进行思考分析,才能透过复杂的表象找出故障的真正原因;

2. 由于故障前后网络服务器所处的网络位置发生了变化,与之前的服务器的逻辑位置不在同一个域且物理位置不在同一网段,故在进行故障诊断时一定要考虑到这些因素变化所带来的影响。

3. 不同厂家不同类型的网络交换机dhcp相关参数配置是不一样的,作为一名网络技术人员平时需要尽量熟悉市面上常见交换机(如cisco h3c等交换机)常用的命令,,并能通过借助wireshark等软件工具来快速定位排除故障,这样今后在各种复杂网络环境中我们处理网络问题时游刃有余。

你可能感兴趣的:(技术,故障,网络,管理,李前)