最近同事报障,说是在内网进行nslookup测试时发现:当使用内网DNS服务器192.168.1.1进行解析时,DNS服务器响应非常快,而且没有 任何错误;但当使用DMZ区的服务器51.144.198.99进行测试时,发现总是提示请求超时,然后再返回正确解析。由此怀疑我们正在使用的防火墙在 处理DNS请求时存在问题。 

国内的防火墙产品也确实一点也不争气,在使用过程中总是会出现一些莫名其妙的问题,如在低版本操作系统中支持的功能在高版本中可能就支持不好,有时为了解 决低版本操作系统中的一个Bug而进行防火墙操作系统升级,结果可能会是解决了一个,又新出来一堆!这不,才升级了防火墙,同事就找上门来了,没有办法, 谁让咱用的防火墙厂家不争气呢,人家怀疑咱这里出问题也是正常啊! 

首先查看故障现象,按同事所说进行测试: 

C:/>nslookup 

Default Server: dns.dg 

Address: 192.168.1.1 



> www.netadmin.com.cn 

Server: dns.dg 

Address: 192.168.1.1 



Non-authoritative answer: 

Name: www.365master.com 

Address: 219.141.209.244 

Aliases: www.netadmin.com.cn 



> server 51.144.198.99 

Default Server: [51.144.198.99] 

Address: 51.144.198.99 



> www.netadmin.com.cn 

Server: [51.144.198.99] 

Address: 51.144.198.99 



DNS request timed out. (请求超时) 

timeout was 2 seconds. 

Non-authoritative answer: 

Name: www.365master.com 

Address: 219.141.209.244 

Aliases: www.netadmin.com.cn 



C:/>ping 192.168.1.1 (内网DNS服务器) 



Pinging 192.168.1.1 with 32 bytes of data: 



Reply from 192.168.1.1: bytes=32 time<1ms TTL=127 

Reply from 192.168.1.1: bytes=32 time<1ms TTL=127 

Reply from 192.168.1.1: bytes=32 time<1ms TTL=127 

Reply from 192.168.1.1: bytes=32 time<1ms TTL=127 



Ping statistics for 192.168.1.1: 

Packets: Sent = 4, Received = 4, Lost = 0 (0% loss), 

Approximate round trip times in milli-seconds: 

Minimum = 0ms, Maximum = 0ms, Average = 0ms 



C:/>ping 51.144.198.99  (DMZ区DNS服务器) 



Pinging 51.144.198.99 with 32 bytes of data: 



Reply from 51.144.198.99: bytes=32 time<1ms TTL=126 

Reply from 51.144.198.99: bytes=32 time<1ms TTL=126 

Reply from 51.144.198.99: bytes=32 time<1ms TTL=126 

Reply from 51.144.198.99: bytes=32 time<1ms TTL=126 



Ping statistics for 51.144.198.99: 

Packets: Sent = 4, Received = 4, Lost = 0 (0% loss), 

Approximate round trip times in milli-seconds: 

Minimum = 0ms, Maximum = 0ms, Average = 0ms 



经过ping命令的测试,测试主机到内网DNS服务器、DMZ区DNS服务器响应都很快,所以线路应该没有问题。如果是防火墙策略问题,则nslookup查询时应该完全无响应,而不是在后面又进行了正确解析。 

那么可能是下面的几种原因: 

可能1:DMZ区服务器有问题;经过在DMZ区其它服务器进行nslookup测试,发现DMZ区的DNS服务器响应正常,由此排除了这种可能。 

可能2:防火墙有问题,有可能是高吞吐量时响应有问题。在晚上流量比较小时进行了nslookup测试,发现故障现象仍然存在。看来并不是网络吞吐量引起的防火墙问题。 

难道防火墙存在处理DNS请求时存在问题?不敢这么想!一年前我们发现防火墙存在着FTP问题,结果到现在还没有解决!防火墙厂家的开发人员太有才了!好希望不是防火墙的问题! 

由于在内网进行测试时所使用的主机均为同网段主机,所以尝试更换一台不同网段的主机进行测试,结果竟然―――没有问题! 

OK,只要有机器没有问题,那这个DNS的问题就应该不是防火墙引起的!只要不是防火墙的问题,那就好解决!呵呵,真是怕了防火墙厂家了! 

解决技术问题,如果从表面看不出是什么问题引起的,那么经常用的功能就是Debug,只有从更深层次去查看,才更容易发现问题。那么nslookup工具有没有Debug功能呢?经过简单查看帮助,发现其有两个Debug参数: 

[no]debug - print debugging information(显示一般调试信息) 

[no]d2 - print exhaustive debugging information(显示详细调试信息) 

OK,准备使用d2参数查看两台机器执行Debug时分别做了些什么动作! 



PC-A(Windows XP): 

C:/ >nslookup 

Default Server: dns.dg 

Address: 192.168.1.1 



> server 51.144.198.99 

Default Server: [51.144.198.99] 

Address: 51.144.198.99 



> set d2 

> www.netadmin.com.cn 

Server: [51.144.198.99] 

Address: 51.144.198.99 



------------ 

SendRequest(), len 45 

HEADER: 

opcode = QUERY, id = 18, rcode = NOERROR 

header flags: query, want recursion 

questions = 1, answers = 0, authority records = 0, additional = 0 



QUESTIONS: 

www.netadmin.com.cn.dgic.cn, type = A, class = IN 



------------ 

DNS request timed out. 

timeout was 2 seconds. 

timeout (2 secs) 

SendRequest failed 

------------ 

SendRequest(), len 37 

HEADER: 

opcode = QUERY, id = 19, rcode = NOERROR 

header flags: query, want recursion 

questions = 1, answers = 0, authority records = 0, additional = 0 



QUESTIONS: 

www.netadmin.com.cn, type = A, class = IN 



------------------------ 



Got answer (84 bytes): 

HEADER: 

opcode = QUERY, id = 19, rcode = NOERROR 

header flags: response, want recursion, recursion avail. 

questions = 1, answers = 2, authority records = 0, additional = 0 



QUESTIONS: 

www.netadmin.com.cn, type = A, class = IN 

ANSWERS: 

-> www.netadmin.com.cn 

type = CNAME, class = IN, dlen = 19 

canonical name = www.365master.com 

ttl = 698 (11 mins 38 secs) 

-> www.365master.com 

type = A, class = IN, dlen = 4 

internet address = 219.141.209.244 

ttl = 700 (11 mins 40 secs) 



------------ 

Non-authoritative answer: 

Name: www.365master.com 

Address: 219.141.209.244 

Aliases: www.netadmin.com.cn 



PC-B(Windows 2000 Server): 

C:/ >nslookup 

Default Server: dns.dg 

Address: 192.168.1.1 



> server 51.144.198.99 

Default Server: [51.144.198.99] 

Address: 51.144.198.99 



> set d2 

> www.netadmin.com.cn 

Server: [51.144.198.99] 

Address: 51.144.198.99 



------------ 

SendRequest(), len 37 

HEADER: 

opcode = QUERY, id = 5, rcode = NOERROR 

header flags: query, want recursion 

questions = 1, answers = 0, authority records = 0, additional = 0 



QUESTIONS: 

www.netadmin.com.cn, type = A, class = IN 



------------------------ 

Got answer (132 bytes): 

HEADER: 

opcode = QUERY, id = 5, rcode = NOERROR 

header flags: response, want recursion, recursion avail. 

questions = 1, answers = 2, authority records = 2, additional = 0 



QUESTIONS: 

www.netadmin.com.cn, type = A, class = IN 

ANSWERS: 

-> www.netadmin.com.cn 

type = CNAME, class = IN, dlen = 19 

canonical name = www.365master.com 

ttl = 2521 (42 mins 1 sec) 

-> www.365master.com 

type = A, class = IN, dlen = 4 

internet address = 219.141.209.244 

ttl = 2917 (48 mins 37 secs) 

AUTHORITY RECORDS: 

-> 365master.com 

type = NS, class = IN, dlen = 16 

nameserver = dns11.hichina.com 

ttl = 2917 (48 mins 37 secs) 

-> 365master.com 

type = NS, class = IN, dlen = 8 

nameserver = dns12.hichina.com 

ttl = 2917 (48 mins 37 secs) 



------------ 

Non-authoritative answer: 

Name: www.365master.com 

Address: 219.141.209.244 

Aliases: www.netadmin.com.cn 

经过对照两台PC机的输出,不难发现,问题就出在PC-A在进行nslookup查询时,多出了一次查询,而且多出的这次查询的对象就是www.netadmin.com.cn.dgic.cn,其最后的后缀(dgic.cn)就是测试机PC-A所在的域名。 

在PC使用Nslookup工具进行域名查询测试时,如果该PC是活动目录中的一台主机,默认情况下该主机除了向DNS服务器递交真正需要查询的域名外,它还向DNS服务器递交“查询的域名+活动目录域后缀”(可能为多个)”这样的请求。 

PC-A是活动目录dgic.cn中的一员,在其向内网DNS服务器进行查询请求时,它会提交两个请求,分别 为:www.netadmin.com.cn.dgic.cn和www.netadmin.com.cn。对于前者,内网DNS服务器 192.168.1.1中含有域dgic.cn,但没有www.netadmin.com.cn.dgic.cn主机记录(A记录),nslookup没 有任何输出;对于后者,其进行一般A记录的查询,并进行正确输出显示。当PC-A使用DMZ区DNS服务器进行nslookup查询时,同样道理,它也会 向其发送两个查询请求,对于www.netadmin.com.cn.dgic.cn,由于DMZ区DNS服务器没有域dgic.cn的记录,于是其向上 层服务器查询,在得不到响应的情况下最终返回查询超时;对于www.netadmin.com.cn这一域名,其可以进行查询得到结果,并最终正常输出。 

PC-B只是工作组中一台主机,所以没有域后缀,这样,当其进行nslookup测试时,无论其使用内网DNS服务器还是DMZ区DNS服务器,其只提交一项域名请求,那就是www.netadmin.com.cn,所以查询结果没有超时现象。 

最终,得出了结论:这并不是一个网络故障,而是nslookup工具的原因。 

那么有没有办法禁止nslookup这种行为呢,办法还是有的。其一是使用nslookup中的search参数;其二就是使用srchlist参数。 

Search参数:启用域名搜索列表。这也是默认设置,也就是在使用nslookup进行域名测试时,nslookup会把主机的域名缀附加到所要请求的域名后面。如果想禁用它,则只需在nslookup环境中,使用set nosearch命令即可禁用。 

Srchlist参数:使用域名搜索列表时所要附加的域名列表。默认情况下其值即主机所在的活动目录。如果想更改,可以在nslookup环境中 使用命令“set srchlist=域名1/域名2/域名3”,如果想禁止nslookup工具附加域名,则只需“set srchlist=”即可。 

下面用nslookup工具的另外一种用法来演示这两个参数的使用,并进而证实我们的结论: 

例一:使用默认设置 

C:/>nslookup www.netadmin.com.cn 51.144.198.99 

*** Can't find server name for address 51.144.198.99: Non-existent domain 

Server: UnKnown 

Address: 51.144.198.99 



DNS request timed out. 

timeout was 2 seconds. 

Non-authoritative answer: 

Name: www.365master.com 

Address: 219.141.209.244 

Aliases: www.netadmin.com.cn 



例二:使用“nosearch”参数 

C:/>nslookup -nosearch www.netadmin.com.cn 51.144.198.99 

*** Can't find server name for address 51.144.198.99: Non-existent domain 

Server: UnKnown 

Address: 51.144.198.99 



Non-authoritative answer: 

Name: www.365master.com 

Address: 219.141.209.244 

Aliases: www.netadmin.com.cn 



例三:使用“srchlist=”参数 

C:/>nslookup -srchlist= www.netadmin.com.cn 51.144.198.99 

*** Can't find server name for address 51.144.198.99: Non-existent domain 

Server: UnKnown 

Address: 51.144.198.99 



Non-authoritative answer: 

Name: www.365master.com 

Address: 219.141.209.244 

Aliases: www.netadmin.com.cn