第14章 DNS:域名系统
14.1 引言
域名系统( DNS)是一种用于 TCP/IP应用程序的分布式数据库,它提供主机名字和 IP地 址之间的转换及有关电子邮件的选路信息。这里提到的分布式是指在 Internet 上的单个站点不 能拥有所有的信息。每个站点(如大学中的系、校园、公司或公司中的部门)保留它自己的信息数据库,并运行一个服务器程序供 Internet上的其他系统(客户程序)查询。 DNS提供了 允许服务器和客户程序相互通信的协议。
从应用的角度上看,对DNS的访问是通过一个地址解析器(resolver)来完成的。在Unix 主机中,该解析器主要是通过两个库函数 gethostbyname(3)和gethostbyaddr(3)来访问 的,它们在编译应用程序时与应用程序连接在一起。前者接收主机名字返回 IP地址,而后者 接收IP地址来寻找主机名字。解析器通过一个或多个名字服务器来完成这种相互转换。
图4-2中指出了解析器通常是应用程序的一部分。解析器并不像 TCP/IP协议那样是操作系 统的内核。该图指出的另一个基本概念就是:在一个应用程序请求 TCP打开一个连接或使用 UDP发送一个数据报之前。心须将一个主机名转换为一个 IP地址。操作系统内核中的 TCP/IP 协议族对于 DNS一点都不知道。
本章我们将了解地址解析器如何使用TCP/IP协议(主要是UDP)与名字服务器通信。我 们不介绍运行名字服务器或有关可选参数的细节,这些技术细节的内容可以覆盖整整一本书。
(见[Albitz and Liu 1992]标准Unix解析器和名字服务器介绍)。
RFC1034 [Mockapetris 1987a] 说明了 DNS的概念和功能,RFC1035 [Mockapetris 1987b] 详细说明了DNS的规范和实现。DNS最常用的版本(包括解析器和名字服务器)是 BIND— 伯克利Internet域名服务器。该服务器称作named。[Danzig、Obraczka和Kumar1992] 分析了DNS在广域网中产生的通信量。
14.2 DNS 基础
DNS的名字空间和Unix的文件系统相似,也具有层次结构。图14-1显示了这种层次的组 织形式。
每个结点(图14-1中的圆圈)有一个至多63个字符长的标识。这颗树的树根是没有任何标识的特殊结点。命名标识中一律不区分大写和小写。命名树上任何一个结点的域名就是将 从该结点到最高层的域名串连起来,中间使用一个点“.”分隔这些域名(注意这和 Unix文件 系统路径的形成不同,文件路径是由树根依次向下的形成的)。域名树中的每个结点必须有一个唯一的域名,但域名树中的不同结点可使用相同的标识。
以点“ . ”结尾的域名称为绝对域名或完全合格的域名 F Q D N (FullQualified Domain Name),例如sun.tuc.noao.edu.。如果一个域名不以点结尾,则认为该域名是不完全的。 如何使域名完整依赖于使用的DNS软件。如果不完整的域名由两个或两个以上的标号组成,
则认为它是完整的;或者在该域名的右边加入一个局部后缀。例如域名 sun通过加上局部后 缀.tuc.noao.edu.成为完整的。
未命名树根
顶级域
第二级域
阿拉伯联合
酋长国
津巴布韦
普通域
国家域
图14-1 DNS的层次组织
顶级域名被分为三个部分:
1)arpa是一个用作地址到名字转换的特殊域(我们将在14.5节介绍)。
2) 7 个3字符长的普通域。有些书也将这些域称为组织域。
3) 所有2字符长的域均是基于 ISO3166中定义的国家代码,这些域被称为国家域,或地理
|
图14-2列出了7个普通域的正式划分。
在DN S 中,通常认为 3 字符长的普通域仅 用于美国的组织机构,2字符长的国家域则用 于每个国家,但情况并不总是这样。许多非美国的组织机构仍然使用普通域,而一些美国的 组织机构也使用 .us的国家域( RFC 1480 [Cooper and Postel 1993] 详细描述了.us域) 普通域中只有 .gov和.mil域局限于美国。
商业组织 教育机构 其他美国政府部门 国际组织 美国军事网点
网络 其他组织
图14-2 3字符长的普通域
许多国家将它们的二级域组织成类似于普通域的结构:例如, .ac.uk是英国研究机构的 二级域名, .co.uk则是英国商业机构的二级域名。
DNS的一个没在如图14-1中表示出来的重要特征是 DNS中域名的授权。没有哪个机构来 管理域名树中的每个标识,相反,只有一个机构,即网络信息中心 NIC负责分配顶级域和委派 其他指定地区域的授权机构。
一个独立管理的 D N S 子树称为一个区域 ( z o n e ) 。一个常见的区域是一个二级域,如 noao.edu。许多二级域将它们的区域划分成更小的区域。例如,大学可能根据不同的系来划分区域,公司可能根据不同的部门来划分区域。
如果你熟悉 Unix的文件系统,会注意到DNS树中区域的划分同一个逻辑Unix文件 系统到物理磁盘分区的划分很相似。正如无法确定图14-1中区域的具体位置,我们也 不知道一个Unix文件系统中的目录位于哪个磁盘分区。
一旦一个区域的授权机构被委派后,由它负责向该区域提供多个名字服务器。当一个新系统加入到一个区域中时,该区域的 DNS管理者为该新系统申请一个域名和一个 IP地址,并 将它们加到名字服务器的数据库中。这就是授权机构存在的必要性。例如,在一个小规模的大学,一个人就能完成每次新系统的加入。但对一个规模较大的大学来说,这一工作必须被 专门委派的机构(可能是系)来完成,因为一个人已无法维持这一工作。
一个名字服务器负责一个或多个区域。一个区域的管理者必须为该区域提供一个主名字服务器和至少一个辅助名字服务器。主、辅名字服务器必须是独立和冗余的,以便当某个名 字服务器发生故障时不会影响该区域的名字服务。
主、辅名字服务器的主要区别在于主名字服务器从磁盘文件中调入该区域的所有信息, 而辅名字服务器则从主服务器调入所有信息。我们将辅名字服务器从主服务器调入信息称为区域传送。
当一个新主机加入一个区域时,区域管理者将适当的信息(最少包括名字和 IP地址)加 入到运行在主名字服务器上的一个磁盘文件中,然后通知主名字服务器重新调入它的配置文件。辅名字服务器定时(通常是每隔 3小时)向主名字服务器询问是否有新数据。如果有新数据,则通过区域传送方式获得新数据。
当一个名字服务器没有请求的信息时,它将如何处理?它必须与其他的名字服务器联系。
(这正是 DNS的分布特性)。然而,并不是每个名字服务器都知道如何同其他名字服务器联系。相反,每个名字服务器必须知道如何同根的名字服务器联系。 1993年4月时有8个根名字服务 器,所有的主名字服务器都必须知道根服务器的 IP地址(这些IP地址在主名字服务器的配置 文件中,主服务器必须知道根服务器的IP地址,而不是它们的域名)。根服务器则知道所有二 级域中的每个授权名字服务器的名字和位置(即IP地址)。这意味着这样一个反复的过程:正 在处理请求的名字服务器与根服务器联系,根服务器告诉它与另一个名字服务器联系。在本 章的后面我们将通过一些例子来详细了解这一过程。
你可以通过匿名的FTP获取当前的根服务器清单。具体是从ftp.rs.internic.net
或nic.ddn.mil 获取文件netinfo/root-servers.txt。
DNS的一个基本特性是使用超高速缓存。即当一个名字服务器收到有关映射的信息(主 机名字到IP地址)时,它会将该信息存放在高速缓存中。这样若以后遇到相同的映射请求,就能直接使用缓存中的结果而无需通过其他服务器查询。 14.7节显示了一个使用高速缓存的 例子。
14.3 DNS的报文格式
DNS定义了一个用于查询和响应的报文格式。图14-3显示这个报文的总体格式。
标识 标志
问题数
资源记录数
12字节
授权资源记录数
额外资源记录数
查询问题
回答
(资源记录数可变)
授权
(资源记录数可变)
额外信息
(资源记录数可变)
图14-3 DNS查询和响应的一般格式
这个报文由 12字节长的首部和4个长度可变的字段组成。 标识字段由客户程序设置并由服务器返回结果。客户程序通过它来确定响应与查询是否
匹配。
16 bit的标志字段被划分为若干子字段,如图 14-4所示。
图14-4 DNS报文首部中的标志字段
我们从最左位开始依次介绍各子字段:
• QR 是1 bit 字段: 0表示查询报文, 1表示响应报文。
•opcode是一个4bit字段:通常值为0(标准查询),其他值为 1(反向查询)和2(服务器 状态请求)。
•AA是1bit 标志,表示“授权回答 (authoritative answer)”。该名字服务器是授权于该域 的。
•TC是1 bit 字段,表示“可截断的 (truncated)”。使用UDP时,它表示当应答的总长度超 过512字节时,只返回前512个字节。
•RD是1bit 字段表示“期望递归( recursion desired )”。该比特能在一个查询中设置,并在响应中返回。这个标志告诉名字服务器必须处理这个查询,也称为一个递归查询。如果该位为0,且被请求的名字服务器没有一个授权回答,它就返回一个能解答该查询的其他名字服务器列表,这称为迭代查询。在后面的例子中,我们将看到这两种类型查询的例子。
•RA是1 bit 字段,表示“可用递归”。如果名字服务器支持递归查询,则在响应中将该比特设置为1。在后面的例子中可看到大多数名字服务器都提供递归查询,除了某些根服务器。
• 随后的3 bit 字段必须为 0。
• rcode是一个 4 bit 的返回码字段。通常的值为 0(没有差错)和 3(名字差错)。名字差错 只有从一个授权名字服务器上返回,它表示在查询中制定的域名不存在。
随后的 4 个 16 bit 字段说明最后 4 个变长字段中包含的条目数。对于查询报文,问题 (question)数通常是 1,而其他3项则均为0。类似地,对于应答报文,回答数至少是1,剩下的 两项可以是 0或非0。
14.3.1 DNS查询报文中的问题部分
问题部分中每个问题的格式如图14-5所示,通常只有一个问题。
0 15 16 31
查询名
查询类型
查询类
图14-5 DNS查询报文中问题部分的格式
查询名是要查找的名字,它是一个或多个标识符的序列。每个标识符以首字节的计数值 来说明随后标识符的字节长度,每个名字以最后字节为0结束,长度为0的标识符是根标识符。 计数字节的值必须是0~63的数,因为标识符的最大长度仅为63(在本节的后面我们将看到计 数字节的最高两比特为1,即值192~255,将用于压缩格式)。不像我们已经看到的许多其他报文格式,该字段无需以整32 bit边界结束,即无需填充字节。
图14-6显示了如何存储域名 gemini.tuc.noao.edu。
计数 计数 计数 计数 计数
图14-6 域名gemini.tuc.noao.edu 的表示
每个问题有一个查询类型,而每个响应(也称一个资源记录,我们下面将谈到)也有一 个类型。大约有20个不同的类型值,其中的一些目前已经过时。图14-7显示了其中的一些值。 查询类型是类型的一个超集(superset):图中显示的类型值中只有两个能用于查询类型。
名 字 数 值 描 述 类型? 查询 类型
IP地址 名字服务器 规范名称 指针记录 主机信息 邮件交换记录
对区域转换的请求或 对所有记录的请求
图14-7 DNS问题和响应的类型值和查询类型值
最常用的查询类型是A类型,表示期望获得查询名的IP地址。一个PTR查询则请求获得一 个IP地址对应的域名。这是一个指针查询,我们将在14.5节介绍。其他的查询类型将在14.6节 介绍。
查询类通常是 1,指互联网地址(某些站点也支持其他非 IP地址)。
14.3.2 DNS响应报文中的资源记录部分
DNS报文中最后的三个字段,回答字段、授权字段和附加信息字段,均采用一种称为资源记录RR(ResourceRecord)的相同格式。图14-8显示了资源记录的格式。
域名
类型 类
生存时间
资源数据长度
资源数据
图14-8 DNS资源记录格式
域名是记录中资源数据对应的名字。它的格式和前面介绍的查询名字段格式(图 14 - 6 ) 相同。
类型说明 R R 的类型码。它的值和前面介绍的查询类型值是一样的。类通常为 1 ,指
Internet数据。生存时间字段是客户程序保留该资源记录的秒数。资源记录通常的生存时间值为 2天。 资源数据长度说明资源数据的数量。该数据的格式依赖于类型字段的值。对于类型 1(A
记录)资源数据是 4字节的 IP地址。
现在已经介绍了 DNS查询和响应的基本格式,我们将使用 tcpdump程序来观察具体的交 换过程。
14.4 一个简单的例子
让我们从一个简单的例子来了解一个名字解析器与一个名字服务器之间的通信过程。在
sun主机上运行 Telnet客户程序远程登录到 gemini主机上,并连接 daytime服务器:
前3行的输出是从Telnet客户
这是从daytime服务器的输出 这是从Telnet客户的输出
在这个例子中,我们引导sun主机(运行Telnet 客户程序)上的名字解析器来使用位于
noao.edu(140.252.1.54)的名字服务器。图 14-9显示了这三个系统的排列情况。
和以前提到的一样,名字解析器是客户程序的一部分,并且在 Telnet 客户程序与daytime服务 器建立 T C P连接之前,名字解析器就能通过名字 服务器获取 IP地址。
在这个图中,省略了 sun主机与 140.252.1以太网的连接实际上是一个 SLIP连接的细节(参见 封2的插图),因为它不影响我们的讨论。通过在SLIP链路上运行tcpdump程序来了解名字解析器
名字服 务器
Telnet
客户
daytime
服务器
与名字服务器之间的分组交换。
图14-9 用于简单DNS例子的系统
sun主机上的文件 /etc/resolv.conf将告诉名字解析器作什么:
sun % cat /etc/resolv.confnameserver 140.252.1.54 domain tuc.noao.edu
第1行给出名字服务器—主机noao.edu的IP地址。最多可说明3个名字服务器行来提供 足够的后备以防名字服务器故障或不可达。域名行说明默认域名。如果要查找的域名不是一个完全合格的域名(没有以句点结束),那末默认的域名 .tuc.noao.edu将加到待查名后。
图14-10显示了名字解析器与名字服务器之间的分组交换。
图14-10 向名字服务器查询主机名gemini.tuc.noao.edu 的输出
让tcpdump程序不再显示每个 IP 数据报的源地址和目的地址。相反,它显示客户
(resolver)的 IP地址 140.252.1.29和名字服务器的 IP 地址 140.252.1.54。客户的临时端口号为
1447,而名字服务器则使用熟知端口 53。如果让 tcpdump程序显示名字而不是 IP地址,它可 能会和同一个名字服务器联系(作指示查询),以致产生混乱的输出结果。
第1行中冒号后的字段(1+)表示标识字段为1,加号“+”表示RD标志(期望递归)为 1。 默认情况下,名字解析器要求递归查询方式。
下一个字段为 A?,表示查询类型为 A (我们需要一个 IP地址),该问号指明它是一个查询
(不是一个响应)。待查名字显示在后面: gemini.tuc.noao.edu.。名字解析器在待查名 字后加上句点号指明它是一个绝对字段名。
在UDP数据报中的用户数据长度显示为 37字节: 12字节为固定长度的报文首部(图 14-
3);21字节为查询名字(图14-6),以及用于查询类型和查询类的4个字节。在DNS报文中无 需填充数据。
tcpdump程序的第 2行显示的是从名字服务器发回的响应。 1*是标识字段,星号表示设置 AA标志(授权回答)(该服务器是noao.edu域的主域名服务器,其回答在该域内是可相信的。) 输出结果 2/0/0表示在响应报文中最后 3个变长字段的资源记录数:回答 RR数为 2,授权
RR 和附加信息RR 数均为0。tcpdump仅显示第一个回答,回答类型为 A (IP 地址),值为
140.252.1.11。
为什么我们的查询会得到两个回答?这是因为gemini是多接口主机,因此得到两个 IP地址。事实上,另一个有用的 DNS工具是一个称为host的公开程序,它能将查询传递给名字服务器,并显示返回的结果。如果使用这个程序,就能看到这个多地址主机的两个IP地址:
sun % host gemini
gemini.tuc.noao.edu |
A |
140.252.1.11 |
gemini.tuc.noao.edu |
A |
140.252.3.54 |
图14-10中的第一个回答与host命令的第一行输出均是在同一子网(140.252.1)的IP地
址。这不是偶然的。如果名字服务器和发出请求的主机位于相同的网络(或子网 ),那么
BIND会排列显示的结果以便在相同网络的地址优先显示。
我们还可以使用其他的地址来访问 gemini主机,但它可能不太有效。在这个例子中,使用traceroute显示出从子网140.252.1到140.252.3的正常路由不经过gemini主机,而是经过连接这两个网络的另一个路由器。因此在这种情况下,如果通过其他的IP地址
(140.252.3.54)来访问gemini主机,所有分组均需经过额外的一跳。我们将在25.9节重 新回到这个例子来探讨替换路由,那时可使用SNMP来查看一个路由器的路由表。
还有其他一些程序能很容易地对DNS进行交互访问。nslookup是大多数DNS实现中包含的程序。[Albitz and Liu 1992]的第10章详细介绍了该程序的使用方法。dig (“域名Internet搜索(Domain Internet Groper)”)程序是另一个查询 DNS服务器的公开工具。 doc(“域名模糊控制(DomainObscenity Control)”)是一个使用dig的外壳脚本程序,它 能向合适的名字服务器发送查询来诊断含义不清的域名,并对返回的查询结果进行简 单的分析。附录F有如何获得这些程序的详细介绍。
在这个例子中要说明的最后一个问题是在查询结果中的 UDP数据长度:69字节。为说明 这些字节需要知道以下两点:
1) 在返回的结果中包含查询问题。
2) 在返回的结果中会有许多重复的域名,因此使用压缩方式。在这个例子中,域名
gemini.tuc.noao.edu出现了三次。 压缩方法很简单,当一个域名中的标识符是压缩的,它的单计数字节(范围由 0~63)中
的最高两位将被设置为11。这表示它是一个16 bit 指针而不再是8bit 的计数字节。指针中的剩 下14 bit 说明在该 DNS报文中标识符所在的位置(起始位置由标识字段的第一字节起算)。我 们明确说明只要一个标识符是压缩的,就可以使用这种指针,而不一定非要一个完整的域名压缩时才能使用。因为一个指针可能指向一个完整的域名,也可能只指向域名的结尾部分
(这是因为给定域名的结尾标识符是相同的)。
图14-11显示了对应于图14-10的第2行的DNS应答的格式。我们也显示了 IP首部和UDP首 部来重申 DNS报文被封装在 UDP 数据报中。还明确显示了在问题部分的域名中各标识符的计数字节。返回的两个回答除了返回的 IP地址不同外,其余都是一样的。在这个例子中,每个回答中的指针值为12,表示从 DNS首部开始的偏移量。
在这个例子中最后要注意的是使用 telnet命令后输出的第 2行,这里重复一下:
sun % telnet gemini daytime 我们只键入 gemini
Trying 140.252.1.11 ...
Connected to gemini.tuc.noao.edu. 但Telnet客户输出 FQDN
IP数据报
UDP数据报
DNS报文
IP首部
UDP
首部
DNS
首部
问题
(图14-5)
回答#1(RR) (图14-8)
回答#2(RR) (图14-8)
20字节
8字节
12字节 25字节
字节 字节
域名 类型 类 指针 类型 类 长度 地址
21字节
图14-11 对应于图14-10中第2行DNS应答的格式
我们仅仅输入了主机名 (gemini)而不是FQDN,但Telnet客户程序部输出了FQDN。这是 由于 Telnet程序通过调用名字解析器(gethostbyname)对输入的名字进行查询,返回的结 果包括 IP地址和 FQDN。Telnet程序就输出它试图与之建立TCP连接的IP地址,当连接建立后, 它就输出 FQDN。
如果在输入Telnet命令后间隔很长时间才显示IP地址,这个时延是由名字解析器和名字服务器在由域名到IP地址的解析所引起的。而显示Trying 到显示Connected t的o时延则是由客户与服务器建立 TCP连接所引起的,与DNS无关。
14.5 指针查询
DNS中一直难于理解的部分就是指针查询方式,即给定一个 IP地址,返回与该地址对应 的域名。
首先回到图14-1,查看一下顶级域arpa,及它下面的in-addr域。当一个组织加入Internet,并获得DNS域名空间的授权,如noao.edu,则它们也获得了对应IP地址的in-addr.arpa域名 空间的授权。在noao.edu这个例子中,它是网络号为 140.252的B类网络。在DNS树中结点in- addr.arpa的下一级必须是该 IP地址的第一字节(例中为 140),再下一级为该 IP地址的下一个 字节(252),依此类推。但应牢记的是DNS名字是由 DNS树的底部逐步向上书写的。这意味着对于IP地址为140.252.13.33的sun主机,它的DNS名字为33.13.252.140.in-addr.arpa。
必须写出 4字节的IP地址,因为授权的代表是基于网络号:A类地址是第一字节,B类地址 是第一、二字节, C类地址则是第一、二、三字节。IP地址的第一字节一定位于in-addr的下一级,但FQDN却是自树底往上书写的。如果FQDN由顶往下书写,则这个 IP地址的DNS名字将 是arpa.in-addr.140.252.13.33,而它所对应的域名将是edu.noao.tuc.sun。
如果DNS树中没有独立的分支来处理这种地址—名字的转换,将无法进行这种反向转换, 除非从树根开始依次尝试每个顶级域。毫不夸张地说,这将需要数天或数周的时间。虽然反写IP地址和特殊的域名会造成某些混乱,但in-addr解决方案仍是一种最有效的方式。
只有在使用host程序或tcpdump程序直接同DNS打交道时,才会担心in-addr域和反写IP 地址影响我们。从应用的角度上看,正常的名字解析器函数(gethostbyaddr)将接收一个IP 地址并返回对应主机的有关信息。反转这些字节和添加in-addr.arpa域均由该函数自动完成。
14.5.1 举例
使用host程序完成一个指针查询,并使用tcpdump程序来观察这些分组。例子中的设置 和图14-9相同,在sun主机上运行 host程序,名字服务器在主机noao.edu上。我们指明 svr4主机的IP地址:
sun % host 140.252.13.34
Name: svr4.tuc.noao.edu
Address: 140.252.13.34
既然 IP地址是仅有的命令行参数, host程序将自动产生指针查询。图 14-12显示了 tcpdump
的输出。
图14-12 一个指针查询的tcpdump 输出
第1行显示标识符为1,期望递归标志设置为1(加号“+”),查询类型为PTR(应注意:问号 “?”表示它是一个查询而不是响应)。44字节的数据包括12字节的DNS报文首部、28字节的 域名标识符和 4字节的查询类型和查询类。
查询结果包含一个回答RR,且为授权回答比特置1(带星号)。RR的类型是 PTR,资源数 据中包含该域名。
从名字解析器传递给名字服务器的指针查询不再是 32 bit 的 I P 地址,而是域名
34.13.252.140.in-addr.arpa。
14.5.2 主机名检查
当一个IP数据报到达一个作为服务器的主机时,无论是UDP数据报还是 TCP连接请求,服 务器进程所能获得的是客户的 IP地址和端口号(UDP或TCP)。某些服务器需要客户的IP地址 来获得在 DNS中的指针记录。在27.3节会看到这样的例子,从未知的IP地址使用匿名FTP访问 服务器。
其他的一些服务器如Rlogin服务器(第 26章)不但需要客户的IP地址来获得指针记录,还 要向DNS询问该IP地址所对应的域名,并检查返回的地址中是否有地址与收到的数据报中的源IP地址匹配。该检查是因为 .rhosts文件(见 26.2节)中的条目仅包含主机名,而没有 IP地址,因此主机需要证实该主机名是否对应源IP地址。
某些厂商将该项检查自动并入其名字解析器的例程中,特别是函数 gethostbyaddr。这使得任何使用名字解析器的程序均可获得这种检查,而无需在应用中人为地进行这项检查。
来看一个使用 SunOS4.13名字解析器库的例子。我们编制了一个简单的程序通过调用函数gethostbyaddr来完成一个指针查询。我们已在文件 /etc/resolv.conf中将名字服务器设置为noao.edu,sun主机通过SLIP链路与它相连。图14-13显示了当调用函数gethostbyaddr获取与IP地址140.252.1.29(sun主机)对应的名字时,tcpdump在SLIP链路上收到的内容。
第1行是预期的指针查询,第2行是预期的响应。但第3行显示了该名字解析器函数自动对 第2行返回的名字发出一个IP地址查询。既然sun主机有两个 IP地址,第 4行的响应就包括两个
回答记录。如果这两个地址中没有与gethostbyaddr输入参数匹配的地址,函数会向系统的日志发送一条报文,并向应用程序返回差错。
图14-13 调用名字解析器函数执行指针查询
14.6 资源记录
至今我们已经见到了一些不同类型的资源记录(RR):IP地址查询为A类型,指针查询为类型 PTR。也已看到了由名字服务器返回的资源记录:回答RR、授权RR和附加信息RR。现有大约20种 不同类型的资源记录,下面将介绍其中的一些。另外,随着时间的推移,会加入更多类型的RR。
A 一个A记录定义了一个 IP地址,它存储 32 bit的二进制数。
PTR 指针记录用于指针查询。IP地址被看作是in-addr.arpa域下的一个域名
(标识符串)。
CNAME 这表示“规范名字(canonical name) ”。它用来表示一个域名(标识符串),而 有规范名字的域名通常被称为别名 (alias)。某些 FTP服务器使用它向其他的系 统提供一个易于记忆的别名。 例如,gated服务器( 10.3节提到)可通过匿名FTP从gated.cornell.edu获得,但这里并没有叫做gated的系统,这仅是为其他系统提供的别名。其他 系统的规范名为gated.cornell.edu。
sun% host -t cname gated.cornell.edu gated.cornell.edu CNAM COMET.CIT.CORNELL.EDU 这里使用的- t选项来指明它是特定的查询类型。
HINFO 表示主机信息:包括说明主机CPU和操作系统的两个字符串。并非所有的站
点均提供它们系统的 HINFO记录,并且提供的信息也可能不是最新的。
sun % host -t hinfo sun
sun.tuc.noao.edu HINFO Sun-4/25 Sun4.1.3
MX 邮件交换记录,用于以下一些场合:(1)一个没有连到 Internet的站点能将一个 连到Internet的站点作为它的邮件交换器。这两个站点能够用一种交替的方式交换到达的邮件,而通常使用的协议是UUCP协议。(2)MX记录提供了一种将无 法到达其目的主机的邮件传送到一个替代主机的方式。(3)MX记录允许机构 提供供他人发送邮件的虚拟主机,如 cs.university.edu,即使这样的主机名根本不存在。(4)防火墙网关能使用 MX记录来限制外界与内部系统的连接。许多不能与Internet连接的站点通过UUCP链路与一个连接在Internet上的站点 如UUNET相连接。通过MX记录能使用user@host这种邮件地址向那个站点 发送电子邮件。例如,一个假想的域foo.com可能有下面的 MX记录:
sun % host -t mx foo.com
foo.com MX relay1.UU.NETfoo.com MX relay2.UU.NET MX记录能被连接在互联网主机中的邮件处理器使用。在这个例子中,其他的
邮件处理器则被告知“如果有邮件要发往 [email protected],就将邮件送到
relay1.uu.net或relay2.uu.net。”
每个 MX记录被赋于一个 16 bit 的整数值,该值称为优先值。如果一个目的主机有多个 MX记录,它们按优先值由小到大的顺序使用。另一个MX记录的例子是处理主机脱机工作或不可达的情况。邮件处理器仅在无法使用 TCP与目的主机连接时才使用MX记录。作者的主系统通过SLIP链路 与互联网相连,它在大多数时间内是脱机工作的,我们有
为了显示优先值,我们使用了- v选项(该选项也会导致其他字段的输出)。第 二个字段, 86400,是寿命值,单位为秒。因此该TTL值为24小时(24×60×
60)。第3列,IN,是(Internet)类。我们看到直接传送给主机自身(第一个MX记录)有最低的优先值0。如果没有工作(即SLIP链路断开),会使用下一 个更高优先值(10)的邮件记录,并试图向主机noao.edu传送。如果它仍 没有成功,发送将超时并在以后重新发送。
NS 名字服务器记录。它说明一个域的授权名字服务器。它由域名表示(符号串)。 在下节将看到这些类型的例子。
这些是 RR的常用类型。将在后面的例子中遇到它们。
14.7 高速缓存
为了减少 Internet上DNS的通信量,所有的名字服务器均使用高速缓存。在标准的Unix实 现中,高速缓存是由名字服务器而不是由名字解析器维护的。既然名字解析器作为每个应用的一部分,而应用又不可能总处于工作状态,因此将高速缓存放在只要系统(名字服务器)处于工作状态就能起作用的程序中显得很重要。这样任何一个使用名字服务器的应用均可获得高速缓存。在该站点使用这个名字服务器的任何其他主机也能共享服务器的高速缓存。
在迄今为止(图14-9)所举例子的网络环境中,在sun主机上运行客户程序,通过主机 noao.edu的SLIP链路访问名字服务器。现在将改变这种设置,在 sun主机上运行名字服务 器。在这种情况下,如果使用tcpdump监视在 SLIP链路上的 DNS通信量,将只能看到服务器 因超出其高速缓存而不能处理的查询。
在默认情况下,名字解析器将在本地主机上(UDP端口号为53或TCP端口号为53)寻找 名字服务器。从名字解析器文件中删除 nameserver行,而留下 domain行:
sun % cat /etc/resolv.confdomain tuc.noao.edu在这个文件中缺少 namerserver指示将导致名字解析器使用本地主机上的名字服务器。
使用host命令执行下列查询:
sun % host ftp.uu.net
ftp.uu.net A 192.48.96.9
图14-14显示了这个查询的输出结果。
图14-14 执行host ftp.uu.net后的tcpdump 输出
这次在tcpdump中使用了新的选项。使用-w选项来收集进出UDP或TCP 53号端口 的所有数据。将这些原始数据记录在一个文件中供以后处理,同时防止tcpdump试图调用名字解析器来显示与那个 IP地址相对应的域名。执行查询后,终止tcpdump并使用-r选项再次运行它。它会读取含有原始数据的文件并产生正式的输出显示(如图14-
14)。这个过程要花费几秒钟,因为tcpdump调用了它自己的名字解析器。
在tcpdump输出中要注意的第一点是标识符(identifier)是小整数(2和3)。这是因为我们 关闭这个名字服务器,后又重新启动它来强制清空它的高速缓存。当名字服务器启动时,它将标识符初始化为 1。
当键入查询,查找主机ftp.uu.net的IP地址,该名字服务器就同8个根名字服务器中的 一个ns.nic.ddn.mil(第 1行)取得联系。这是以前见到的正常的A类型查询,但要注意 的是它的期望递归表示没有说明(如果该标志被设置,在标识符 2的后边会跟着一个加号)。 在以前的例子中,经常看到名字解析器设置期望递归标志,但这里的名字服务器在与某个根服务器联系时没有设置这个标志。这是因为不应该向根名字服务器发出期望递归的查询,它 们仅用来寻找其他授权名字服务器的地址。
第2行显示返回的响应中没有回答资源记录,而包含5个授权资源记录和5个附加信息资源 记录。标识符2后的减号表示期望递归标志(RA)没有被设置。即使我们要求进行递归查询,这个根名字服务器也不会回答期望递归查询。
尽管tcpdump没有显示返回的10个资源记录,我们也能执行host命令来查看高速缓存的内容:
这次采用-v选项查看的不仅仅只是 A记录。它显示出对于域 uu.net有5个授权名字服务 器,而由根名字服务器返回的5个附加信息资源记录中含有这 5个名字服务器的IP地址。这避 免了在查找其中的某个名字服务器的地址时,无需再次与根名字服务器联系。这是 DNS中的 另一个实现优化。
host命令指出这个回答不是授权的,这是因为这个回答来自名字服务器的高速缓存,而 不是来自授权名字服务器。
回到图14-14中的第3行,我们的名字服务器与第一个授权名字服务器(ns.uu.net)询问同一个问题: ftp.uu.net的IP地址?这次我们的服务器设置了期望递归标志。返回的应答(第4行)包含一个回答资源记录。
而后我们再次执行host命令,询问相同的名字:
sun % host ftp.uu.net
ftp.uu.net A 192.48.96.9
这时tcpdump没有输出,这正是我们所期望的,因为由 host命令返回的回答来自于名字 服务器的高速缓存。
再次执行 host命令,查找 ftp.ee.lbl.gov的地址:
sun % host ftp.ee.lbl.gov
ftp.ee.lbl.gov |
CNAME |
ee.lbl.gov |
ee.lbl.gov |
A |
128.3.112.20 |
图14-15显示了这时的tcpdump输出。
图14-15 对ftp.ee.lbl.gov 主机的tcpdump 输出
这时第1行显示我们的服务器与另一个根名字服务器(c.nyser.net)联系。一个名 字服务器通常轮询不同的根名字服务器来获得往返时间估计,然后选择往返时间最小 的服务器。
既然我们的服务器向一个根服务器发出查询,那么期望递归标志不应被设置。正如我们在图14-14中所看到的该名字服务器并不清除期望递归标志(即便这样,一个名字服务器还是不应该向一个根名字服务器发出期望递归的查询)。
在第2行返回的响应中不包含回答资源记录,但含有 4个授权记录和4个附加信息资源记录。 正如我们所猜测的那样,4个授权资源记录是供主机ftp.ee.lbl.gov进行域名服务的名字 服务器名,其他 4个记录则是这 4个服务器的 IP地址。
第3行是向名字服务器 nsl.lbl.gov(第2行中返回的4个名字服务器中的第一个)发出 的查询请求。它的期望递归标志是被设置的。
第4行返回的响应和以往的响应不同。返回了两个回答资源记录,tcpdump指出其中的第 一个是 CNAME资源记录。 ftp.ee.lbl.gov的规范名称是 ee.lbl.gov。
这是CNAME记录常见的用法。LBL的FTP站点的名字通常是以ftp开始的,但它可能不时地从一个主机移到另一个主机。用户只需要知道 ftp.ee.lbl.gov,必要时DNS会用它的规范名进行替换。
记得我们在运行 host程序时,它显示了规范域名的 C N A M E和IP 地址。这是因为响应
(图14-15中的第4行)中含有两个回答资源记录,第一个是CNAME,而第二个是A记录。如 果A记录没有随CNAME记录返回,我们的服务器将发出另一个查询请求,询问ee.lbl.gov 的IP地址。这是另一个DNS的实现优化—在一个响应中同时返回一个规范域名的 CNAME记录和A记录。
14.8 用UDP还是用TCP
注意到DNS名字服务器使用的熟知端口号无论对UDP还是TCP都是53。这意味着DNS均 支持 UDP和TCP访问,但我们使用tcpdump观察的所有例子都是采用 UDP。那么这两种协议 都在什么情况下采用以及采用的理由都是什么呢?
当名字解析器发出一个查询请求,并且返回响应中的TC(删减标志)比特被设置为1时, 它就意味着响应的长度超过了 512个字节,而仅返回前 512个字节。在遇到这种情况时,名字 解析器通常使用 TCP重发原来的查询请求,它将允许返回的响应超过512个字节(回想在11.10 节讨论的 UDP数据报的最大长度)。既然TCP能将用户的数据流分为一些报文段,它就能用多个报文段来传送任意长度的用户数据。
此外,当一个域的辅助名字服务器在启动时,将从该域的主名字服务器执行区域传送。 我们也说过辅助服务器将定时(通常是3小时)向主服务器进行查询以便了解主服务器数据是否发生变动。如果有变动,将执行一次区域传送。区域传送将使用 TCP,因为这里传送的数 据远比一个查询或响应多得多。
既然DNS主要使用 UDP,无论是名字解析器还是名字服务器都必须自己处理超时和重传。此外,不像其他的使用UDP的Internet应用(TFTP、BOOTP和SNMP),大部分操作集中在局 域网上,DNS查询和响应通常经过广域网。分组丢失率和往返时间的不确定性在广域网上比局域网上更大。这样对于DNS客户程序,一个好的重传和超时程序就显得更重要了。
14.9 另一个例子
让我们通过另一个例子将已经介绍的许多 DNS特性作一个综合性回顾。先启动 Rlogin 客户程序,然后连接到一个位于其他域的 Rlogin服务器。图 14-16显示了发生的分组交换过程。 下面发生的 11个步骤都假定客户和服务器的高速缓存中没有任何信息。
1) 客户程序启动后,调用它的名字解析器函数将我们键入的主机名转换为一个 IP地址。 一个A类型的查询请求被送往一个根服务器。
2) 由根服务器返回的响应中包含为该服务器所在域服务的名字服务器名。
3) 客户端的名字解析器将向该服务器的名字服务器重发上述 A类型查询,这个查询通常 是将期望递归标志设置为1。
4) 返回的应答中包含 Rlogin服务器的 IP地址。
5) Rlogin 客户和Rlogin服务器建立一个TCP连接(第 18章将提供该步骤的细节)。客户和 服务器的 TCP模块间将交换3个分组。
Rlogin
服务器
服务器的名 字服务器
根名字 服务器
根名字 服务器
Rlogin
客户
客户的名 字服务器
图14-16 启动Rlogin客户和服务器的分组交换过程
6) Rlogin服务器收到来自客户的连接请求后,调用它的名字解析器通过TCP连接请求中的 IP地址获得客户主机名。这是一个PTR查询请求,由一个根名字服务器处理。这个根名字服务器可以不同于步骤1中客户使用的根名字服务器。
7)这个根名字服务器的响应中含有为客户的 in-addr.arpa域的名字服务器。
8) 服务器上的名字解析器将向客户的名字服务器重传上述 PTR查询。
9) 返回的 PTR应答中含有客户主机的 FQDN。
10)服务器的名字解析器向客户的名字服务器发送一个 A类型查询请求,查找前一步返回 的名字对应的IP地址。这可能由服务器中的gethostbyaddr函数自动完成,正如我们在 14.5节中介绍的那样,否则 Rlogin服务器将完成这一步。此外,客户的名字服务器常常就是客户的in-addr.arpa名字服务器,但这不是必需的。
11) 从客户的名字服务器返回的响应含有客户主机的 A记录。 Rlogin服务器将客户的 TCP
连接请求中的 IP地址与 A记录作比较。 高速缓存将减少这个图中交换的分组数目。
14.10 小结
DNS是任何与Internet相连主机必不可少的一部分,同时它也广泛用于专用的互联网。层次树是组成 DNS域名空间的基本组织形式。
应用程序通过名字解析器将一个主机名转换为一个 IP地址,也可将一个 IP地址转换为与 之对应的主机名。名字解析器将向一个本地名字服务器发出查询请求,这个名字服务器可能通过某个根名字服务器或其他名字服务器来完成这个查询。
所有的DNS查询和响应都有相同的报文格式。这个报文格式中包含查询请求和可能的回答资源记录、授权资源记录和附加资源记录。通过许多例子了解了名字解析器的配置文件以及DNS的 优化措施:指向域名的指针(减少报文的长度)、查询结果的高速缓存、in-addr.arpa域(查找IP地址对应的域名)以及返回的附加资源记录(避免主机重发同一查询请求)。
习题
14.1 讨论一个DNS名字解析器和一个DNS名字服务器作为客户程序、服务器或同时作为客
户和服务器的情况。
14.2 说明图 14-12中构成响应的 75个字节的含义。
14.3 在12.3节我们指出,一个既可接受点分十进制形式的 IP地址、也可接收主机名的应用程 序,应先假定输入的是IP地址,如果失败,再假定是主机名。如果改变这个测试顺序会出现什么情况?
14.4 每个UDP数据报有一个相应的长度。一个接收 UDP数据报的进程将被告知这个长度。当名字解析器使用TCP而不是UDP来处理查询请求时,由于TCP是没有任何记录标记的字 节流,那么应用程序是如何知道有多少数据返回?注意在DNS的报文首部(图14-3)中 没有任何长度字段(提示:查阅 RFC 1035)
14.5 我们说一个名字服务器必须知道根名字服务器的IP地址,这一信息可通过匿名FTP获得。 不幸的是当根名字服务器表发生变化时,并不是所有的系统管理员都会更新他们的 DNS 配置文件(根名字服务表的确会发生变化,尽管不是经常的)你认为DNS如何处理这个 问题?
14.6 利用习题1.8指明的文件来确定谁应负责维护根名字服务器。名字服务器更新的频度是怎样的?
14.7 维护一个名字服务器和一个无状态的名字解析器高速缓存的问题分别是什么?
14.8 在图14-10的讨论中,我们指出名字服务器将对A类型记录进行排序以便在公共网中的地址先出现。谁对A类型记录进行这种排序,是名字服务器还是名字解析器?