TCP/IP详解(三)网络层协议

一 前言

IP是TCP/IP协议族中最核心的协议,所有的TCP,UDO,ICMP及IGMP数据都以IP数据报格式传输。
IP提供的是不可靠,无连接的数据报传输
为什么说它不可靠?它不能保证IP数据报能成功到达目的地。IP仅提供最好的传输服务,如果发生错误时,如某个路由器暂时用完了缓冲区,IP有一个简单的错误处理算法:丢弃该数据报,然后发送ICMP消息报给信端源。任何要求的可靠性必须由上层来提供(如TCP)。
为什么说它是无连接的?这个术语的意思是IP并不维护任何关于后续数据报的状态信息。每个数据报的处理是互相独立的。这说明,IP数据报可以不按发送顺序接收。如果一信源向相同的信宿发送两个连续的数据报(先是A,然后是B),每个数据报都是独立地进行路由选择,可能选择不同的路线,因此B可能在A到达之前先到达。
主要介绍2个有用的命令ifconfig和netstat.及IP首部中的各个字段,探讨IP路由选择和子网的有关内容。

二 IP数据报

TCP/IP详解(三)网络层协议_第1张图片
上面是IP数据报的格式,普通的IP首部长20个字节,除非含有选项字段。IP首部最长为60个字节,这种限制使得某些选项如路由记录选项在当今已经没有什么用处了。因为IP首部长度字段值最大为15;
传输次序为大端(big endian字节序),这种字节序被称为网络字节序。常见的计算机时小端字节序(little endian);如果不是大端字节序的机器,则必须在传输之前将首部换成网络字节序。
大端字节序高位放在低地址,低位放在高地址;小端存储是高位放在高地址,低位放在低地址。

IP首部的bit位 内容
0~3bit 协议版本号
4~7bit 普通IP首部长度字段的值是5;20x8/32=5
8~15bit 服务类型(TOS)字段,包括一个3bit的优先权子字段(已被忽略),4bit的TOS字段和1bit未用位但必须置0;
16~31bit 总字节长度
这里就不一次把20个字节所代表的信息列出,在后面会详细介绍

补充:服务类型(TOS)字段中:其中4bit的TOS分别代表:最小时延,最大吞吐量,最高可靠性,最小费用。4bit中只能置其中1bit.如果所有4bit均位为0,那么就意味着是一般服务。RFC1340[Reynolds and Postel 1992]描述了所有标准应用如何设置这些服务类型。RFC1349[Almquist 1992]对该RFC进行修正,更为详细地址描述了TOS的特性。
下图是一个针对不同应用建议的TOS值。在最后一列中给出的十六进制值,因为这就是在后面将看到的tcpdump命令输出

TCP/IP详解(三)网络层协议_第2张图片
Telnet和Rlogin这两个交互应用求最小的传输时延,因为人们主要用来来传输少量的交互数据。
FTP文件传输要求最大吞吐量。
最高可靠性被指明给网络管理SNMP和路由选择协议。
用户网络新闻(Usent news,NNTP)是唯一要求最小费用的应用。
自4.3BSD Reno以后的新版本系统都对它进行了设置。另外,新的路由协议如OSPF和IS-IS都能根据这些字段进行路由决策。

在TCP./IP详解(二)中我们提到SLIP一般是提供基于服务类型的排队方法,允许对交互通信数据在处理大块数据之前进行处理。由于大多数的实现都不使用TOS字段,因此这种排队机制由SLIP自己来判断和处理,驱动程序先查看协议字段(确定是否是一个TCP段),然后检查TCP信源和信宿的端口号,以判断是否是一个交互服务。一个驱动程序认为的注释认为,这种方法是必须的,因为大多数实现都不允许应用层设置TOS字段

总长度字段:是指整个IP数据报的长度,以字节为单位。利用首部长度字段和总长度,就可以知道IP数据报中数据内容的起始位置和长度。由于该字段长16比特,所以IP数据报最长可以为65535字节;在TCP/IP详解(二)中关于MTU的描述中超级通道MTU为65535.它的意思起始不是一个真正的MTU-它使用了最长的IP数据报。当数据报被分片时,该字段的值也随着变化,
尽管可以传送一个长达65535字节的IP数据报,但是大多数的链路层都会对它进行分片。而且,主机也要求不能接收超过576字节的数据报文。由于TCP把用户数据分成若干片,因此一般来说这个限制不会影响TCP。在后面的章节中将会遇到大量使用UDP的应用(RIP,TFTP,BOOTP,DNS,以及SNMP),它们都限制用户数据报长度为512字节,小于576字节。但是,事实上现在带哦书的实现(特别是那些支持网络文件系统NFS的实现)允许超过8192字节的IP数据报。
总字节长度是IP首部必要的内容,因为一些数据链路如(以太网)需要填充一些数据以达到最小长度,如以太网帧中数据的最小长度为46,但是,IP数据报可能更短。如没有总长度字段,那么IP数据报就不知道这46字节中有多少是IP数据报的内容。

标识字段:唯一地标识主机发送的每一份数据报。通常每发送一份报文它的值就会加1.,在后面的分片时再来分析标志字段和片偏移字段。
RFC 791[Postel 1981a]认为标识字段应该由IP发送数据报的上层来选择。假设由两个两虚的IP报文,其中一个是TCP生成的,而另一个是由UDP生成的,那么它们可能具有相同的标识字段。尽管这也可以照常工作(由重组算法来处理),但是在大多数从伯克利派生出来的系统,每发送一个IP数据报,IP层都要把一个内核变量的值加1,不管交给IP的数据来自哪一次。这里的内核变量的初始值(也就是所谓的标识字段的初始值)是根据系统引导时的时间来设置的。

TTL(time-to-live)生存时间字段:设置了数据报可以经过的最多路由数,它指定了数据报的生成时间。TTL的初始值由源主机设置(通常为32或64),一旦经过一个处理它的路由器,它的值就减去1。当该字段的值为0时,数据报就被丢弃,并发送ICMP报文通知源主机。Traceroute程序将讨论该字段

协议字段:也就是指明它所传的的协议的类型,一般分为:TCP,UDP,ICMP,IGMP

首部检验和字段:它不对首部后面的数据进行计算。ICMP,IGMP,UDP,和TCP在它们各自的首部中均含有同时覆盖首部和数据检验码。
为了计算一份数据报的 I P检验和,首先把检验和字段置为 0。然后,对首部中每个 16 bit进行二进制反码求和(整个首部看成是由一串 16 bit的字组成),结果存在检验和字段中。当收到一份I P数据报后,同样对首部中每个 16 bit进行二进制反码的求和。由于接收方在计算过
程中包含了发送方存在首部中的检验和,因此,如果首部在传输过程中没有发生任何差错,那么接收方计算的结果应该为全 1。如果结果不是全1(即检验和错误),那么I P就丢弃收到的数据报。但是不生成差错报文,由上层去发现丢失的数据报并进行重传。

PS:这里提到了一种检验方式:反码求和;这种方式能够检测数据的一致性;
具体方法演示:

变量11 |	变量30 | 变量51 |  变量70
变量21 |	变量41 | 变量60 |  变量80
结果: 10 |	结果: 1 | 结果: 1 |  结果   0

我们明显可以得到结论,如果两个数据完全一致,那么它们采用二进制反码求和的结果一定是0

我们将发送到的IP首部的数据分为:非首部检验和:A    与  首部检验和 : A
我们将接收到的IP首部的数据分为; 非首部检验和:A    与  首部检验和: A 反码求和 A 

即我们将接收到的两类数据类反码求和为:A反码求和A反码求和A

上面的表达太抽象;我们具体化假设 A 为 1010

			   1010
			   1010
反码求和结果:   10100
			    1010	
再反码求和结果   11110

到这一步得到 11110->假设我们限制只有4位,这里产生了溢出,处理方式是将溢出位加到最末尾 ;这里体现了反码求和的后效性(是蔓延)			
   	
总结:这是一非常不错的校验方法 ,同时也不用担心什么大端小端的问题。  	

I C M P、I G M P、U D P和T C P都采用相同的检验和算法,在 RFC 1071[Braden, Borman and Patridge 1988]中有关于如何计算I n t e r n e t检验和的实现技术。由于路由器经常只修改 T T L字段(减1),因此当路由器转发一份报文时可以增加它的检验和,而不需要对 I P整个首部进行重新计算。 R F C 1141[Mallory and Kullberg 1990]为此给出了一个很有效的方法。但是,标准的BSD实现在转发数据报时并不是采用这种增加的办法。

每份IP数据报都包含源IP地址和目的IP地址,源IP地址就是发送IP数据报的地址,源目的地址就是指定接收IP数据报的地址;

最后一个字段是任选项,是数据报中的一个可变长的可选信息。目前,这些任选项定义
如下:
• 安全和处理限制(用于军事领域,详细内容参见 RFC 1108[Kent 1991])
• 记录路径(让每个路由器都记下它的 I P地址,见7 . 3节)
• 时间戳(让每个路由器都记下它的 I P地址和时间,见7 . 4节)
• 宽松的源站选路(为数据报指定一系列必须经过的 I P地址,见8 . 5节)
• 严格的源站选路(与宽松的源站选路类似,但是要求只能经过指定的这些地址,不能
经过其他的地址)。

这些选项很少被使用,并非所有的主机和路由器都支持这些选项。
选项字段一直都是以 32 bit作为界限,在必要的时候插入值为 0的填充字节。这样就保证
I P首部始终是32 bit的整数倍(这是首部长度字段所要求的)。

三 路由选择

从概念上来讲,IP路由选择对于主机来讲,如果目的主机与源主机直接相连如(点对点链路)或都在一个共享网络上(以太网或令牌环网),那么IP数据报就直接送到目的主机上。否则,主机把数据报发往一默认的路由器上,由路由器来转发该数据报。多数的主机都是采用这种简单的机制。
实际上IP层既可以配置成路由器的功能,也可以配置成主机的功能,如今我们使用的几乎所有的Unix系统,都可以配置成路由器。我们可以为它指定主机和路由器都可以使用的简单路由算法。本质上的区别在于主机不把数据从一个接口转发到另一个接口,而路由器则要转发数据报。
在一般的体制中,IP可以从TCP,UDP,ICMP,IGMP接收数据报。(即在本地生成的数据报)并进行发送,或者从一个网络接口接收数据(待转发的数据报)并进行发送。IP层在内存中有一个路由表。当收到一份数据报并进行发送时,它都对该表搜索一次。当数据报来自某个网络接口时,IP首先检查目的IP地址是否位本机的IP地址之一或者IP广播地址。如果确实这样,数据报就被送到由IP首部协议字段指定的协议模块进行处理。如果数据报的目的不是这些地址,那么(1)如果IP层被设置为路由器的功能,那么对数据报进行转发(也就是说,像下面对待发出的数据报一样处理),否则(2)数据报被丢弃

路由表:路由表中的每一项都包含下面这些信息:
1)目的IP,由该路由表的标志字段来指定。主机地址有一个非0的主机号,以指定某一特定的主机,而网络地址中的主机号为0,以指定网络中的所有主机(如以太网,令牌环网)。
2)下一站,路由器的IP地址,或者有直接连接的网络IP地址。下一站路由器是指一个在直接相连网络上的路由器,用过它可以转发数据报,下一站路由器不是最终的目的,但是它可以把传送给它的数据报发送到最终目的。
3)标志。其中一标志指明目的IP地址是网络地址还是主机地址,另一个标志指明下一站路由器是否为真正的下一站路由器,还是一个直接相连的接口
为数据报的传输指明IP地址是网络地址还是主机地址,另外一个标志指明下一站路由器是否为真正的下一站路由器,还是一个直接相连的接口
5)为数据报的传输指定一个网络接口。

IP路由选择是逐朓进行的。从这个路由表信息可以看出,IP并不知道到达任何目的的完整路径(除了那些与主机直接相连的)。所有的IP路由u西安则置为数据提供下一站路由器的IP地址。

IP路由选择主要功能:
1)搜索路由表,寻找能与目的IP地址完全匹配的表目(网络号和主机号都要匹配)。如果找到,则把报文发送给该表目指定的下一站路由器或直接连接的网络接口(取决于标志字段的值)。

2)搜索路由表,寻找能与目的网络号相匹配的表目。如果找到,则把报文发送给该标目指定的下一站路由器或直接连接的网络接口(取决于标志字段的值)。目的网络上所有主机都可以通过这个表目来处理。例如,一个以太网络上所有主机都是通过这种表目进行寻径的。
这种搜索网络的匹配方法必须考虑可能的子网掩码。

3)搜索路由表,寻址标为“默认defauult”的表目。如果找到则把报文发送给该表目指定的下一站路由器。
如果上面这些步骤都每成功,那么该数据报就不能被传送。如果不能传送的数据报来自本主机,那么一般会向生成数据报的应用程序返回一个“主机不可达”或“网络不可达”的错误。
完整主机地址匹配在网络号匹配之前执行。只有当它们都失败后才选择默认路由。默认路由,及下一站路由器发送的ICMP间接报文(如果我们为数据选择了错误的默认路由),是IP数据报路由选择机制中功能强大的特性。
为一个网络指定一个路由器,而不必为每个主机指定一个路由器,这是IP路由机制选择机制的另一个基本特性。这样做可以极大地缩小路由表的规模,如Internet上的路由器只有几千个而不是几百万个表目。

下面是一个连接在同一个以太网上主机bsdi要发送给主机sun;
当IP从某个上层收到这份数据报后,它搜索路由表,发现目的IP地址在一个直接相连的网络上(以太网140.252.13.0).于是,在表中找到匹配网络地址,由于以太网的子网掩码的存在,实际的网络地址是140.252.13.32,但是者并不影响这里所讨论的路由器选择。
数据报被送到以太网驱动程序,然后作为一个以太网数据帧被送到sun主机上。IP数据报文中的目的地址是sun的IP地址(140.252.13.33),而在链路层首部中的目的地址是48bit的sun主机的以太网接口地址。这个以太网地址使用ARP协议获得的。
TCP/IP详解(三)网络层协议_第3张图片

现在来看另一个例子:主机 b s d i有一份I P数据报要传到f t p . u u . n e t主机上,它的I P地址是1 9 2 . 4 8 . 9 6 . 9。经过的前三个路由器如图 3 - 4所示。首先,主机b s d i搜索路由表,但是没有找到与主机地址或网络地址相匹配的表目,因此只能用默认的表目,把数据报传给下一站路由器,即主机s u n。当数据报从b s d i被传到s u n主机上以后,目的 I P地址是最终的信宿机地址(1 9 2 . 4 8 . 9 6 . 9),但是链路层地址却是s u n主机的以太网接口地址。这与图 3 - 3不同,在那里数据报中的目的I P地址和目的链路层地址都指的是相同的主机( s u n)。
TCP/IP详解(三)网络层协议_第4张图片
当s u n收到数据报后,它发现数据报的目的 I P地址并不是本机的任一地址,而 s u n已被设置成具有路由器的功能,因此它把数据报进行转发。经过搜索路由表,选用了默认表目。根据s u n的默认表目,它把数据报转发到下一站路由器 n e t b,该路由器的地址是1 4 0 . 2 5 2 . 1 . 1 8 3。数据报是经过点对点 S L I P链路被传送的,采用了图 2 - 2所示的最小封装格式。这里,我们没有给出像以太网链路层数据帧那样的首部,因为在 S L I P链路中没有那样的首部。当n e t b收到数据报后,它执行与s u n主机相同的步骤:数据报的目的地址不是本机地址,而n e t b也被设置成具有路由器的功能,于是它也对该数据报进行转发。采用的也是默认路由表目,把数据报送到下一站路由器 g a t e w a y(1 4 0 . 2 5 2 . 1 . 4)。位于以太网1 4 0 . 2 5 2 . 1上的主机n e t b用A R P获得对应于1 4 0 . 2 5 2 . 1 . 4的48 bit以太网地址。这个以太网地址就是链路层数据帧头上的目的地址。路由器g a t e w a y也执行与前面两个路由器相同的步骤。它的默认路由表目所指定的下一
站路由器 I P地址是1 4 0 . 2 5 2 . 1 0 4 . 2(我们将在图 8 - 4中证实,使用 Tr a c e r o u t e程序时,它就是g a t e w a y使用的下一站路由器)。对于这个例子需要指出一些关键点:

  1. 该例子中的所有主机和路由器都使用了默认路由。事实上,大多数主机和一些路由器可以用默认路由来处理任何目的,除非它在本地局域网上。

  2. 数据报中的目的I P地址始终不发生任何变化(在 8 . 5节中,我们将看到,只有使用源路由选项时,目的I P地址才有可能被修改,但这种情况很少出现)。所有的路由选择决策都是基于这个目的I P地址。

  3. 每个链路层可能具有不同的数据帧首部,而且链路层的目的地址(如果有的话)始终指的是下一站的链路层地址。在例子中,两个以太网封装了含有下一站以太网地址的链路层首部,但是S L I P链路没有这样做。以太网地址一般通过 A R P获得。

总结路由选择:
1)路由选择需要依赖路由表

2)路由表包含的信息:
目的IP(可以是主机地址,也可以是网络号由标志字段指定)

下一站(或下一跳)路由器( next-hop router)的I P地址,或者有直接连接的网络 I P地址。下一站路由器是指一个在直接相连网络上的路由器,通过它可以转发数据报。下一站路由器不是最终的目的,但是它可以把传送给它的数据报转发到最终目的

标志字段:其中一个标志指明目的 I P地址是网络地址还是主机地址
另一个标志指明下一站路由器是否为真正的下一站路由器,还是一个直接相连的接口

为数据报的传输指定下一个网络接口

3)网络号,不包含主机号的IP地址
主机地址 包含主机号的IP地址

4)IP路由选择的功能:
先从路由表中匹配主机地址表目,如果搜索不到就匹配网络号表目,如果搜索不到就使用默认的路由表目录,如果上面这些步骤都没有成功,那么该数据报就不能被传送。如果不能传送的数据报来自本机,那么一般会向生成数据报的应用程序返回一个“主机不可达”或“网络不可达”的错误。

5)路由器中一般会存在多种数据链路层,以太网的以太网地址一般是通过ARP协议获取。而点对点SLIP协议并没有这样做。而且显然路由器存在多份路由表。

6)路由选择实际上是通过路由表比较,然后不断转跳,
不成功的情况是:直到IP首部种的TTL生存时间字段,被耗尽,又或是路由表搜索完也找不到就会返回不可达信息,
成功的情况,就是在路由表耗尽之前,TTL耗尽之前找到了目的主机的IP地址

四 子网寻址

现在所有的主机都要求支持子网编址( RFC 950 [Mogul and Postel 1985])。不是把I P地址看成由单纯的一个网络号和一个主机号组成,而是把主机号再分成一个子网号和一个主机号。这样做的原因是因为 A类和B类地址为主机号分配了太多的空间,可分别容纳的主机数为
224-2和216-2。事实上,在一个网络中人们并不安排这么多的主机(各类 I P地址的格式如图1 - 5所示)。由于全0或全1的主机号都是无效的,因此我们把总数减去 2。在I n t e r N I C获得某类I P网络号后,就由当地的系统管理员来进行分配,由他(或她)来决定是否建立子网,以及分配多少比特给子网号和主机号。例如,这里有一个 B类网络地址(1 4 0 . 2 5 2),在剩下的16 bit中,8 bit用于子网号,8 bit用于主机号,格式如图 3 - 5所示。这样就允许有2 5 4个子网,每个子网可以有2 5 4台主机
在这里插入图片描述

五 子网掩码

任何主机在引导时进行的部分配置是指定主机 I P地址。大多数系统把 I P地址存在一个磁盘文件里供引导时读用。在第 5章我们将讨论一个无盘系统如何在引导时获得 I P地址。除了I P地址以外,主机还需要知道有多少比特用于子网号及多少比特用于主机号。这是在引导过程中通过子网掩码来确定的。这个掩码是一个 32 bit的值,其中值为 1的比特留给网络号和子网号,为0的比特留给主机号。图 3 - 7是一个B类地址的两种不同的子网掩码格式。第一个例子是n o a o . e d u网络采用的子网划分方法,如图 3 - 5所示,子网号和主机号都是 8 bit宽。
第二个例子是一个B类地址划分成10 bit的子网号和6 bit的主机号。
TCP/IP详解(三)网络层协议_第5张图片
尽管I P地址一般以点分十进制方法表示,但是子网掩码却经常用十六进制来表示,特别是当界限不是一个字节时,因为子网掩码是一个比特掩码。给定I P地址和子网掩码以后,主机就可以确定 I P数据报的目的是:
( 1)本子网上的主机;
(2)本网络中其他子网中的主机;
( 3)其他网络上的主机。如果知道本机的 I P地址,那么就知道它是否为A类、B类或C类地址(从I P地址的高位可以得知),也就知道网络号和子网号之间的分界线。而根据子网掩码就可知道子网号与主机号之间的分界线。

六 变长子网

TCP/IP详解(三)网络层协议_第6张图片
11位子网号中的前8 bit始终是1 3。在剩下的3 bit中,我们用二进制0 0 1表示以太网,0 1 0表示点对点S L I P链路。这个变长子网掩码在 1 4 0 . 2 5 2网络中不会给其他主机和路由器带来问题—只要目的是子网1 4 0 . 2 5 2 . 1 3的所有数据报都传给路由器s u n(I P地址是1 4 0 . 2 5 2 . 1 . 2 9),如图3 - 11所示。如果s u n知道子网1 3中的主机有11 bit子网号

你可能感兴趣的:(TCP/IP详解,tcp/ip,网络,网络协议)