今天的因特网无疑是有史以来人类创造、精心设计的最大系统,该系统具有数以亿计的相连的计算机、通信链路和交换机,有数十亿的使用便携计算机、平板电脑和智能手机的用户,并且还有一批与因特网互联的新型设备,如传感器、游戏机甚至洗衣机等。
面对如此巨大且具有如此众多不同组件和用户的因特网,是否可以理解它的工作原理?是否存在某些指导原则和结构,能够作为理解规模和复杂程度如此惊人的系统的基础?好消息的,这两个问题的答案都是肯定的!这使得学习计算机网络成为既引人入胜又趣味盎然的一件事情!
我们可以从两个角度来回答这个问题:一种是描述组成它的软硬件;另一种是将其视为为分布式应用提供基础服务的联网设施来描述。其实,第一种角度,是从它的组成来描述,第二种角度是从它的功能来描述;
因特网是一个世界范围的计算机网络,这意味着它互联了数以亿计的计算设备(不仅仅是计算机哦);这些设备包括但不限于传统PC、工作站以及所谓的服务器。现在有更多的设备加入到因特网中,比如便携式计算机、电视机、汽车、传感器等。
用因特网的术语来说,所有连入因特网的设备都叫做主机或者端系统 (仅仅是一个术语,大海之所以为大海,不是因为它叫大海,而是因为它是大海。一些听上去高大上的名词,其背后的实际内容也并非都和其名字相符;然而,我们仍然需要这么一个术语来表达意思,或许是为了简单?);从此,主机==端系统==连入因特网的设备,这一等式在以后的博文中都将成立~
以下是重点的一些概念:
到这里,你是否还记得这一节的小标题?反正我在看书的时候,看到这一节的后面,就忘了这一节的标题即核心内容是什么了(因为有很多的概念要理解,它们还不是很容易理解,比如网络核心、接入网,记住这些内容已经很不容易了,好吧,我承认我笨);没错,我们的目的是从组成(软硬件)上描述因特网~:端系统本身就是一个软硬件的结合体,而端系统之间是由通信链路(硬件)和分组交换机(软硬件)连接的;这些软硬件为了信息的交流,需要运行一系列的协议(规定软件和硬件如何工作);
个人认为,计算机网络的目的就是信息的交流:为了信息的交流,我们将有信息需求的实体称为端系统;为了发送消息,我们需要物理的通信链路,还需要一些交换机来选择链路;为了理解信息,我们需要遵守一定的规范,即协议;可见,计算机网络其实以信息为中心(额,绕了一圈,总结出一个人尽皆知的结论);
我们可以将因特网视为为分布式应用提供基础服务的联网设施来看待;
既然要交换数据,就必须回答如何交换数据这一问题,所以因特网就是这一问题的答案:为分布式应用提供交换数据的服务;
综上,什么是因特网这一问题,从其软硬件组成和服务功能两个角度给出答案;而其核心就是信息交换,这不但是计算机网络的核心,还是即将学习的一系列协议的核心(个人理解,不保证其权威性);
前面提到了分组这一概念,分组==用户数据+必要数据;这些必要数据为分组接收者理解用户数据提供保障,而协议就是如何使用必要数据理解用户数据的方法或者规则;分组接收者接收到分组并按照协议获得了用户数据后,还应该对此消息做出反应,而如何做出反应也是协议规范的一部分(不反应也是一种反应哦);
所以,一个协议定义了两个或多个通信实体(不一定是端系统,还有可能是分组交换机等)之间交换信息的格式和次序以及对该信息所采取的动作;
凡是通信实体的所有活动都要受到协议的约束。比如,硬件实现的控制协议控制了两块网卡之间的比特流;在端系统中,拥塞控制协议控制了发送方和接收方之间传输数据的速率等;
端系统之所谓称为端系统,是因为它们往往处于网络的边缘;网络的边缘就像一个圈的边界,圈的一边是内部,一边是外部;
接入网是指将端系统连入到边缘路由器的物理链路;(但凡介绍概念,就必引入概念);所谓边缘路由器是指端系统到任何其他远程端系统路径上的第一台路由器;
这是一种宽带住宅接入的方法,它的ISP是本地电话公司。其使用的通信链路的物理材质为电话线,是一种双绞线。
用户使用DSL调制解调器通过电话线与ISP中的数字用户线接入复用器(DSLAM)来交换数据;家庭DSL调制解调器将数字数据转换为高频音后通过电话线传输到ISP中心,并且通过DSL解调器将DSLAM发送过来的模拟信号转为数字信号;
这是另一种宽带住宅接入方法,它的ISP是有线电视公司。其使用的通信链路的物理材质有光纤和同轴电缆,也被称为混合光纤同轴(Hybrid Fiber Coax HFC);
用户使用电缆调制解调器通过同轴电缆与光纤结点相连,光纤结点通过光缆与电缆头端相连,而电缆头端接入了因特网。在电缆头端,电缆调制解调器端接系统(Cable Modem Termination System)起到DSLAM的作用,即实现模拟信号和数字信号的转换;
这里主要是指使用光纤作为通信链路的材质,有两种竞争性的光纤分布方案,一种是主动光纤网络(Active Optical Network),另一种是被动光纤网络(Passive Optical Network).其主要区别在于,是否在传输数据时共享光纤。
以太网接入是一种在公司、大学、家庭里很流行的接入方式;用户使用双绞线与以太网交换机相连,从而接入因特网;接入以太网交换机的速度可达100Mbps;
在无线局域网中,无线用户从一个接入点发送和接收数据,而该接入点与企业网相连,企业网最终接入因特网;在无线LAN中,用户需要在一个接入点的几十米范围之内;
在移动设备中,通过蜂窝网提供商运营的基站来发送和接收分组,与WIFI不同的是,用户仅需要位于基站的数万米范围之内即可;
传输媒体是构成通信链路的主要部分,物理媒体通常可以分为导引性媒体和非导引性媒体;其中导引性媒体,信号沿着固体前行;而非导引性媒体中,信号沿着固体媒体前行;
值得注意的是,架设传输媒体的人历成本要远远高于物理材料的成本;
最便宜的引导性传输媒体,由两条相互螺旋缠绕的铜线组成。目前局域网中的双绞线数据传输速率在10Mbps到10Gbps之间,所能达到的数据传输速率取决于线的粗细以及传输距离;双绞线实际上已经成为高速局域网联网的主要方式;因为现代的双绞线技术速率和传输距离都是很不错的;
也由两个铜导体构成,但是它们是同心的,而非并行的;借助特殊的结构和绝缘层,同轴电缆可得到较高的数据传输速率;在电视系统中应用广泛;同轴电缆可被用作引导性的共享媒体;
一种可以引导光脉冲的媒体;
无线电信道承载电磁频谱中的信号,不需要物理线路,提供与移动用户的连接以及长距离承载信号的方式;是一种有吸引力的媒体;
通过卫星连接两个或多个在地球上的微波发射方(也被称为地面站),该卫星在一个频段上接收信号,在另一个频段上发送信号;种类有同步卫星和近地轨道卫星;
网络核心即为由互联端系统的分组交换机和链路构成的网状网络;
分组在通信链路上以等于该链路的最大传输速率传输通过通信链路。因此如果某条链路的最大传输速率为R,分组长度为L,则该链路传输该分组的时间为L/R;这个时间也被称为传输时延(值得注意的是,这里说的时间很有可能是传播时延而不是传输时延,这两者的区别在关于延迟时间的计算中将详细解释,虽然这里书上写的是传输,但是根据后文,我认为是传播);分组交换的常见方式是存储转发机制;
大多数分组交换机采用存储转发机制来转发分组;所谓存储转发是指交换机在收到一个完成的分组并且链路上没有其他正在传输的分组时,才会向链路输出转发分组,否则就将收到的部分分组缓存起来;因为缓存等待一个分组的全部数据而导致的时间开销被称为存储转发时延
因为需要缓存分组,所以此时分组交换机需要一个缓冲队列;缓冲队列的空间有限性就有可能导致分组交换机无法继续缓存分组(因为链路被占用或者分组还没全部到位)而使到达分组交换机的数据包被迫丢弃;这就导致了分组不但承担了传输时延,还承担了队列时延。
前面已经提到,分组交换机的任务就是将入链路到达的分组通过某条出链路转发出去;可是分组交换机收到分组后是如何决定其出链路呢?还记得分组==用户信息+必要信息吗?在必要信息里,就有分组交换机需要的信息;首先,需要明确的是,每一个端系统有一个称为IP地址的标识,发送分组的端系统会在其必要信息的部分里指明接收分组的端系统的IP地址,这样分组交换机就可以知道接收到的分组去向何方了。实际上,分组交换机之所以能够知道往哪去是因为其内部有一个转发表,这个表维护了一个IP地址和链路的对应关系,所以处理流程为:
到这里,有一个问题就是这张表是如何建立的呢?是人工维护还是有某种自动生成的方法呢?答案是两者都行,但是一般来说,当网络很复杂时,人工无法完成其维护,所以都是根据一些因特网协议(这些协议被称为路由选择协议)来自动设置转发表,这部分内容将在后面介绍;
在电路交换网络中,在端系统通信会话期间,交换机会预留端系统间通信路径上的相关资源(缓存,链路传输速率),即先建立连接,然后通信;而在分组交换网络中,这些资源没有被预留;也就是说,在端系统进行通信时,其所需要的资源是被保持的,其他通信是无法使用这一部分资源的;也就说,端系统间真正建立了一条“连接”;而这一连接,用电话的术语被称为“电路”;
在电路交换网络中,需要注意的是其通信链路的复用方法。常见的有两种复用方法:时分复用(Time-Division Multiplexing TDM)和频分复用(Frequency-Division Multiplexing);
所谓时分复用,是指将时间划分为固定区间的帧,每个帧则又被划分为固定数量的时间空隙;当网络需要建立一条连接时,网络将在每个帧中为该连接指定一个时隙;在该时隙内,链路用来传输该链接的数据;
而所谓频分复用,是指将频率域划分为频段,然后将频段分配给连接;此频段被用来专门传输链接的数据;
分组交换的优点:
分组交换的缺点:
电路交换的优点:
电路交换的缺点:
总体上来说,分组交换的性能要好于电路交换的性能,但是不同类型的分组交换方式有不同的应用场景;比如一些对最低速率有着严格要求的应用,比如实时服务等,为了获得速率保证,牺牲网络的效率也是可以接受的;
不得不说,因特网是一个庞大而复杂的系统,但是我们仍然有办法描述它(我们不是已经这么做过了吗?),但是我们需要一个模型来刻画因特网的结构;该用什么样的结构来刻画因特网呢?我想,最普遍的说法就是:因特网是网络的网络。但是这一说法足够精炼的同时也不够明确。更重要的是,我们可以选择更明确的方法来刻画因特网;书中通过5个模型不断过渡到最终模型,其实过渡的过程就结构不断合理、连接方式不断明确的过程。
我们在什么是因特网 一节中介绍ISP,端系统是通过ISP接入因特网的,为了实现端系统的互联,ISP也必须互联,其实网络模型就是用来表达ISP和端系统以及ISP之间的结构的抽象;
网络结构1:存在唯一的全球承载ISP互联所有的接入ISP,这是指,全球ISP是一个又路由器和通信链路构成的网络,该网络跨越全球,并且其他的接入ISP都至少和一个它的路由器相连;
网络结构2:存在多个全球承载ISP,它们分别于一部分的接入ISP互联;为了实现端系统的互联,这多个全球ISP也必须互联;网络结构是一个两层结构,其中全球承载ISP位于顶层,接入ISP处于底层;
网络结构3:顶层全球承载ISP基本上已经定型,但是接入ISP现在还很混乱,比如,它们直接同顶层ISP相连;而网络结构3中,接入ISP也是分层的:较小区域中的ISP连入较大区域的ISP,而不是直接与顶层ISP相连;为什么会出现这样的结构呢?这是因为,如果都直接同顶层ISP相连,那么两个同一较小区域内,分属不同ISP的端系统之间通信的数据也会到顶层ISP中心去一趟,如果它们不是直接接入顶层ISP,而是接入了一个较大区域的ISP,那么它们之间的通信数据就不用去顶层ISP中心了,因为它们通过较大区域的ISP已经实现了互连,所以通信速度肯定就上去了。
网络结构4:是在网络结构3的基础上,增加了以下特点而形成的结构:存在点(Point of Presence,PoP)、多宿、对等、因特网交换点(Internet exchange point,IXP)。
网络结构5:网络结构5是在网络结构4的基础上增加了内容提供商网络而构成。内容提供商构建自己的网络,并且通过与较低层ISP对等而“绕过”较高层因特网ISP,而且内容提供商对端用户也有了更多的控制。
总体来说,今天的因特网是一个“网络的网络”,其结构复杂,由十多个顶层ISP和数十万个较低层ISP构成。近年来,主要的内容提供商创建自己的网络,直接在可能的地方与较低层ISP互联;
计算机网络必定要要限制在端系统之间的吞吐量,故在端系统之间存在时延、丢包;
一个分组在沿途每个节点承受不同类型的时延,这些时延中最为重要的是:结点处理时延、排队时延、传输时延和传播时延;
处理时延是因为节点需要解析分组的必要信息然后决定其出链路(索引转发表等操作)而产生的,通常在微秒或者更低数量级;
排队时延是因为分组所对应的出链路前面有其他分组正在传输,所以分组需要该链路的缓冲队列里等待其他分组传输完毕而产生的;一般来说,排队时延是到达该队列的流量强度和性质的函数,通常可以达到毫秒级到微秒级;
传输时延是将所有分组的比特推向链路所有需要的时间,实际的传输时延通常在毫秒到微秒数量级;
传播时延是指比特进入链路后,从该链路的起点到下一个结点所用的时间;一旦分组中的最后一个比特到达路由器就意味着该分组的所有比特都已到达路由器;广域网中,传播时延一般是毫秒级的;
如果打个比方的话,传输时延就是大卡车经过收费站的时间而传播时间就是车在高速公路上行驶的时间;
排队时延和丢包与网络的状况和结点的缓冲空间大小、处理速度相关;如果分组到达的速度高于结点的处理速度,那么分组就会在缓冲队列里排队等待。当缓冲空间用完后,如果还有到的分组,那么该分组将被迫丢弃;
为了描述网络状体,我们引入了流量强度这一概念:流量强度=分组到达的速度/结点的处理速度;流量工程里一个金科玉律就是:设计系统时流量强度不能大于1;
当流量强度持续大于1时,就将出现丢包现象;
计算机网络的吞吐量实际上是一个速度指标,它描述了比特经过某个节点的速度。对于某条路径上的结点来说,和该结点有关的速度有两个:接收数据的速度和发送数据的速度,而该结点的吞吐量是这两个速度中较小的一个;对于某条路径来说,该路径的吞吐量则是所有节点的吞吐量的最小值;网络的吞吐量可以衡量网络的性能;
因特网是一个极为复杂的系统,该系统里存在着大量的应用程序和协议、各种类型的端系统、分组交换机和各种类型的链路级媒体。但是它同时也是有着清晰结构的,就像我们前面在网络核心 一节介绍的,我们仍能构建它的结构模型。
计算机网络采用分层的体系结构,分层的体系结构因为提供模块化而具有很高的价值,同时也易于服务实现的多样性:某一层对其上一层提供服务,同时它可以利用下一层提供的服务。只要对上提供的服务和对下利用的服务没有变化,其层内部的实现并不会对系统结构产生影响;对于大而复杂且需要不断更新的系统来说,改变服务的实现而不影响系统其他组件是分层模式的另一个重要优点;
为了给网络协议的射击提供一个结构,网络设计者以分层的方式组织协议以及实现这些协议的软硬件;
一个协议层可以使用软硬件实现,同时某个协议层的不同部分常常位于网络组件的各部分。协议分层具有概念化和结构化的优点。模块化使得更新系统组件更为容易。但是分层也有其缺点,就是功能上的冗余,比如许多协议栈针对链路和端到端两种情况都提供了差错恢复功能。第二种潜在的缺点就是某层的功能可能需要仅在其它层才出现的信息;
总体来说,将各层的所有协议组合起来,称为协议栈。因特网的协议栈有5个层次组成:物理层、链路层、网络成、传输层、应用层;下面简单介绍相关的概念(分组的名称。。);
在因特网协议栈出现以前,OSI模型是ISO组织研发的计算机网络结构模型。OSI的模型一共有7层,从下到上依次为:物理层,链路层,网络层,传输层,会话层,表示层,应用层。相比因特网体系结构,OSI多了两层(其实是因特网体系结构少了两层,因为OSI模型出现在前);所谓会话层提供了数据交换定界和同步功能,包括建立检查点和恢复方案的功能;表示层的作用是使同信的程序能够理解交换数据的含义,包括数据压缩和数据加密、数据描述等功能;
因特网将两层的功能留给了开发者自行实现。
一个分组,在不同的层次有不同的称谓,是因为它们经过每一层的时候就被该层封装上了属于该层的相关信息,也就是前面提到的必要信息;于是,每一分层的分组有两种类型的字段:首部字段和有效负载;其中有效负载即为来自上一层的分组数据,而首部字段就是该层加上的必要信息;分组不断被封装以实现各层协议规定的相关功能;