独立模式:计算机之间相互独立
在早期的时候,计算机之间是相互独立的,此时如果要多个计算机协同完成某种业务,那么就只能等一台计算机处理完后再将数据传递给下一台计算机,然后下一台计算机再进行相应的业务处理,效率非常低下。
网络互联:多台计算机连接在一起,完成数据共享
这时就有人设法将这些计算机连接在一起,当某个业务需要多台计算机协同完成时,就可以将共享的数据放到服务器中进行集中管理,此时每个计算机就都能获取到这些共享的数据,所以各个业务在处理时就能随时进行切换了。
局域网LAN:计算机数量更多了,通过交换机和路由器连接在一起。
后来这样的网络雏形逐渐发展,连入这个网络中得到机器变得越来越多,于是就出现了局域网的概念。
在局域网中有一种设备叫做交换机,交换机主要完成局域网内数据的转发工作,也就是在局域网内将数据从一台主机转发给另一台主机。各个局域网之间通过路由器连接起来,路由器主要完成数据的路由转发工作。
广域网WAN:将远隔千里的的计算机都连在一起。
各个局域网之间通过路由器连接在一起,便组成了一个更大的网络结构,我们将其称之为广域网。实际局域网和广域网是一种相对的概念,我们也可以将广域网看作一个很大的局域网。
我们可能还听过城域网和校园网这样的概念,城域网实际就是在一个城市范围内所建立的计算机通信网,而校园网对应的就是在一个校园范围内所建立的计算机通信网。城域网和校园网实际也是一种相对的概念,我们都可以将它们看作一个大的局域网。
区分广域网和局域网
在一般情况下,可以通过是否有路由器来初步区分一个网络是广域网还是局域网。理论上来说,如果一个网络中存在路由器,则该网络可以连接到其他局域网和互联网上,从而形成了广域网。而如果一个网络中没有路由器,则之鞥呢与同一局域网内的设备进行通信,因此可以被视为局域网。这种区分方法可能并不准确,比如在一些大型企业和学习中,可能会使用多个路由器来分隔不同部门或楼层的网络。这种情况下,整个网络仍然可以被视为一个局域网,而不是广域网。
我们通常在手机或者电脑上使用的APP,比如抖音,淘宝等,这些APP都是在应用层的。用户在应用层的各种请求最终会下达给操作系统,操作系统内除了
进程管理,文件管理,内存管理,驱动管理之外,还有一个内嵌的软件协议栈,协议栈将用户的数据进行各种封包后,通过网卡将数据传递到网络当中,数据在网络内部经过各种路由转发,最终将数据传送到了目标服务器。
目标服务器本身也是一台计算机,该计算机的操作系统就是Linux,而我们在访问目标服务器时使用的可能是Windows,安卓等操作系统。此外,对端服务器也有自己的协议栈,对端服务器将拿到的数据通过协议栈进行各种解包操作后上交给应用层,在对端服务器的应用层就有一个对应的软件服务器,比如抖音服务器,快手服务器,淘宝服务器等,软件服务器内部对收到的用户请求进行各种分析处理之后,再将对应的数据以相同方式返回给用户。
需要注意的是,不同操作系统的进程管理,文件管理,内存管理,驱动管理的实现方式可能是不一样的,比如Windows和Linux实现多线程的方式是不一样的,Linux当中的线程是用轻量级进程模拟的,而Windows当中是有真正意义上的线程的。
而协议栈是网络标准组织定义的,是具有全球性性质的,所有的操作系统都必须支持。也就是说,虽然客户端和服务器可能使用的是不同种类的操作系统,但每个系统实现网络协议栈的方法包括各种细节都是一样的,因此双方对数据进行封包和解包操作都是一样的。
我们知道的是,操作系统中包含进程管理,文件管理,内存管理,驱动管理者四大模块,操作系统层与用户层之间有着系统调用层,操作系统再往下是驱动层,驱动层再往下就是各种硬件设备了。
操作系统中的进程管理,文件管理,内存管理,驱动管理是隶属于系统部分的,系统部分的核心工作就是管理好各种软硬件资源,对上提供一个良好稳定的运行环境。
操作系统中除了有着四大管理模块,还与网络协议栈有着密切的关系。网络协议栈主要负责数据的通信,其自顶向下可分为四层,分别是应用层,传输层,网络层,数据链路层。
网络协议栈各部分所处位置:
网络协议栈的其他分层方法
在有些书上可能将网络协议栈分为了五层,这多出来的一层就是最低的物理层,物理层主要就是利用传输介质为数据链路层提供物理连接,实现比特流的透明传输,是与硬件强相关的。
其次,有的书还会将数据链路层和物理层统称为网络接口层,也有人会将网络层叫做网际层。
将通信过程进行抽象
我们可以将通信过程进行抽象,可以将通信理解成不是两台机器在通信,而是这两台机器当中的网络协议栈之间在进行通信。
数据链路层和物理层
要实现通信我们首先要能够将数据发送出去,而数据链路层和物理层就是负责数真正的发送过程的。
网络层
在数据链路层和物理层的支持下,现在能够将数据发送出去了,但是我们还应该知道数据应该往哪里发,而网络层完成的就是数据转发,解决了数据区哪里的问题。
传输层
现在有了发送数据的能力,也知道数据往哪里发,但是我们并不难保证发出去的数据能够成功地到达对端主机,比如在传输过程中可能会出现丢包或者对端主机关机,甚至对端服务器出错,导致数据传送出现问题。而传输层的工作就是处理传输时遇到的问题,主要是保证数据可靠性。
应用层
也就是说,网络协议栈的下三层能够保证把数据交付给对端主机,但现在我们还需要明确的是,我们将数据发送给对端主机的目的是什么,而这就是应用层要解决的问题。应用层需要根据特定的通信目的,对数据进行分析和处理,以达到某种业务性的目的。
因此网络协议栈的下三层主要主要完成的工作就是处理通信细节,而应用层完成的就是某种具有的业务的细节。
因此网络协议栈的顶层应用层对应的就是某种具体的业务细节,而位于应用层之下的各层就对应处理各种通信细节。
实际上,我们在设计协议栈的时候也可以不进行分层,将每个层的功能全部写在一起,将这些小模块合并成一个更大的模块。但这样的设计方式对设计人员的要求就非常高了,设计人员必须能够编写从物理层到应用层的整个通信过程的代码,并且最终设计出来的代码的可维护性和可扩展性是很低的。
层状结构的本质是软件工程上面的解耦,此时层与层之间只有接口的相互调用关系,此时我们就可以让研究不同领域的开发人员编写不同层的代码,最后再将各层的代码联调起来,由于每一层的代码都是对应领域的专业人员编写的,因此代码联调后整体的性能也是很高的。
并且这样的层状结构可以增加代码的可维护性和可扩展性。比如有一天你觉得数据链路层的代码已经无法承担起通信的能力了,那么此时我们就可以用一个新的协议对它进行替换,而其他各层对应的协议都不用换,这就叫做可扩展性。而如果协议栈的某一层出现了问题,我们只要确定了是哪一层出现了问题,就可以直接去对应层去找问题,这就叫做代码的可维护性。
上面我们所说的那些东西都是TCP/IP四层协议的,而最初定的协议叫做OSI七层协议:
TCP/IP是一组协议的代名词,它还包括许多协议,共同组成了TCP/IP协议簇。TCP/IP通讯协议采用了五层的层级结构,每一层都呼叫它的下一层锁提供的网络来完成自己的需求。
与OSI七层模型的对应关系:
可以看到,它们下面几层几乎是没有区别的,操作系统对应的是传输层和网络层,数据链路层和物理层都是对应在驱动层的,而TCP/IP协议当中的应用层就对应到OSI七层协议当中的应用层、表示层和会话层。
一般而言:
但这并不是绝对的,比如很多交换机也实现了网络层的转发,很多路由器也实现了部分传输层的内容(比如端口转发)。
需要明确的是,同一个局域网内的主机是能够进行通信的,因为最初局域网设计的目的,就是为了让局域网内的主机能够进行通信。
当用户要将文件传输给另一台主机,该文件数据需要先通过网络协议栈进行封装:
数据封装完毕之后就可以通过局域网将其发送给对端主机了,而当对端主机收到数据后,对端也需要通过网络协议栈对该数据进行解包和分用:
也就是说,任何一台主机在发送信息之前,该数据都要先自顶向下贯穿协议栈来完成数据的封装,在这个过程中,每一层协议都会添加上对应的报头信息。
而任何一台主机收到数据之后,都要先自底向上贯穿协议栈来完成数据的解包和分用,在这个过程中,每一层协议都会将对应的报头信息提取出来。
数据包的封装和分用
什么是报头?
报头本质是也是一种数据,报头一般是通过位段实现的,因此协议栈的每一层都有一个对应的位段来表示当前层的报头。
数据的封装和解包:
有效载荷
当对端主机收到数据后,需要自底向上贯穿数据站,以此进行数据的解包和分用。在这个解包的过程中,每一层数据只需提取出对应的报头,然后对报头数据进行分析,而剩下的数据交付给上层即可。
每一层协议只关心与当前层相关的报头信息,而剩下的信息交付给上层即可,我们将除当前层报头意外的数据叫做“有效载荷”。
需要注意的是,上层协议在数据封装时添加的报头信息,在下层协议进行数据解包时开来就是有效载荷,比如在应用层对数据封装而添加的应用层报头信息,在传输层,网络层,链路层看来,就是有效载荷。
如何将报头与有效载荷进行分离?
协议栈的每一层都要从数据中提取对应的报头信息,而要将数据中的报头提取出来,首先就要明确报头与有效载荷直接的界限,这样才能将它们进行分离。而每一层添加报头时都是将报头添加到数据的首部的,因此我们只需要知道了报头的大小,就能够将报头和有效载荷进行分离。
获取报头的方法有两种
实际上每个协议都要提供一个方法,让我们获取到报头的大小,这样我们在能在解包时将报头和有效载荷进行分离。
当前层如何得到有效载荷交付给上层的哪一个协议?
网络协议栈的每一层都有多个协议,将报头和有效载荷分离之后,我们如果得知将有效载荷交给上层的哪一个协议呢?
在报头中有对应的字段,表明我们应该将有效载荷交给上层的哪个协议,这就是分用的过程。
协议共性
协议有以下两个共性:
当我们在解包时要将报头与有效载荷分离,当我们分用时要得知将有效载荷交付给上层的哪一个协议。
局域网中传输数据时,该局域网中所有数据都能收到
在一个局域网中,除了当前正在进行通信的A主机和B主机以外,还有其他的主机,那么A主机是如何将数据精准发给B主机呢?
实际上当A主机将数据发给B主机的时候,其他主机也会收到对应的数据,但是它们会识别到这个数据不是发给自己的,于是就把对应的数据丢弃了。
也就是说,在局域网通信的时候,该局域网内所有主机其实都收到了所有被发送的消息,但是只会接收发给自己的数据,不是发给自己的就会丢弃。
什么是碰撞?
当主机A在向主机B发送数据时,其他主机也在通信,并且A主机也可能正在与其他主机进行通信。
但同一局域网内主机在进行相互通信时,使用的都是同一个通信信道,因此如果局域网内的多台主机同时进行通信,此时这些数据直接就可能会相互干扰。
每一个局域网都可以看作是一个碰撞域,如果某个主机发送的数据与其他的数据发生了干扰,我们就可以称这两台主机在该碰撞域内发生了碰撞。
如何判断发送出去的数据发生了碰撞?
刚才提到,主机发送出的数据在该局域网内所有的主机都可以接收到,也包括它自己。这样,它就可以通过将自己发送出的数据与接收到的数据进行对比,如果不相同,则说明发生了数据碰撞。
发生碰撞后是如何进行处理的?
当一个主机发现自己发送出去的数据发生了碰撞,该主机就会执行“碰撞避免”算法,这个算法其实很简单:就是等一段时间之后,再次发送该数据。这也就像现实生活中的两个人同时想要说话的时候,此时对方会说“那你先说吧”,这就是碰撞避免。
需要注意的是,在网络通信压力不大的时候发生碰撞的概率是很小的,我们不要小瞧计算机处理数据的时候和网线传输数据的速度。
每个主机是如果判断数据是否是发给自己的?
每一台计算机都至少配有一张网卡,这张网卡在出厂时就已经内置了一个48位的序列号,我们将这个序列号称之为“MAC”地址,这个MAC地址是全球唯一的。
在局域网中发送的数据实际叫做MAC数据帧,在这个MAC数据帧的报头中会包括两个字段,分别是源MAC地址和目的MAC地址。
在局域网中进行通信的时候,每一个主机在收到一个MAC数据帧之后,都会提取该MAC数据帧的报头,找到目的MAC地址,然后将其与自己的MAC地址进行对比,如果不一样,则会直接将该MAC数据帧丢弃,只有与自己MAC地址一样时,该主机才会将有效载荷交付给上层处理。
两种发送方式:
上面所说的都是同一局域网内的主机之间的通信,那跨局域网的两台主机之间是如何进行通信的呢?
通信标准相同的两个局域网内的主机通信
局域网之间都是通过路由器连接的,因此一个路由器至少能够横跨两个局域网。可以认为,路由器就是局域网内的一台主机,因此路由器可以喝这些局域网内的任意一台主机进行通信。
比如局域网1当中的主机A想要和局域网2中的主机B进行通信,那么主机A可以先将数据发送给路由器,路由器再将数据发送给主机B。
通信标准不同的两个局域网内的主机通信
如果路由器级联的两个局域网采用相同的通信标准,那么通信过程就是上述那么。但是路由器级联的局域网可能采用的是不同的通信标准,比如可能局域网1采用的以太网,局域网2采用的是令牌环网。
由于以太网和令牌环网采用的通信标准是不同的,它们给数据添加报头的形式也是不一样的,因此令牌环网中的主机无法对以太网中发送过来的数据帧进行解包。
路由器可以处理这样的问题,路由器是工作在网络层的一个设备,我们可以认为路由器当中的协议栈是下面这样的。
当数据要从局域网1发送到局域网2时,路由器收到局域网1的数据之后,会将以太网对应的数据帧进行解包,然后将剩下的数据交付给网络层,在网络层对数据进行分析并添加令牌网网对应的报头,然后再将数据发送到局域网2中,此时该数据就能够在令牌环网中传输了。
路由器为什么能够“认路”?
一个路由器可能会级联多个局域网,当路由器需要将一个局域网内的数据发送给另一个局域网时,路由器该如何知道另一个局域网具体是哪个呢?
路由器其实是通过IP地址来确定数据的转发方向的,因特网上的每一个计算机都有一个唯一的IP地址,在数据向下封装时,在网络层封装的报头当中就会包含两个字段,源IP地址和目的IP地址。
当路由器需要将一个局域网内的数据转发到另一个局域网时,在路由器的链路层会将数据对应的链路层报头去掉,然后将有效载荷向上交付给网络层,此时在网络层就可以获取到目的IP地址,然后路由器就会根据该IP地址再路由表中进行查找,最终就能确定该数据发送到哪一个局域网。
使用IP地址可以屏蔽底层的差异
IP地址的存在除了帮助数据“路由”之外,还有一个很重要的作用,那就是屏蔽了底层网络的差异。对于通信主机双方的IP层及往上的协议来说,它们并不需要关心底层使用的是以太网还是令牌环网,它们认为只要填写了源IP地址和目的IP地址就能够将数据发送出去,现在主流的网络也叫做“IP网络”。
屏蔽差异,寻找统一,与其类似的技术还有:
需要注意的是,IP协议有两个版本,分别是IPv4和IPv6。IPv4用32个比特位来标识IP地址,而IPv6用128个比特位表示IP地址。
在Linux中查看自己的IP地址
在Linux中查看自己的MAC地址