学习系统不能忽略硬件,学习网络也不能忽略硬件。
最开始只有一台计算机处理人算力不足的问题。
不同人在不同单位所承担的分工是不一样的,每个人所需要处理的数据不同,而人可以协作。A处理完的数据可以给B处理,B处理完的数据可以给C处理。因此早期处理类似下图。
产生了各种各样的实验室,实验室内部进行网络技术的研发和实验。
单单一个实验室内部互相通信并不足以跨越小范围的物理距离,比如多个实验室之间的通信,因此产生局域网用于小型网络。
局域网通信和跨局域网进行通信存在很多问题。对于局域网来说,其一是采用的局域网通信原理,其二是局域网可以直接通信不需要碰撞检测和碰撞避免。
而对于跨局域网来说,局域网通信原理不适用跨网络,原因其一是主机数量增多导致效率下降,其二是网络路径变长查找目标设备成为问题,包括各种各样的硬件设备如交换机和存储设备的存储空间和算法的适用。
必须要设置一套跨局域网的方法,这个方法是要软硬件结合。比如路由器上的路由查找算法等。
交换机是工作在数据链路层的一个设备,主要工作为数据帧的转发和划分碰撞域。
路由器是工作在网络层的一个设备。
广域网就是局域网的扩展,物理距离相对更远。局域网和广域网其实是相对概念,在更大的范围下,广域网是一个新的局域网。
所谓协议,在哪里都存在。OS内和硬件硬盘也有协议。数据写硬盘上也有协议。一台手机内也有协议。有了网络,还是在传输数据,之前写程序是把数据传到磁盘,传到显示器上,现在不同的地方在于,原本在内部的线变长了,这个线就是网络。线变长了,距离就远了,传输距离远了,可靠性变差了。因此就产生了路由器转发,定位机器,数据翻转或丢失的问题。计算机网络本质上是解决线变长了怎么把数据从一个机器交付给另一个机器,怎么保证没交付错,怎么定位目标,怎么进行可靠性保证,数据没交互错等的问题。因此形成计网这个学科,本质就是线变长了。为了解决上述的问题,引入了协议。
总的为三个问题,效率问题,可靠性问题,定位问题(确认要访问互联网中哪台主机的问题)。
举个协议的具体例子:
在小时候电话费还比较贵的时候,小明和小红远隔千里,接电话一旦接起来就要付费。因此可以约定,响一声让对方回电话,响两声报平安,响三声表示汇款,响四声就接。约定打几声的含义就是协议。
**协议的本质就是约定。**上述的例子是人的约定,而计算机想定义协议,本质就是一堆信息,这堆信息以特定的结构组织起来,双方在通信时先发的信息是协议信息,一旦识别到协议信息就知道要干什么。
计算机通信的时候是用线通信的,计算机之间的传输媒介是光信号和电信号,通过"频率"和"强弱"来表示0和1这样的信息。要想传递各种不同的信息,就需要约定好双方的数据格式。其中网卡就是决定发强信号还是弱信号的。
只要通信的两台主机, 约定好协议就可以了么?
并不是。生活中普通话统一的例子就是。
如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出来, 约定一个共同的标准,大家都来遵守, 这就是网络协议;
操作系统也承担了很大一部分协议的实现,协议这么多,操作系统就要进行管理,就要先描述,再组织
。linux内核是C写的,C中怎么描述一种协议,在技术上就是struct
。协议一定要能被表现为某一种特定的struct
。
struct
可以定义变量,那么传送数据的时候除了数据本身还要传送协议吗?
比如我们买水果,快递有盒子,盒子上有发件人,收件人,邮编,电话。我们只是要快递里的东西,为什么要有盒子,还要贴张纸?直接给水果不行吗?光光有水果,一个学校的人都买各种各样的水果,没有单子就无法确定水果是谁的。快递上的单子本质是为了解决上述的三个问题中的定位(找收件人)和效率问题(发件根据地区分区)和可靠性问题(订单号帮助快递公司查找)。快递单实际上就是一种协议,就是一个约定。我们虽然只买水果,但是实际上收到的东西比水果多,多出来的东西是协议。
比如我们聊天发送“在吗”,实际上主机A给主机B发的信息肯定是比“在吗”多出的一大堆协议信息。
总结:
struct
的形式呈现。“在吗”是数据,报头协议最后一定是一个结构体,可以定义变量,进行填充数据,将两份数据拼成一个数据就是报文,从而转发。
为什么要分层?
类似快餐汉堡,每层分开,制作任何一层都很快,如果要推出新产品更新就很快。在软件工程上这种方式叫解耦,彼此之间不会互相影响,可维护性强,便于分批组装形成新的功能。在计算机网络中分层也是一样的道理,每一层处理特定的任务有特定的功能。即网络的层状结构中每一层都有自己的功能,彼此之间不会互相影响,方便维护。分层最大的好处在于封装。
层和层之间怎么交互?
上层需要使用下层提供的功能,下层需要将收到的数据转发给上层。层和层之间通过每一层接口进行交互,上层同过调用下层的接口进行使用。
比如打电话的例子,可以分成语言层,通信设备层。不管是换上层还是换下层都不会影响其他层。如果实际通信中任何一层出现问题,因为层与层之间相对独立,因此任何一层出问题是不会影响另一层的。
OSI(Open System Interconnection,开放系统互连)七层网络模型称为开放式系统互联参考模型,是一个逻辑上的定义和规范,其把网络从逻辑上分为了7层。每一层都有相关、相对应的物理设备。但是,它既复杂又不实用。
OSI模型
:
分层名称 | 功能 | 每层功能概览 |
---|---|---|
应用层 | 针对特定应用的协议 | 针对每个应用的协议 |
表示层 | 设备固有数据格式和网络标准数据格式的转换 | 接收不同表现形式的信息 |
会话层 | 建立和断开通信连接,信道的问题 | 何时建立连接,何时断开连接以及保持多久的连接 |
传输层 | 保证数据传输的稳定性,可靠性,效率。 | 是否有数据丢失 |
网络层 | 解决的是数据的跨网络传输。路由器 | 经过哪个路由传递到目标地址 |
数据链路层 | 解决的是局域网通信的问题。交换机 | 数据帧与比特流之间的转换。 |
物理层 | 以“0”“1”代表电压的高低、灯光的闪灭,界定连接器和网线的规格。解决电气特性。 | 比特流与电子信号之间的转换 |
TCP/IP是一组协议的代名词,它还包括许多协议,组成了TCP/IP协议簇。
TCP/IP通讯协议采用了5层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求。
物理层: 负责光/电信号的传递方式。比如现在以太网通用的网线(双绞线)、早期以太网采用的的同轴电缆 (现在主要用于有线电视)、光纤, 现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等。集线器(Hub)工作在物理层(类似加油站)。调制解调器(Model)进行数字信号和模拟信号的转换。
数据链路层: 负责设备之间的数据帧的传送和识别。例如网卡设备的驱动(驱动属于软件)、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作。有以太网、令牌环网,无线LAN等标准。交换机(Switch)工作在数据链路层。
网络层: 负责地址管理和路由选择。 例如在IP协议中, 通过IP地址来标识一台主机, 并通过路由表的方式规划出两台主机之间的数据传输的线路(路由)。路由器(Router)工作在网路层。
传输层: 负责两台主机之间的数据传输。如传输控制协议 (TCP), 能够确保数据可靠的从源主机发送到目标主机。
应用层: 负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等。我们的网络编程主要就是针对应用层。
物理层我们考虑的比较少. 因此很多时候也可以称为 TCP/IP四层模型
OSI七层模型和TCP/IP分层模型最主要的区别
TCP/IP模型把OSI七层模型的上三层模型会话表示应用层压缩成一个应用层。
一般而言对于一台主机:
对于一台路由器, 它实现了从网络层到物理层;
对于一台交换机, 它实现了从数据链路层到物理层;
对于集线器, 它只实现了物理层。
两台计算机通过TCP/IP协议通讯的过程如下所示:
下三层为通信细节:包括发什么数据,什么时候发,怎么发,丢包怎么处理,要不要重传,怎么重传。
上层:只关心发什么数据,对方收到没有。
规律:
mac
地址(网卡硬件地址/序列号),全球唯一。局域网单对单通信:mac
报头中指定对应mac地址
,在不发生碰撞情况下,所有主机分析确认是否发送给自己,只有目标主机会向上交付。
局域网广播通信:将目标主机设置为一个约定好的在局域网中都不存在的mac
地址,所有主机约定其代表广播地址,所有主机都会向上交付,广播地址一般设置为0xfffffff
。
因此如果局域网主机很多,碰撞概率很大。如果局域网中主机就是特别多,怎么进行划分碰撞域?交换机的作用就是当某一个片区发生碰撞,这个碰撞报文就不用再转发了。
黑局域网就只要往局域网塞垃圾数据,其他主机一发就会发生碰撞。但是该做法会被mac
帧的碰撞避免算法检测。
可以理解成,全球的互联网都叫做IP网络,IP把所有的局域网都封装了一下,所有的网络统一可以看成IP网络,这是一种虚拟化技术。比如linux下的VFS虚拟文件系统,进程地址空间,IP同理通过封装一层软件(驱动软件)层,摒弃了底层局域网的网络标准差异。上层认为底层的协议都是IP协议。
左侧源mac地址是A主机mac地址,目标mac地址是路由器mac地址。经过一次路由转发,源mac地址变成路由器的右边接口/网卡,目的主机B变成目标mac。
源IP和目标IP并没有变化。
**可以发现存储着两套地址,目的IP指明了方向,下一跳决定了如何一跳一跳达到目的IP。**具体达到目的地的过程之后再谈。
下图为数据封装的过程:
下图为数据分用的过程:
IP协议有两个版本, IPv4和IPv6,没有特殊说明的, 默认都是指IPv4。
私有IP是可以重复的。公网IP是不能重复的。
IPV6是128位。
ifconfig
inet
:在局域网中对应的ip地址,云服务器可以通过xshell看到公网ip
netmask
:子网掩码,和inet进行按位与获得网段。
broadcast
:mac地址有广播,ip地址也有广播
inet6
:ipv6相关信息
ehter
:以太网
txqueuelen
:底层网络中当前收到了多少数据
RX
:收到的信息
TX
:发送的消息
lspci
作用:查看当前在pci
主板中挂接的硬件设备。通常用来确认驱动是否安装。
网络转发的过程可不可以直接从应用层到对方的应用层?可以不可以从IP层到对方的IP层?不行。所有的数据都必须在物理层上跑,笔记本要把数据交给路由器,先把数据交给网卡,网卡把数据给网线,网线传送到路由器。
网络通信的框架过程:
其实是一个不断下楼和上楼的过程。