目录
网络存在的意义
网络发展
网络在哪里?
网络是分层的
理解分层
软件可以分层
网络协议栈也是层状结构
认识协议
协议是什么
协议分层
网络传输需要解决的四个问题
OSI七层模型(了解为主)
TCP/IP五层(或四层)模型
网络传输基本流程
局域网通信
什么是报头
位段变量定义了一个报头
报头和有效载荷
报头中有些什么
以太网和令牌环网
跨网络通信
路由器怎么能认路
数据包封装和分用
网络中的地址管理
认识IP地址
认识MAC地址
本篇博客是博主有关网络学习的第一篇博客,看完本文你能了解到:
站在系统的角度,理解网络到底是个啥;
了解网络的基本结构;
了解网络协议的意义, 重点理解TCP/IP五层结构模型;
学习网络传输的基本流程, 理解封装和分用;
由于是刚刚开始学习网络,因此具体的协议我会在后面的博客中详谈,本文主要是给大家搭建起一个整体的框架,部分内容更多的是基于感性的认知。全是概念,下篇博客将开启网络套接字的使用,在Linux上通过代码创建我们自己的服务器。
提高数据交互的效率
众所周知,计算机最初是美国军方用于计算弹道轨迹的,在这些先进的设备流入高校后,高校内部对于计算机的使用就有数据研究的需求和沟通的需求,为了实现高效的协作,网络便应运而生了,可以说,网络存在的最重要的意义就是提高了数据交互的效率。
独立模式: 计算机之间相互独立;
网络互联: 多台计算机连接在一起, 完成数据共享
局域网LAN: 计算机数量更多了, 通过交换机和路由器连接在一起
路由器:帮助我们实现跨网络转换
猫:我们想要上网往往都会需要安装猫,猫又叫做调制解调器,所谓调制,就是把数字信号转换成电话线上传输的模拟信号(更适合远距离传输);解调,即把模拟信号转换成数字信号。
广域网WAN: 将远隔千里的计算机都连在一起
所谓 "局域网" 和 "广域网" 只是一个相对的概念。比如我们国家的广域网,其实也可以看作是一个较大的局域网。
网络的发展我们也大致清楚了,那么我们所说的网络到底在哪里呢?
这里的网络,指的是网络协议栈。它是一个软件,贯穿体系结构的。
网络在计算机体系结构的哪里呢?
其中传输层和网络层就是所谓的TCP/IP协议栈,是属于OS的一部分。
软件设计方面的优势,低耦合。
分层的依据:功能较集中,耦合度高的模块,高内聚。
每一层都解决特定的问题。
以我们常用的STL为例,我们使用其各种容器的接口调用时,并不需要关心其底层的实现,这事实上就形成了分层。
网络也可以算的上是软件,因而网络协议栈是层状结构也就不足为奇了。
"协议" 是一种约定.
计算机之间的传输媒介是光信号和电信号. 通过 "频率" 和 "强弱" 来表示 0 和 1 这样的信息. 要想传递各种不同的信息, 就需要约定好双方的数据格式。
计算机生产厂商有很多; 计算机操作系统, 也有很多; 计算机网络硬件设备, 还是有很多; 如何让这些不同厂商之间生产的计算机能够相互顺畅的通信?
这时需要有人站出来(一般是行业的龙头老大), 约定一个共同的标准, 大家都来遵守, 这就是网络协议;
比如华为所提出的5G标准。
以打电话为例子:
在这个例子中, 我们的协议只有两层; 但是实际的网络通信会更加复杂, 需要分更多的层次.
分层最大的好处在于 "封装" ,即软件设计时常说的高内聚低耦合。分层让我们更换一层的协议时不需要修改其他层的协议。
OSI(Open System Interconnection,开放系统互连)七层网络模型称为开放式系统互联参考模型,是一个逻辑上的定义和规范;
把网络从逻辑上分为了7层. 每一层都有相关、相对应的物理设备,比如路由器,交换机;
OSI 七层模型是一种框架性的设计方法,其最主要的功能使就是帮助不同类型的主机实现数据传输;
它的最大优点是将服务、接口和协议这三个概念明确地区分开来,概念清楚,理论也比较完整. 通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯;
但是, 它既复杂又不实用; 所以我们按照TCP/IP四层模型来讲解(去掉物理层是四层)。
TCP/IP是一组协议的代名词,它还包括许多协议,组成了TCP/IP协议簇.
TCP/IP通讯协议采用了5层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求。
物理层: 负责光/电信号的传递方式. 比如现在以太网通用的网线(双绞 线)、早期以太网采用的的同轴电缆(现在主要用于有线电视)、光纤, 现在的wififi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等. 集线器(Hub)工作在物理层.
数据链路层: 负责设备之间的数据帧的传送和识别. 例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作. 有以太网、令牌环网, 无线LAN等标准. 交换机(Switch)工作在数据链路层.
网络层: 负责地址管理和路由选择. 例如在IP协议中, 通过IP地址来标识一台主机, 并通过路由表的方式规划出两台主机之间的数据传输的线路(路由). 路由器(Router)工作在网路层.
传输层: 负责两台主机之间的数据传输. 如传输控制协议 (TCP), 能够确保数据可靠的从源主机发送到目标主机.
应用层: 负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等. 我们的网络编程主要就是针对应用层。
物理层我们考虑的比较少. 因此很多时候也可以称为 TCP/IP四层模型.
一般而言
对于一台主机, 它的操作系统内核实现了从传输层到物理层的内容;
对于一台路由器, 它实现了从网络层到物理层;
对于一台交换机, 它实现了从数据链路层到物理层;
对于集线器, 它只实现了物理层;
但是并不绝对. 很多交换机也实现了网络层的转发; 很多路由器也实现了部分传输层的内容(比如端口转发);
从上图,我们可以简单的看出在同一个网段内的两台主机进行信息传输时的流程。数据传到对应层时,都会添加上对应层的报头(首部信息)。
类似快递单
我们寄快递时,需要贴上快递单来标识各种信息。
报头中的数据,能够来指导当前层进行某种协议决策。
Linux操作系统是用C语言写的,报头使用到了位段。
上图简单模拟了添加报头和去掉报头的过程。
几乎每一层协议的报头都要包含两种字段:
当前报文的有效载荷要交给上层的哪一个协议。
几乎每个报头都要明确报头和有效载荷的边界。
局域网中任何时刻都只能有一台主机在向局域网中发送消息
网络是共享资源
主机a向主机f发消息时,实际上该网络上的所有机器都能接收到该消息,发现自己不是该消息的目标后会直接忽略。
如果有多个主机同时向网络中发送数据,可能会造成数据碰撞的问题。
每个主机应该有避免碰撞问题的算法。
每个主机应该有检测碰撞的能力。
以太网和令牌环网的区别之一就在于检测碰撞的方法上:
以太网:
主机向网络中发送消息时,自己也会从中收到一份,通过对比来判断是否发生了碰撞,如果发生碰撞就重新发送一份。
令牌环网:
网络中只有一个主机持有令牌,持有令牌的主机才能发消息到网络中。(类似互斥锁)
一种攻击局域网的方式
相信了解了上面的内容,你一定知道了方法,只要我们绕过机器的防碰撞功能,不断向网络中发送垃圾数据,就能造成网络的瘫痪了。
抓包工具
因为网络是共享的,虽然我们的机器会忽视掉不是发送给我们的信息,但通过抓包工具,我们还是能够拿到信息的,不过不用太担心,因为现在我们在网上的数据都是经过加密处理的。
跨网段的主机的文件传输. 数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器.
通过路由器,我们实现了以太网协议到令牌环网协议的转换,由此实现了跨网络的通信。
由此,自IP层往上,我们是看不到底层网络的差异的,通过这种设计,我们能够忽略底层的差异,实现不同网络间的大一统。
我们在网络中发送的信息中有着两套地址:
起始点 IP地址 ------- 目的地(从哪来到哪里去) IP地址
上一个地点MAC地址 ------- 将要前去的地方 MAC地址
不同的协议层对数据包有不同的称谓,在传输层叫做段(segment),在网络层叫做数据报 (datagram),在链路层叫做帧(frame).
应用层数据通过协议栈发到网络上时,每层协议都要加上一个数据首部(header),称为封装(Encapsulation).
首部信息中包含了一些类似于首部有多长, 载荷(payload)有多长, 上层协议是什么等信息.
数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部, 根据首部中的 "上层协议字段" 将数据交给对应的上层协议处理
下图为数据封装的过程:
了解过之前内容的你应该很容易理解了。
IP协议有两个版本, IPv4和IPv6. 我们整个的课程, 凡是提到IP协议, 没有特殊说明的, 默认都是指IPv4IP地址是在IP协议中, 用来标识网络中不同主机的地址;
对于IPv4来说, IP地址是一个4字节, 32位的整数;
我们通常也使用 "点分十进制" 的字符串表示IP地址, 例如 192.168.0.1 ; 用点分割的每一个数字表示一个字节, 范围是 0 - 255;
MAC地址用来识别数据链路层中相连的节点;
长度为48位, 及6个字节. 一般用16进制数字加上冒号的形式来表示(例如: 08:00:27:03:fb:19)
在网卡出厂时就确定了, 不能修改. mac地址通常是唯一的(虚拟机中的mac地址不是真实的mac地址, 可能会冲突; 也有些网卡支持用户配置mac地址).