length * 4
的字节数. 因此IP头部最大长度是60字节。TOS
字段, 和1位保留字段(必须置为0). 4位TOS分别表示: 最小延时, 最大吞吐量, 最高可靠性, 最小成本. 这四者相互冲突, 只能选择一个. 对于ssh/telnet这样的应用程序, 最小延时比较重要; 对于ftp这样的程序, 最大吞吐量比较重要。MTU
, IP模块就会丢弃报文.;第三位表示更多分片, 如果分片了的话, 最后一个分片置为0, 其他是1, 类似于一个结束标记。CRC
进行校验, 来鉴别头部是否损坏。还是老问题:IP数据报如何将有效载荷与报头进行分离呢?
其实很简单,在报头字段中16位总长度就可以拿到IP数据报整个报文大小,而4位首部长度可以拿到报头大小,所以我们根据这两个字段就可以很轻易的将报头与有效载荷进行分离。
这里要讲解下协议头格式中第二行字段:16位标识,3位标志以及13位片偏移。
首先要明确以太网帧中的数据长度规定最小46字节,最大1500字节,这也就限制了在传输层向下进行交付时IP必须要将大于1500字节的数据进行分片,当传输当目标主机的IP是要能够组装(和未分片是一样),而16位标识则是唯一的标识主机发送的报文,不同报文该标识是不同的;我们可以使用下面简单的方式来组织分片:
IP地址分为两个部分:网络号和主机号
不同的子网其实就是把网络号相同的主机放到一起。如果在子网中新增一台主机, 则这台主机的网络号和这个子网的网络号一致, 但是主机号必须不能和子网中的其他主机重复。通过合理设置主机号和网络号, 就可以保证在相互连接的网络中, 每台主机的IP地址都不相同。
那么问题来了, 手动管理子网内的IP, 是一个相当麻烦的事情。
有一种技术叫做DHCP
, 能够自动的给子网内新增主机节点分配IP地址, 避免了手动管理IP的不便。一般的路由器都带有DHCP功能,因此路由器也可以看做一个DHCP服务器。
过去曾经提出一种划分网络号和主机号的方案, 把所有IP 地址分为五类:
其中:
A
类 0.0.0.0到127.255.255.255
B
类 128.0.0.0到191.255.255.255
C
类 192.0.0.0到223.255.255.255
D
类 224.0.0.0到239.255.255.255
E
类 240.0.0.0到247.255.255.255
上面常用的IP地址划分大家一定要记牢。
随着Internet的飞速发展,这种划分方案的局限性很快显现出来,大多数组织都申请B类网络地址, 导致B类地址很快就分配完了, 而A类却浪费了大量地址。例如, 申请了一个B类地址, 理论上一个子网内能允许6万5千多个主机,A类地址的子网内的主机数更多。然而实际网络架设中, 不会存在一个子网内有这么多的情况,因此大量的IP地址都被浪费掉了。
针对这种情况提出了新的划分方案, 称为CIDR
(Classless Interdomain Routing):
我们来举个例子:
假定某个IP地址为140.252.20.68,子网掩码为255.255.255.0,求网络号及其子网的地址范围?
网络号=140.252.20.68 & 255.255.255.0 = 140.252.20.0;
将网络号后面0的二进制位从全0变为全1就是子网的主机号范围。
要求子网的地址范围我们可以采用下面的方式来进行计算:首先我们看子网掩码中0的二进制个数有多少个,不难得出此时有8个,而将这8个二进制数从全0变到全1就是子网的主机号。所以我们求得子网的地址范围就为140.252.20.0~140.252.20.255
特殊的IP地址:
我们接下来做几个题巩固一下:
- 如果将网络IP段40.15.128.0/17划分成2个子网,则第一个子网IP段为40.15.128.0/18,则第二个子网为()
A 40.15.129.0/18
B 40.15.128.128/18
C 40.15.192.0/17
D 40.15.192.0/18
分析:根据题目给的划分前网络IP段我们可以知道前17位为网络号,划分后前18位为网络号,这里划分成两个子网,我们只需要用1(21=2)位来表示即可,也就是第18位我们只需要用0和1来区分子网就可以了,因为0已经用了,所以我们就将第18位得二进制数改为1,转化为十进制就是D选项。
- 下列选项中,属于"10.174.20.176/28"该网段的有效IP地址是()
A 10.174.20.174
B 10.174.20.186
C 10.174.20.191
D 10.174.20.192
176转化为二进制为:10110000 根据子网掩码我们可以计算出网络号为:10.174.20.176
所以子网的地址范围为0000 1010 1010 1110 0001 0100 1011 0000 到 0000 1010 1010 1110 0001 0100 1011 1111 转化为十进制就是:10.174.20.176~10.174.20.191 ,但是题目要求的是有效的IP地址,所以10.174.20.176与10.174.20.191都得舍去,最终区间再【10.174.20.177,10.174.20.190】
综上,选择答案B。
- 下列哪个IP地址可以分配给一台计算机()
A 256.1.3.4
B 197.3.11.0
C 199.5.89
D 11.15.33.235
分析:A,256明显不对,故排除;B,通过对该IP地址的观察这是一个C类的IP地址,我们知道C类的IP地址最后一个字节(也就是最后8个比特位)表示的是主机号,所以当最后8个比特全为0表示的是网络号并不能够分配给计算机使用,所以B排除;C,格式错误,故排除;D,符合题目要求。
以下哪个ip不和10.11.12.91/28处于同一个子网()
A 10.11.12.85/28
B 10.11.12.88/28
C 10.11.12.94/28
D 10.11.12.97/28
分析:
- 某公司申请到一个C类IP地址,但要连接6个的子公司,最大的一个子公司有26台计算机,每个子公司在一个网段中,则子网掩码应设为()
A 255.255.255.192
B 255.255.255.128
C 255.255.255.0
D 255.255.255.224
分析:在做这个题之前有一个结论需要大家记住:子网掩码按位取反得到的结果+1就是该子网中的主机个数。其实这个结论我们很好证明,我们求解子网中主机号的范围时就是将子网掩码后面的所有0从全0变成了全1,所以我们得到的主机号就是从全0到全1,为什么要加1呢?很简单,举一个栗子从0000~1111一共是15+1个主机号。
我们知道, IP地址(IPv4)是一个4字节32位的正整数. 那么一共只有2的32次方个IP地址, 大概是43亿左右. 而TCP/IP协议规定, 每个主机都需要有一个IP地址.这意味着, 一共只有43亿台主机能接入网络么?
实际上, 由于一些特殊的IP地址的存在, 数量远不足43亿; 另外IP地址并非是按照主机台数来配置的, 而是每一个网卡都需要配置一个或多个IP地址.CIDR
在一定程度上缓解了IP地址不够用的问题(提高了利用率, 减少了浪费, 但是IP地址的绝对上限并没有增加), 仍然不是很够用,这时候有三种方式来解决:
动态分配IP地址(DHCP)
: 只给接入网络的设备分配IP地址. 因此同一个MAC地址的设备, 每次接入互联网中, 得到的IP地址不一定是相同的;NAT技术
(后面会重点介绍);IPv6
: IPv6并不是IPv4的简单升级版. 这是互不相干的两个协议, 彼此并不兼容; IPv6用16字节128位来表示一个IP地址; 但是目前IPv6还没有普及。如果一个组织内部组建局域网,IP地址只用于局域网内的通信,而不直接连到Internet上,理论上使用任意的IP地址都可以,但是RFC1918规定了用于组建局域网的私有IP地址:
10.*
,前8位是网络号,共16,777,216个地址;172.16.
到172.31.
,前12位是网络号,共1,048,576个地址;192.168.*
,前16位是网络号,共65,536个地址;包含在这个范围中的, 都成为私有IP, 其余的则称为全局IP(或公网IP)
比如下面这张图:
一个路由器可以配置两个IP地址, 一个是WAN口IP
, 一个是LAN口IP
(子网IP),路由器LAN口连接的主机, 都从属于当前这个路由器的子网中,不同的路由器, 子网IP其实都是一样的(通常都是192.168.1.1),子网内的主机IP地址不能重复. 但是子网之间的IP地址就可以重复了。
每一个家用路由器, 其实又作为运营商路由器的子网中的一个节点,这样的运营商路由器可能会有很多级, 最外层的运营商路由器, WAN口IP就是一个公网IP了。子网内的主机需要和外网进行通信时, 路由器将IP首部中的IP地址进行替换(替换成WAN口IP), 这样逐级替换, 最终数据包中的IP地址成为一个公网IP。这种技术称为NAT
(Network Address Translation 网络地址转换)。
如果希望我们自己实现的服务器程序, 能够在公网上被访问到, 就需要把程序部署在一台具有外网IP的服
务器上,这样的服务器可以在阿里云/腾讯云上进行购买。
那么当路由器替换IP首部中的源IP地址时,通过逐级替换后能够从公网IP返回到上一层(图中就是广域网的位置),但是却没法将数据发送到具体是由哪个局域网上某台主机发送的,这时应该怎么办呢?
其实在NAT地址转换的过程中,不仅转换了IP地址,而是将IP+端口号
作为唯一的标识进行转换。
比如下面:
我们使用IP+端口号
作为kv结构进行转换,当在不同局域网但是使用的端口号相同时生成的标识是不同的,所以就能够识别出在哪一个局域网。
NAT技术的缺陷:
通俗来讲:路由就是在复杂的网络结构中, 找出一条通往终点的路线。
路由的过程, 就是这样一跳一跳(Hop by Hop) “问路” 的过程,所谓 “一跳” 就是数据链路层中的一个区间,具体在以太网中指从源MAC地址到目的MAC地址之间的帧传输区间。
在上述过程中,数据链路层实现某一区间的通信,而IP协议实现从其实到最终目的的通信(点对点)
当IP数据包, 到达路由器时, 路由器会先查看目的IP,路由器决定这个数据包是能直接发送给目标主机, 还是需要发送给下一个路由器,依次反复, 一直到达目标IP地址。
那么如何判定当前这个数据包该发送到哪里呢? 这个就依靠每个节点内部维护一个路由表。
路由表可以使用route
命令查看,如果目的IP命中了路由表, 就直接转发即可,路由表中的最后一行,主要由下一跳地址和发送接口两部分组成,当目的地址与路由表中其它行都不匹配时,就按缺省路由条目规定的接口发送到下一跳地址。
比如下面某主机上的网络接口配置和路由表:
这台主机有两个网络接口,一个网络接口连到192.168.10.0/24网络,另一个网络接口连到192.168.56.0/24网络。
路由表的Destination
是目的网络地址,Genmask
是子网掩码,Gateway
是下一跳地址,Iface
是发送接口,Flags
中的U标志表示此条目有效(可以禁用某些条目),G标志表示此条目的下一跳地址是某个路由器的地址,没有G标志的条目表示目的网络地址是与本机接口直接相连的网络,不必经路由器转发。
转发过程例1: 如果要发送的数据包的目的地址是192.168.56.3
跟第一行的子网掩码做与运算得到192.168.56.0,与第一行的目的网络地址不符,再跟第二行的子网掩码做与运算得到192.168.56.0,正是第二行的目的网络地址,因此从eth1接口发送出去;由于192.168.56.0/24正是与eth1接口直接相连的网络,因此可以直接发到目的主机,不需要经路由器转发。
转发过程例2: 如果要发送的数据包的目的地址是202.10.1.2
依次和路由表前几项进行对比, 发现都不匹配,按缺省路由条目, 从eth0接口发出去, 发往192.168.10.1路由器,由192.168.10.1路由器根据它的路由表决定下一跳地址。
DNS是一整套从域名映射到IP的系统。
TCP/IP中使用IP地址和端口号来确定网络上的一台主机的一个程序,但是IP地址不方便记忆,于是人们发明了一种叫主机名的东西, 是一个字符串, 并且使用hosts文件来描述主机名和IP地址的关系。
最初, 通过互连网信息中心(SRI-NIC)来管理这个hosts文件的,如果一个新计算机要接入网络, 或者某个计算机IP变更, 都需要到信息中心申请变更hosts文件,其他计算机也需要定期下载更新新版本的hosts文件才能正确上网。
这样就太麻烦了, 于是产生了DNS系统,一个组织的系统管理机构, 维护系统内的每个主机的IP和主机名的对应关系,如果新计算机接入网络, 将这个信息注册到数据库中;用户输入域名的时候, 会自动查询DNS服务器, 由DNS服务器检索数据库, 得到对应的IP地址。
至今, 我们的计算机上仍然保留了hosts文件. 在域名解析的过程中仍然会优先查找hosts文件的内容,我们可以使用下面命令来查看:
cat /etc/hosts
域名简介:
主域名是用来识别主机名称和主机所属的组织机构的一种分层结构的名称,域名使用 .
连接
例如下面:
www.baidu.com
下面出一个面试会经常问道的题目:
浏览器中输入url后, 发生的事情?
这是一道非常经典的问题,没有固定的答案,总的来说说得越详细越好,博主下面给一个参考:
1️⃣用户输入URL:用户在浏览器的地址栏中输入URL(统一资源定位符),这是他们希望访问的网页的地址。
2️⃣DNS解析:浏览器首先需要解析URL中的主机名部分,以确定目标服务器的IP地址。这个过程称为DNS解析。如果浏览器有缓存,它可能首先查看本地缓存以获取IP地址。如果不在缓存中,浏览器将向本地DNS服务器发出请求,以获取目标主机的IP地址。本地DNS服务器可以向根DNS服务器、顶级域名服务器和权威DNS服务器逐级查询,最终找到目标主机的IP地址。
3️⃣建立TCP连接:一旦浏览器获得了目标服务器的IP地址,它将尝试建立到该服务器的TCP连接。这个过程通常涉及三次握手,即浏览器向服务器发送一个连接请求,服务器确认请求并回复,然后浏览器再次确认。一旦建立了TCP连接,数据可以在浏览器和服务器之间进行可靠的双向通信。
4️⃣浏览器发起HTTP请求:一旦TCP连接建立,浏览器会构建一个HTTP请求,该请求包括用户想要获取的特定页面的信息。HTTP请求通常包括请求方法(如GET、POST等)、请求头部和请求主体。
5️⃣服务器处理请求:服务器接收到浏览器发送的HTTP请求后,会根据请求的内容执行相应的操作。这可能涉及查询数据库、处理业务逻辑、生成动态内容等。
6️⃣服务器发送HTTP响应:服务器会生成一个HTTP响应,该响应包含请求的内容(通常是HTML页面)、状态码(表示请求是否成功、重定向等)以及响应头部信息。服务器还将此HTTP响应发送回浏览器。
7️⃣接收和渲染页面:一旦浏览器收到HTTP响应,它会解析响应的内容,并根据HTML、CSS和JavaScript等数据渲染页面。这包括呈现文本、图像、链接和其他媒体,以及执行JavaScript代码。
8️⃣页面展示:最终,浏览器将渲染后的页面呈现给用户,用户可以与页面进行交互。
9️⃣页面缓存:浏览器通常会将页面的一些资源(如图像、样式表、脚本等)缓存,以便在用户再次访问相同页面时能够更快地加载。
路由器往往都具备NAT设备的功能, 通过NAT设备进行中转, 完成子网设备和其他子网设备的通信过程,
代理服务器看起来和NAT设备有一点像。客户端代理服务器发送请求, 代理服务器将请求转发给真正要请求的服务器;服务器返回结果后, 代理服务器又把结果回传给客户端。
么NAT和代理服务器的区别有哪些呢?