《计算机网络-自顶向下方法》读书笔记-网络层篇

《计算机网络-自顶向下方法》读书笔记-网络层篇


网络层服务

从发送主机向接收主机传送数据段(segment )
发送主机:将数据段封装到数据报(datagram )中

接收主机:向传输层交付数据段(segment )

每个主机和路由器都运行网络层协议

路由器检验所有穿越它的IP数据报的头部域

  • 决策如何处理IP数据报

网络层核心功能-转发与路由

转发:将分组从路由器的输入端口转移到合适的输出端口
路由:确定分组从源到目的经过的路径

路由算法(协议)确定通过网络的端到端路径
转发表确定在本路由器如何转发分组

网络层核心功能-连接建立

某些网络的重要功能

  • ATM,帧中继,X.25
    数据分组传输之前两端主机需要首先建立虚拟/逻辑连接

  • 网络设备(如路由器)参与连接的建立

网络层连接与传输层连接的对比

  • 网络层连接: 两个主机之前(路径上的路由器等网络设备参与其中)
  • 传输层连接: 两个应用进程之间(对中间网络设备透明)

网络层服务模型

无连接服务(connection-less service):

  • 不事先为系列分组的传输确定传输路径
  • 每个分组独立确定传输路径
  • 不同分组可能传输路径不同
  • 数据报网络(datagram network )

连接服务(connection service):

  • 首先为系列分组的传输确定从源到目的经过的路径(建立连接)
  • 然后沿该路径(连接)传输系列分组
  • 系列分组传输路径相同
  • 传输结束后拆除连接
  • 虚电路网络(virtual-circuit network )

数据报与虚电路网络

虚电路网络

数据报(datagram)网络与虚电路(virtual-circuit)网络是典型两类分组交换网络

数据报网络提供网络层无连接服务

虚电路网络提供网络层连接服务

类似于传输层的无连接服务(UDP)和面向连接
服务(TCP ),但是网络层服务:

  • 主机到主机服务
  • 网络核心实现

虚电路: 一条从源主机到目的地的主机,类似于电路的路径(逻辑连接)

  • 分组交换
  • 每个分组的传输利用链路的全部带宽
  • 源到目的路径经过的网络层设备共同完成虚电路功能

通信过程:

  • 呼叫建立(call setup)→数据传输→拆除呼叫
    每个分组携带虚电路标识(VCID), 而不是目的主机地址
    虚电路经过的每个网络设备(如路由器),维护每条经过它的虚电路连接状态
    链路、 网络设备资源(如带宽、 缓存等)可以面向VC进行预分配
  • 预分配资源=可预期服务性能
  • 如ATM的电路仿真(CBR)

VC具体实现

每条虚电路包括:
1. 从源主机到目的主机的一条路径
2. 虚电路号( VCID) , 沿路每段链路一个编号
3. 沿路每个网络层设备(如路由器), 利用转发表记录
经过的每条虚电路

沿某条虚电路传输的分组,携带对应虚电路的VCID,而不是目的地址

同一条VC ,在每段链路上的VCID通常不同

路由器转发分组时依据转发表改写/替换虚电路号

转发表

输入接口 输入VC 输出接口 输出VC
1 12 3 22
2 63 1 18
3 7 2 17
1 97 3 87

VC路径上每个路由器都需要维护VC连接的状态

VC进入路由器后,路由器将VC头替换,然后转发出去

数据报网络

网络层无连接
* 每个分组携带目的地址
* 路由器根据分组的目的地址转发分组
* 基于路由协议/算法构建转发表
* 检索转发表
* 每个分组独立选路

路由器转发表

目的地址 输出链路
地址范围1 3
地址范围2 2
地址范围3 2
地址范围4 1

最长前缀匹配优先:
在检索转发表时,优先选择与分组目的地址匹配前缀最长的入口(entry).

IP协议

主机、路由器网络层主要功能:

  • 路径选择
    • RIP
    • OSPF
    • BGP
  • IP协议
    • 寻址规约
    • 数据报(分组)格式
    • 分组处理规约
  • ICMP协议
    • 差错报告
    • 路由器命令

IP数据报格式

首部 描述
版本号(4bit) 描述IP协议的版本号,目前主要有V4和V6两个版本
首部长度(4bit) 以四字节为单位例如: 5 -> IP首部长度为20(5 * 4)字节,不这么计算的话,长度描述根本不够
服务类型(8bit) 指示期望获得哪种类型的服务
1 .只有在网络提供区分服务(DiffServ)时使用
2.一般情况下不使用,通常IP分组的该字段(第2字节)的值为00H
总长度(16bit) IP分组的总字节数(首部 + 数据)
1. 最大IP分组的总长度: 65535B
2.最小的IP分组首部: 20B
3. IP分组可以封装的最大数据:65535 - 20 = 65515B
生存时间TTL(8bit) IP分组在网络中可以通过的路由器数(或跳步数)
1.路由器转发一次分组, TTL减1
2.如果TTL=0,路由器则丢弃该IP分组
协议(8bit) 指示IP分组封装的是哪个协议的数据包,实现复用/分解
首部校验和(16位) 实现对IP分组首部的差错检测
1.计算校验和时,该字段置全0
2.采用反码算数运算求和,和的反码作为首部校验和字段
3.逐跳计算、逐跳校验
源IP地址、目的IP地址字段(各占32bit) 分别标识发送分组的源主机/路由器(网络接口)和接收分组的目的主机/路由器(网络接口)的IP地址
选项字段(长度可变,范围在1~40B之间) 携带安全、源选路径、时间戳和路由记录等内容(实际上很少被使用)
填充(长度可变,范围在0~3B之间) 目的是补齐整个首部,符合32位对齐,即保证首部长度是4字节的倍数
标识字段(16bit) 标识一个IP分组,IP协议利用一个计数器,每产生IP分组计数器加1,作为该IP分组的标识
标志位(3bit)
1. DF (Don’t Fragment)
2. MF (More Fragment)
DF =1:禁止分片;
DF =0:允许分片
MF =1:非最后一片;
MF =0:最后一片(或未分片)
片偏移(13bit) 一个IP分组分片封装原IP分组数据的相对偏移量
片偏移字段以8字节为单位

IP分片

网络链路存在MTU (最大传输单元)—链路层数据帧可封装数据的上限不同链路的MTU不同

大IP分组向较小MTU链路转发时, 可以被“分片” (fragmented)

  • 1个IP分组分为多片IP分组
  • IP分片到达目的主机后进行“重组”(reassembled)

IP首部的相关字段用于标识分片以及确定分片的相对顺序

  • 总长度、标识、标志位和片偏移

假设原IP分组总长度为L,待转发链路的MTU为M
若L>M,且DF=0,则可以/需要分片
分片时每个分片的标识复制原IP分组的标识
通常分片时,除最后一个分片,其他分片均分为MTU允许的最大分片
一个最大分片可封装的数据应该是8的倍数, 因此, 一个
最大分片可封装的数据为:

M2088

需要的总片数为:
L20d

每片片偏移字段取值为
Fi=d8(i1),1in

每片的总长度字段为
Li={d+20L(n1)d1<ni=n

每片MF标志位为:
MFi={101i<ni=n

IP编址

接口(interface): 主机/路由器与物理链路的连接

  • 实现网络层功能
  • 路由器通常有多个接口
  • 主机通常只有一个或两个接口(e.g.,有线的以太网接口,无线的802.11接口)

IP地址: 32比特(IPv4)编号标识主机、路由器的接口

IP地址与每个接口关联

IP地址:

  • 网络号(NetID) – 高位比特
  • 主机号(HostID) – 低位比特

IP子网

  • IP地址具有相同网络号的设备接口
  • 不跨越路由器(第三及以上层网络设备)可以彼此物理联通的接口

IP子网划分与子网掩码

“有类”编码
如图:

特殊IP地址

私有IP地址

子网划分

IP地址:

  • 网络号(NetID) – 高位比特
  • 子网号(SubID) – 原网络主机号部分比特
  • 主机号(HostID) – 低位比特

如何确定是否划分了子网?利用多少位划分子网?

  • 子网掩码

形如IP地址:

  • 32位
  • 点分十进制形式

取值:

  • NetID、 SubID位
  • HostID位全取0

将IP分组的目的IP地址与子网掩码按位与运算,提取子网地址

无类域间路由(CIDR: Classless InterDomain Routing)

  • 消除传统的 A 类、 B 类和 C 类地址界限
  • NetID+SubID→Network Prefix (Prefix)可以任意长度
  • 融合子网地址与子网掩码,方便子网划分
  • 无类地址格式: a.b.c.d/x,其中x为前缀长度

子网201.2.3.64, 255.255.255.192→201.2.3.64/26

无类域间路由(CIDR: Classless InterDomain Routing)

  • 提高IPv4 地址空间分配效率
  • 提高路由效率
  • 将多个子网聚合为一个较大的子网
  • 构造超网( supernetting)

当一个子网无法聚合所有的子网时,需要零碎出去的”子网片”利用最长前缀匹配原则向路由器通告,以便正确收发消息.

路由算法

路由算法通过设置转发表来得到应用

网络可以抽象成图

其中
N = 路由器集合
E = 链路集合

费用(Costs):每段链路的费用可以总是1,或者是宽带的倒数、拥塞程度等.

静态路由VS动态路由?
静态路由:

  • 手工配置
  • 路由更新慢
  • 优先级高

动态路由:

  • 定期更新
  • 及时响应链路费用或网络拓扑变化

全局信息VS分散信息?
全局信息:

  • 所有路由器掌握完整的网络拓扑和链路费用信息

分散信息:

  • 路由器只掌握物理相连的邻居以及链路费用
  • 邻居间信息交换,运算的迭代过程

链路状态路由算法

Dijkstra算法:
数据结构有实现,这里直接上代码:

#include
#include
#define max 11000000000
int a[1000][1000];
int d[1000];//d表示某特定边距离
int p[1000];//p表示永久边距离
int i,j,k;
int m;//m代表边数
int n;//n代表点数
int main()
{
    scanf("%d%d",&n,&m);
    int min1;
    int x,y,z;
    for(i=1;i<=m;i++)
    {
    scanf("%d%d%d",&x,&y,&z);
    a[x][y]=z;
    a[y][x]=z;
    }
    for(i=1;i<=n;i++)
        d[i]=max1;
    d[1]=0;
    for(i=1;i<=n;i++)
    {
        min1=max1;
        for(j=1;j<=n;j++)
            if(!p[j]&&d[j]for(j=1;j<=n;j++)
            if(a[k][j]!=0&&!p[j]&&d[j]>d[k]+a[k][j])
                d[j]=d[k]+a[k][j];
    }
    for(i=1;iprintf("%d->",p[i]);
    printf("%d\n",p[n]);
    return0;
}

复杂性分析和优化见数据结构

链路状态路由算法的震荡:

距离向量路由算法

Bellman-Ford方程(动态规划)
令:
dx(y):=从x到y最短路径的费用(距离)
则:dx(y) = min {c(x,v) + dv(y) }

Dx(y) = 从结点x到结点y的最小费用估计

  • x维护距离向量(DV): Dx = [Dx(y): y є N ]
    结点x:
  • 已知到达每个邻居的费用: c(x,v)
  • 维护其所有邻居的距离向量: Dv = [Dv(y): y є N ]
    核心思想:
  • 每个结点不定时地将其自身的DV估计发送给其邻居
  • 当x接收到邻居的新的DV估计时,即依据B-F更新其自身的距离向量估计:
    Dx(y) ← minv{c(x,v) + Dv(y)}for each node y ∊ N
    Dx(y)将最终收敛于实际的最小费用 dx(y)

异步迭代:

  • 引发每次局部迭代的因素
    • 局部链路费用改变
    • 来自邻居的DV更新
      分布式:
  • 每个结点只当DV变化时才通告给邻居
    • 邻居在必要时(其DV更新后发生改变)再通告它们的邻居

无穷计数问题

见示意图

解决方案
毒性逆转(poisoned reverse):

  • 如果一个结点(e.g.Z)到达某目的(e.g.X)的最小费用路径是通过某个邻居(e.g.Y),则:
    • 通告给该邻居结点到达该目的的距离为无穷大

毒性逆转并不能从根本上彻底解决无穷计数问题,在某些更复杂的网络情况下,毒性逆转就无能为力了

定义最大度量
定义一个最大的有效费用值,如15跳步,16跳步表示无穷.

具体过程见示意图

层次路由

网络规模: 考虑6亿目的结点的网络

  • 路由表几乎无法存储!
  • 路由计算过程的信息(e.g.链路状态分组、DV)交换量巨大,会淹没链路!

管理自治:

  • 每个网络的管理可能都期望自主控制其网内的路由
  • 互联网(internet) = 网络之网络(network of networks)

聚合路由器为一个区域:自治系统AS(autonomous systems)

同一AS内的路由器运行相同的路由协议(算法)

  • 自治系统内部路由协议(“ intra-AS” routingprotocol)
  • 不同自治系统内的路由器可以运行不同的AS内部路由协议

网关路由器(gatewayrouter):

  • 位于AS“边缘”
  • 通过链路连接其他AS的网关路由器

转发表由AS内部路由算法和AS间路由算法共同配置

  • AS内部路由算法设置AS内部目的网络路由入口(entries)
  • AS内部路由算法与AS间路由算法共同设置AS外部目的网络路由入口

自治系统间(inter-AS)路由任务
假设AS1内某路由器收到一个目的地址在AS1之外的数据报:

  • 路由器应该将该数据报转发给哪个网关路由器呢?

假设AS1通过AS间路由协议学习到:子网x通过AS3和AS2均可到达

  • 为了配置转发表,路由器1d必须确定应该将去往子网x的数据报转发给哪个网关?
  • 这个任务也是由AS间路由协议完成!

热土豆路由: 将分组发送给最近的网关路由器.

RIP协议

AS内部路由协议也称为内部网络协议IGP(interiorgatewayprotocols)

  • 最常见的AS内部路由协议:
  • 路由信息协议: RIP(Routing Information Protocol)
  • 开放最短路径优先: OSPF(Open Shortest Path First)
  • 内部网关路由协议: IGRP(Interior Gateway Routing Protocol)
    • Cisco私有协议

RIP
早于1982年随BSD-UNIX操作系统发布

  • 距离向量路由算法
  • 距离度量:跳步数 (max = 15 hops),每条链路1个跳步(防止无穷计数)
  • 每隔30秒,邻居之间交换一次DV,成为通告(advertisement)
  • 每次通告:最多25个目的子网(IP地址形式)

RIP示例

注意这里路由器之间交换的通告和一般的距离向量路由算法不同,增加了下一跳信息,如果看到某个路由器看到下一跳就是自己,那么就相当于起到了毒性逆转的作用.

RIP链路的失效和恢复信息
如果180秒没有收到通告→邻居/链路失效

  • 经过该邻居的路由不可用
  • 重新计算路由
  • 向邻居发送新的通告
  • 邻居再依次向外发送通告(如果转发表改变)
  • 链路失效信息能否快速传播到全网?
  • 可能发生无穷计数问题
  • 毒性逆转技术用于预防乒乓(ping-pong)环路(另外:无穷大距离 = 16 hops)

RIP路由表的处理:RIP路由表是利用一个称作route-d(deamon)的应用层进程实现的
通告报文周期性通过UDP数据报发送

RIP协议适用于小规模AS,以为最大跳步15.

OSPF协议

采用链路状态路由算法

  • LS分组扩散(通告)
  • 每个路由器构造完整的网络(AS)拓扑图
  • 利用Dijkstra算法计算路由
  • OSPF通告中每个入口对应一个邻居
  • OSPF通告在整个AS范围泛洪
  • OSPF报文直接封装到IP数据报中
  • 与OSPF极其相似的一个路由协议:IS-IS路由协议

OSPF优点
安全(security): 所有OSPF报文可以被认证(预防恶意入侵)

  • 允许使用多条相同费用的路径 (RIP只能选一条)
  • 对于每条链路,可以针对不同的TOS设置多个不同的费用度量(e.g.,卫星链路可以针对“尽力”(best effort)ToS设置“低”费用;针对实时ToS设置“高”费用)
  • 集成单播路由与多播路由:
    • 多播OSPF协议(MOSPF) 与OSPF利用相同的网络拓扑数据
  • OSPF支持对大规模AS分层(hierarchical)

OSPF分层示例:

两级分层

  • 链路状态通告只限于区内
  • 每个路由器掌握所在区的详细拓扑
  • 只知道去往其他区网络的”方向”(最短路径)
路由器种类 描述
区边界路由器(Area Border Routers) “汇总”到达所在区网络的距离,通告给其他区边界路由器(每个小区和蓝色区相交的那个路由器)
主干路由器(Backbone Routers) 在主干区内运行OSPF路由算法.(图中蓝色区域的普通路由器)
AS边界路由器(AS boundary routers) 连接其他AS.(最上面那个路由器)

BGP路由协议

边界网关协议BGP (Border GatewayProtocol):事实上的标准域间路由协议

  • 将Internet “粘合”为一个整体的关键

BGP为每个AS提供了一种手段:
* eBGP: 从邻居AS获取子网可达性信息.
* iBGP: 向所有AS内部路由器传播子网可达性信息.
* 基于可达性信息与策略,确定到达其他网络的 “好”
路径.
* 容许子网向Internet其余部分通告它的存在:“ 我在这儿! ”

BGP会话(session): 两个BGP路由器 (“ Peers” )交换BGP报文:

  • 通告去往不同目的前缀( prefix)的路径 (“路径向量(path vector)” 协议)
  • 报文交换基于半永久的TCP连接

BGP报文:
* OPEN: 与peer建立TCP连接,并认证发送方
* UPDATE: 通告新路径 (或撤销原路径)
* KEEPALIVE: 在无UPDATE时,保活连接;也用于对OPEN请求的确认
* NOTIFICATION: 报告先前报文的差错;也被用于关闭连接

当AS3通告一个前缀给AS1时:
* AS3承诺可以将数据报转发给该子网
* AS3在通告中会聚合网络前缀

BGP分发路径信息:
如示意图:

在3a与1c之间, AS3利用eBGP会话向AS1发送前缀可达性信息.

  • 1c则可以利用iBGP向AS1内的所有路由器分发新的前缀可达性信息
  • 1b可以( 也可能不)进一步通过1b-到-2a的eBGP会话,向AS2通告新的可达性信息
  • 当路由器获得新的前缀可达性时,即在其转发表中增加关于该前缀的入口(路由项) .

通告的前缀信息包括BGP属性

  • 前缀+属性= “ 路由”

两个重要属性:

  • AS-PATH(AS路径): 包含前缀通告所经过的AS序列: e.g., AS 67,AS 17
  • NEXT-HOP(下一跳): 开始一个AS-PATH的路由器接口,指向下一
    跳AS.
    • 可能从当前AS到下一跳AS存在多条链路(如图中2b和2c)

BGP路由选择
网关路由器收到路由通告后,利用其输入策略(import policy)决策接受/拒绝该路由e.g., 从不将流量路由到AS x

  • 基于策略(policy-based) 路由
  • 路由器可能获知到达某目的AS的多条路由,基于以下准则选择:
    1. 本地偏好(preference)值属性: 策略决策(policy
      decision)
    2. 最短AS-PATH
    3. 最近NEXT-HOP路由器: 热土豆路由(hot potato
      routing)
    4. 附加准则

路由选择策略示例:

A向B通告一条路径: AW

B向X通告路径: BAW

B是否应该向C通告路径BAW呢?

  • 绝不! B路由CBAW的流量没有任何“收益”,因为W和C均不是B的客户。
  • B期望强制C通过A向W路由流量
  • B期望只路由去往/来自其客户的流量!

为什么采取不同的AS内与AS间路由协议
策略(policy):

  • inter-AS: 期望能够管理控制流量如何被路由,谁路由经过其网络等.
  • intra-AS: 单一管理,无需策略决策

规模(scale):

  • 层次路由节省路由表大小,减少路由更新流量
  • 适应大规模互联网

性能(performance):

  • intra-AS: 侧重性能
  • inter-AS: 策略主导

你可能感兴趣的:(CS天赋技能)