【Linux网络编程】传输层udp协议篇

udp协议篇

  • 一、本篇是在应用篇的后面的
  • 二、传输层
    • 2.1、再谈端口号
      • 2.2.1、两个问题
      • 2.2.2、两个常用命令
    • 2.2、UDP协议
      • 2.2.1、udp协议端格式&&理解报头
      • 2.2.2、udp的特点
      • 2.2.3、udp的缓冲区
      • 2.2.4、基于udp的应用层协议

一、本篇是在应用篇的后面的

讲解过程是自顶向下的,可以先看看应用层
应用层HTTP协议篇的的传送位置

二、传输层

2.1、再谈端口号

端口号(port)标识了一个主机上进行通信的不同的应用程序。

【Linux网络编程】传输层udp协议篇_第1张图片
在TCP/IP协议中, 用 “源IP”, “源端口号”, “目的IP”, “目的端口号”, “协议号” 这样一个五元组来标识一个通信(可以通过netstat -n查看,具体还需要加别的参数);

【Linux网络编程】传输层udp协议篇_第2张图片

  • 客户端A上面两个浏览器请求,客户端B上面一个浏览器请求,这三个请求同时请求访问服务器上的80端口号应用程序
  • 五元组由此建立,根据"源IP", “源端口号”, “目的IP”, “目的端口号”, "协议号"形成报头,封装在数据内容的首部进行传输,通过五元组识别通信。

端口号范围划分

  • 0 - 1023: 知名端口号, HTTP, FTP, SSH等这些广为使用的应用层协议, 他们的端口号都是固定的.

  • 1024 - 65535: 操作系统动态分配的端口号. 客户端程序的端口号, 就是由操作系统从这个范围分配的

认识知名端口号

有些服务器是非常常用的, 为了使用方便, 人们约定一些常用的服务器, 都是用以下这些固定的端口号:

  • ssh服务器, 使用22端口
  • ftp服务器, 使用21端口
  • telnet服务器, 使用23端口
  • http服务器, 使用80端口
  • https服务器, 使用443
cat /etc/services

或者

vim /etc/services

执行上面的任一命令都可以查看知名的端口号,

我们自己写一个程序使用端口号时, 要避开这些知名端口号

2.2.1、两个问题

  1. 一个进程是否可以bind多个端口号?
  2. 一个端口号是否可以被多个进程bind?
  • 问题一:可以,端口号保证的是唯一性,一个程序需要同时监听不同的端口,在web端很常见,每种协议的端口号各不相同,一个程序的执行可能需要很多的协议来保证通信传输。
  • 问题二:不可以,端口号必须唯一的被一个进程bind,保证唯一性,当一个进程成功bind了一个端口号后,其他进程就不能再使用相同的端口号。如果另一个进程试图使用已被占用的端口号,那么操作系统会返回一个错误并提示端口号已经被占用。

2.2.2、两个常用命令

netstat

netstat是一个用来查看网络状态的重要工具

语法: netstat [选项]
功能:查看网络状态
常用选项

  • n 拒绝显示别名,能显示数字的全部转化成数字
  • l 仅列出有在 Listen (监听) 的服務状态
  • p 显示建立相关链接的程序名
  • t (tcp)仅显示tcp相关选项
  • u (udp)仅显示udp相关选项
  • a (all)显示所有选项,默认不显示LISTEN相关

pidof

在查看服务器的进程id时非常方便

语法: pidof [进程名]
功能:通过进程名, 查看进程id

【Linux网络编程】传输层udp协议篇_第3张图片

2.2、UDP协议

2.2.1、udp协议端格式&&理解报头

【Linux网络编程】传输层udp协议篇_第4张图片

  • 前8个字节各部分16位的原因是Linux操作系统用的是16位的,所以应用层也传16位 uint16_t 的数据
  • 16位UDP长度, 表示整个数据报(UDP首部+UDP数据)的最大长度;
  • 如果校验和出错, 就会直接丢弃;

【Linux网络编程】传输层udp协议篇_第5张图片
【Linux网络编程】传输层udp协议篇_第6张图片

2.2.2、udp的特点

UDP传输的过程类似于寄信

  • 无连接: 知道对端的IP和端口号就直接进行传输, 不需要建立连接;
  • 不可靠: 没有确认机制, 没有重传机制; 如果因为网络故障该段无法发到对方, UDP协议层也不会给应用层返回任何错误信息;
  • 面向数据报: 不能够灵活的控制读写数据的次数和数量;
  1. 所谓无连接就是没有tcp那样的监听,建立连接等等一系列通信前摇,上来知道了ip和端口号直接就发
  2. 所谓的不可靠就是,我把数据交给你了之后我就不管了,应用层传入的数据,交给传输层,然后网络。。。不考虑数据的丢失,不考虑怎么解决丢包,怎么传输
  3. 所谓的面向数据报,就是应用层发给udp一个报文,udp原样发送,你给我传多少,我给下一层传多少,不会拆分,不会合并,发给udp100字节,udp直接读取100字节,而不是分10次读取10字节,丢包就是没有数据。

2.2.3、udp的缓冲区

  • UDP没有真正意义上的 发送缓冲区. 调用sendto会直接交给内核, 由内核将数据传给网络层协议进行后续的传输动作;

  • UDP具有接收缓冲区. 但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致; 如果缓冲区满了, 再到达的UDP数据就会被丢弃

  • tcp的server端和client端都有发送缓冲区和接收缓冲区,数据的发送本质是拷贝数据,把数据拷贝给缓冲区,就可以继续工作,数据的发送交给缓冲区了,数据的接受也从缓冲区中拷贝过来,用生产者消费者模型的思想完成IO操作的解耦,使数据传输更为高效。
  • 而udp是有多少发多少,不需要发送缓冲区,只有接收缓冲区,由于数据的发送不可靠,自然缓冲区中的顺序也就不可靠,当然也有丢包问题的存在,至于缓冲区满的时候就直接丢弃。

UDP的socket既能读, 也能写, 这个概念叫做 全双工

  • 半双工:发送方和接收方之间只能一个发送一个接受
  • 全双工:发送方和接收方能够同时发送和接受,也就是a同时发送给b,也接收b的数据,b发给a数据,也同时接收a的数据,这就叫做全双工

UDP使用注意事项

我们注意到, UDP协议首部中有一个16位的最大长度. 也就是说一个UDP能传输的数据最大长度是64K(包含UDP首部).

然而64K在当今的互联网环境下, 是一个非常小的数字.

如果我们需要传输的数据超过64K, 就需要在应用层手动的分包, 多次发送, 并在接收端手动拼装;

2.2.4、基于udp的应用层协议

  • NFS: 网络文件系统
  • TFTP: 简单文件传输协议
  • DHCP: 动态主机配置协议
  • BOOTP: 启动协议(用于无盘设备启动)
  • DNS: 域名解析协议

当然, 也包括你自己写UDP程序时自定义的应用层协议;

你可能感兴趣的:(Linux网络编程,网络,linux,udp)