《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程

UNIX网络编程——基本TCP套接字编程

  • socket 函数
  • connect 函数
  • bind 函数
  • listen 函数
  • accept 函数
  • fork 和 exec 函数
  • 并发服务器
  • close 函数
  • getsockname 和 getpeername 函数

socket 函数

socket 函数,指定期望的通信协议类型(使用IPv4的TCP、使用 IPv6 的UDP、Unix域字节流协议等)。

#include 
int socket(int family, int type, int protocol);
                                                  返回:若成功则为非负描述符,若出错则为-1

family 参数指明协议族,它是图4-2中所示的某个常值。该参数也往往被称为协议域。
type 参数指明套接字类型,它是图4-3中所示的某个常值。
protocol 参数应设为图 4-4所示的某个协议类型常值,或者设为0,以选择所给定 family 和 type 组合的系统默认值。

《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第1张图片
《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第2张图片
《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第3张图片
socket 函数在成功时返回一个小的非负整数值,它与文件描述符类似,我们把它称为套接字描述符,检查 sockfd

为得到这个套接字描述符,只是指定了协议族(IPv4、IPv6或 Unix)和套接字类型(字节流、数据报或原始套接字)。并没有指定本地协议地址或远程协议地址。

AF_ 前缀表示地址族,PE_ 前缀表示协议族。

connect 函数

TCP 客户用 connect 函数来建立与TCP服务器的连接。

#include 
int connect(int sockfd, const struct sockaddr* servaddr, socklen_t addrlen);
                                                             返回:若成功则为0,若出错则为-1

sockfd 是由 socket 函数返回的套接字描述符,第二个、第三个参数分别是一个指向套接字地址结构的指针和该结构的大小。
套接字地址结构必须含有服务器的IP地址和端口号。

客户在调用函数 connect 前不必非得调用 bind 函数,因为如果需要的话,内核会确定源IP地址,并选择一个临时端口作为源端口。

TCP套接字,调用 connect 函数将激发TCP的三路握手过程,而且仅在连接建立成功或出错时才返回,其中出错返回可能有以下几种情况。

  • (1)若TCP客户没有收到SYN分节的响应,则返回 ETIMEDOUT 错误。

  • (2)若对客户的SYN的响应是RST(表示复位),则表明该服务器主机在我们指定的端口上没有进程在等待与之连接。这是一种硬错误,客户一接收到RST就马上返回 ECONNREFUSED 错误。
    RST是TCP在发生错误时发送的一种TCP分节。
    产生RST的三个条件是:

    • 目的地为某端口的SYN到达,然而该端口上没有正在监听的服务器;
    • TCP想取消一个已有连接;
    • TCP接收到一个根本不存在的连接上的分节。
  • (3)若客户发生的SYN在中间的某个路由器上引发一个 “destination unreachable”(目的地不可达) ICMP错误,则认为是一种软错误(soft error)。
    以下两种情形也是有可能的:一是按照本地系统的转发表,根本没有到达远程系统的路径;二是 connect 调用根本不等待就返回。

bind 函数

bind 函数把一个本地协议地址赋予一个套接字。

#include 
int bind(int sockfd, const struct sockaddr* myaddr, socklen_t addrlen);
                                                    返回:若成功则为0,若出错则为-1

第二个参数是一个指向特定于协议的地址结构的指针,第三个参数是该地址结构的长度。
对于TCP,调用bind函数可以指定一个端口号,或指定一个IP地址,也可以两者都指定,还可以都不指定。

一个主机有多个网络接口,每个网络接口有一个IP地址。

  • 对TCP客户,执行bind指定IP地址,则为后续sockfd上发出的IP数据报限定了源IP地址;
  • 对TCP客户,执行bind不指定IP地址,则为后续sockfd上发出的IP数据报的源IP地址采取发出的网络接口的IP地址。
  • 对TCP服务器,执行bind指定IP地址,则限定后续sockfd监听时只接收目的IP为这里指定IP地址的连接请求;
  • 对TCP服务器,执行bind不指定IP地址,则限定后续sockfd监听时接收目的IP为主机上任意网络接口IP地址的连接请求。

且采用客户发来SYN的目的IP地址作为服务器上对应已经连接套接字的本端IP地址。

《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第4张图片

IP地址为INADDR_ANY表不指定,端口为0表不指定;端口未指定时,由内核为此sockfd指定。

主机可收取IP地址为其任一网络接口IP地址的数据报,数据报递送到进程,则需要按数据报的(源IP地址,源端口,目的IP地址,目的端口),递送到本机中与其匹配的套接字的缓冲区。
随后,可通过匹配套接字调read读入该套接字缓冲区的数据到进程。

从 bind 函数返回的一个常见错误是 EADDRINUSE (“Address already in use”,地址已使用)。

listen 函数

#include 
int listen(int sockfd, int backlog);
                                             返回:若成功则为0,若出错则为-1

内核为任何一个给定的监听套接字维护两个队列:

  • (1)未完成连接队列
    收到SYN,尚未完成三路握手的连接。
    一般在未完成连接队列已经满,接着收到SYN,后续收到的SYN将忽略(对端会超时重传)。
  • (2)已完成连接队列
    已经完成三路握手。
    两队列维护套接字个数之和原则上不超过参数2。

已完成连接队列中套接字关联的数据到达主机,即使尚未accept,该套接字的数据也会放入该套接字的接收缓冲区;待其后续读取。

《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第5张图片
每当在未完成连接队列创建一项时,来自监听套接字的参数就复制到即将建立的连接中。
连接的创建机制是完全自动的,无需服务器进程插手。

《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第6张图片

accept 函数

accept 函数由TCP服务器调用,用于从已完成连接队列队头返回下一个已完成连接。

#include 
int accept(int sockfd, struct sockaddr* cliaddr,  socklen_t* addrlen);

参数 cliaddr 和 addrlen 用来返回已连接的对端进程(客户)的协议地址。
addrlen 是值-结果参数:调用前,将由 *addrlen 所引用的整数值置为由 cliaddr 所指的套接字地址结构的长度,返回时,该整数值即为由内核存放在该套接字地址结构内的确切字节数。

如果 accept 成功,那么其返回值是由内核自动生成的一个全新描述符,代表与所返回客户的TCP连接。

accept 函数的第一个参数为监听套接字(listening socket)描述符(由 socket 创建,随后用作 bind 和 listen 的第一个参数的描述符),称它的返回值为已连接套接字(connected socket)描述符。

区分两个套接字:
一个服务器通常仅仅创建一个监听套接字,它在该服务器的生命期内一直存在。
内核为每个服务器进程接受的客户创建一个已连接套接字(TCP三路握手已完成)。
当服务器完成对某个给定客户的服务时,相应的已连接套接字就被关闭。

本函数最多返回三个值:一个既可能是新套接字描述符也可能是出错指示的整数、客户进程的协议地址(由 cliaddr 指针所指)以及该地址的大小(由 addrlen 指针所指)。

fork 和 exec 函数

fork 函数是Unix 中派生新进程的唯一方法。

#include 

pid_t fork(void);
                             返回:在子进程中为0,在父进程中为子进程ID,若出错则为-1

fork在子进程返回0而不是父进程的进程ID的原因在于:

  • 任何子进程只有一个父进程,而且子进程总是可以通过调用 getppid 取得父进程的进程ID。
  • 相反,父进程可以有许多子进程,而且无法获取各个子进程的进程ID。如果父进程想要跟踪所有子进程的进程ID,那么它必须记录每次调用 fork 函数的返回值。

父进程调用fork之前打开的所有描述符在 fork 返回之后由子进程分享。

fork 的两个典型用法:

  • (1)一个进程创建一个自身的副本,这样每个副本都可以在另一个副本执行其他任务的同时处理各自的某个操作。(王丽丽服务器的典型用法)
  • (2)一个进程想要执行另一个程序。既然创建新进程的唯一办法是调用 fork ,该进程于是首先调用 fork 创建一个自身的副本,然后其中一个副本(通常为子进程)调用 exec 把自身替换成新的程序。(shell之类程序的典型用法)

存放在硬盘上的可执行程序文件能够被Unix执行的唯一方法是:由一个现有进程调用六个exec函数中的某一个。

exec把当前进程映像替换成新的程序文件,而且该进程通常从 main 函数开始执行。进程ID并不改变。
成调用exec的进程为调用进程,成新执行的程序为新程序

《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第7张图片《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第8张图片
《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第9张图片

并发服务器

当一个连接建立时,accept 返回,服务器接着调用 fork ,然后有子进程服务客户(通过连接套接字 connfd),父进程则等待另一个连接(通过监听套接字 listenfd)。既然新的客户由子进程提供服务,父进程就关闭已连接套接字。

《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第10张图片《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第11张图片《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第12张图片《UNIX网络编程 卷1:套接字联网API》学习笔记——基本TCP套接字编程_第13张图片

close 函数

close 函数也用来关闭套接字,并终止TCP连接。

#include 
int close(int sockfd);
                                          返回:若成功则为0,若出错则为-1

close 一个TCP套接字的默认行为是把该套接字标记成已关闭,然后立即返回到调用进程。

描述符引用计数

每个文件或套接字有一个引用计数,在文件表项中维护;代表引用此文件或套接字的描述符的个数。

fork造成父进程打开的描述符被复制到子进程,相应的描述符指向文件或套接字的引用计数+1。
对描述符执行close时,先将其指向的文件或套接字引用计数-1。

getsockname 和 getpeername 函数

这两个函数或者返回与某个套接字关联的本地协议地址(getsockname),或者返回与某个套接字关联的外地协议地址(getpeername)。

#include 
int getsockname(int sockfd, struct sockaddr*,socklen_t*);
int getpeername(int sockfd, struct sockaddr*,socklen_t*);
                                                            均返回:若成功则为0,若出错则为-1

这两个函数的最后一个参数都是值-结果参数。

学习参考资料:

《UNIX网络编程 卷1:套接字联网API》 第3版

你可能感兴趣的:(UNIX网络编程,网络,unix,tcp/ip)