欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~
本文由 jackieluo发表于 云+社区专栏
TCP客户端-服务器典型事件
下图是TCP客户端与服务器之间交互的一系列典型事件时间表:
- 首先启动服务器,等待客户端连接
- 启动客户端,连接到服务器
- 客户端发送一个请求给服务器,服务器处理请求,响应客户端
- 循环步骤3
- 客户端给服务器发一个文件结束符,关闭客户端连接
- 服务器也关闭连接
套接口编程基本函数
socket 函数
为了执行网络I/O,一个进程(无论是服务端还是客户端)必须做的第一件事情就是调用socket
函数。
#include /* basic socket definitions */
int socket(int family, int type, int protocol);/* 返回:非负描述字——成功,-1——出错 */
-
family
——协议族
族 | 解释 |
---|---|
AF_INET |
IPv4协议 |
AF_INET6 |
IPv6协议 |
AF_LOCAL |
Unix域协议 |
AF_ROUTE |
路由套接口 |
AF_KEY |
密钥套接口 |
-
type
——套接口类型
类型 | 解释 |
---|---|
SOCK_STREAM |
字节流套接口 |
SOCK_DGRAM |
数据报套接口 |
SOCK_RAW |
原始套接口 |
下面是有效的family
和type
组合(简略版):
AF_INET |
AF_INET6 |
|
---|---|---|
SOCK_STREAM |
TCP | TCP |
SOCK_DGRAM |
UDP | UDP |
SOCK_RAW |
IPv4 | IPv6 |
socket
函数返回一个套接口描述字,简称套接字(sockfd
)。获取套接字无需指定地址,只需要指定协议族和套接口类型(如上表中的组合)。
connect函数
TCP客户用connect
函数来建立一个与TCP服务器的连接。
#include /* basic socket definitions */
int connect(int sockfd, const struct sockaddr * servaddr, socklen_t addrlen);/* 返回:0——成功,-1——出错 */
- 参数
sockfd
便是socket
函数返回的套接口描述字。 - 套接口地址结构
servaddr
必须包含服务器的IP地址和端口号。 - 客户端不必非要绑定一个端口(调用
bind
函数),内核会选择源IP和一个临时端口。 -
connect
函数会触发TCP三次握手。有可能出现下面的错误情况:
1.客户端未收到SYN
分节的响应
第一次发出未收到,间隔6s再发一次,再没收到,隔24秒再发一次,总共等待75s还没收到则返回错误( ETIMEDOUT
)。可以用时间日期程序验证一下:
查看本地网络信息:
JACKIELUO-MC0:intro jackieluo$ ifconfig
en0: flags=8863 mtu 1500
ether f4:0f:24:2a:72:a6
inet6 fe80::1830:dbd:1b29:2989%en0 prefixlen 64 secured scopeid 0x6
inet 192.168.0.101 netmask 0xffffff00 broadcast 192.168.0.255
nd6 options=201
media: autoselect
status: active
将程序指向本地地址192.168.0.101
(确保时间日期服务器程序已运行),成功:
JACKIELUO-MC0:intro jackieluo$ ./daytimetcpcli 192.168.0.101
Sat Oct 6 17:06:55 2018
将程序指向本地子网地址192.168.0.102
,其主机ID(102)不存在,等待几分钟后超时返回:
JACKIELUO-MC0:intro jackieluo$ ./daytimetcpcli 192.168.0.102
connect error: Operation timed out
2.收到RST
即服务器主机在指定端口上没有等待连接的进程,这称为“hard error”,客户端一接收到RST
,马上返回错误(ECONNREFUSED
)。验证:
关闭之前本机运行的daytimetcpsrv
进程
将程序指向本地地址192.168.0.101
:
JACKIELUO-MC0:intro jackieluo$ ./daytimetcpcli 192.168.0.101
connect error: Connection refused
3.发出的SYN
在路由器上引发了目的不可达ICMP
错误
这个错误被称为“soft error”,最终返回EHOSTUNREACH
或者ENETUNREACH
。
bind函数
函数bind
为套接口分配一个本地协议地址,包括IP地址和端口号。
#include /* basic socket definitions */
int bind(int sockfd, const struct sockaddr * servaddr, socklen_t addrlen);/* 返回:0——成功,-1——出错 */
- 客户端可以不调用这个函数,由内核选择一个本地ip的临时端口就好。
- 服务器一般都会调用
bind
函数绑定ip地址和端口,供客户端调用。一个例外是RPC(远程过程调用)服务器,它由内核为其选择临时端口。然后通过RPC端口映射器进行注册,客户端与该服务器连接之前,先通过端口映射器获取服务器的端口。 - 进程可以把一个特定的IP地址捆绑到它的套接口上。对于客户端,它发送的请求,源IP地址就是这个地址;对于服务器,如果绑定了IP地址,则只接受目的地为此IP地址的客户连接。
- 如果服务器不把IP地址绑定到套接口上,那么内核把客户端发送
SYN
所在分组的目的IP地址作为服务器的源IP地址。(即服务器收到SYN
的IP)
给函数bind
指定用于捆绑的IP地址和/或端口号的结果:
IP地址 | 端口 | 结果 |
---|---|---|
0 | 内核选择IP地址和端口 | |
非0 | 内核选择IP地址,进程指定端口 | |
本地IP地址 | 0 | 进程选择IP地址,内核指定端口 |
本地IP地址 | 非0 | 进程选择IP地址和端口 |
listen函数
函数listen
仅被TCP服务器调用。
#include /* basic socket definitions */
int listen(int sockfd, int backlog);/* 返回:0——成功,-1——出错 */
调用函数socket
函数创建的套接口,默认是主动方,下一步应是调用connect
,CLOSED
的下一个状态是SYN_SENT
(见TCP状态转换图)。而函数listen
将套接口转换成被动方,告诉内核,应接受指向此套接口的连接请求,CLOSED
状态变成LISTEN
。
函数listen
的第二个参数backlog
表示内核为此套接口排队的最大连接数。对于给定的监听套接口,内核会维护两个队列:
- 未完成连接队列(incomplete connection queue) SYN分节已由客户发出,到达服务器,正在进行TCP的三路握手。此时这些套接口处于
SYN_RCVD
状态。 - 已完成连接队列(completed connection queue) SYN分节已由客户发出,到达服务器,并且已完成三路握手。此时这些套接口处于
ESTABLISHED
状态。 - 当来自客户的SYN到达时,TCP在未完成连接队列中创建一个新条目,直到三路握手中,第三个分节(客户对服务SYN的ACK)到达,这个条目移到已完成连接队列的队尾。
- 当进程调用
accept
函数时,已完成连接队列的头部条目返回给进程。 - 两个队列之和不能超过
backlog
- 当一个客户SYN到达时,若这两个队列都是满的,TCP就忽略此分节,且不发送RST。客户TCP将重发SYN,期望不久就能在队列中找到空闲位置。
accept函数
函数accept
由TCP服务器调用,从已完成连接队列头部返回下一个已完成连接,若该队列为空,则进程睡眠(假定套接口为默认的阻塞方式)。
#include /* basic socket definitions */
int accept(int sockfd, struct sockaddr *cliaddr, socklen_t *addrlen);/* 返回:非负描述字——成功,-1——出错 */
函数accept
的第一个参数和返回值都是套接口描述字。其中,
- 第一个参数,称为监听套接口描述字,即由函数
socket
返回,也用于bind
,listen
的第一个参数。 - 返回值,称为已连接套接口描述字。
通常一个服务器,只生成一个监听套接口描述字,直到其关闭。而内核为每个被接受的客户连接,创建一个已连接套接口,当客户连接完成时,关闭该已连接套接口。
注意到intro/daytimetcpsrv.c
中,后两个参数传的都是空指针,这是因为我们不关注客户的身份,无需知道客户的协议地址。
connfd = Accept(listenfd, (SA *) NULL, NULL);
稍作修改,不再传入空指针,见intro/daytimetcpsrv1.c
:
socklen_t len;
struct sockaddr_in servaddr, cliaddr;
...
connfd = Accept(listenfd, (SA *) &cliaddr, &len);
printf("connection from %s, port %d\n",
Inet_ntop(AF_INET, &cliaddr.sin_addr, buff, sizeof(buff)),
ntohs(cliaddr.sin_port));
kill掉之前的daytimetcpsrv
进程:
$ sudo lsof -i -P | grep -i "listen"
daytimetc 80986 root 3u IPv4 0xae12d925e4528793 0t0 TCP *:13 (LISTEN)
$ sudo kill -9 80986
编译运行新的服务端程序:
$ make daytimetcpsrv1.c daytimetcpsrv1
$ ./daytimetcpsrv1
重复执行客户端程序,发几个请求:
$ ./daytimetcpcli 127.0.0.1
Wed Sep 26 14:11:20 2018
$ ./daytimetcpcli 127.0.0.1
Wed Sep 26 14:17:06 2018
查看服务端打印:
connection from 127.0.0.1, port 58201
connection from 127.0.0.1, port 58342
注意到,由于客户端程序没有调用bind
函数,内核为它的协议地址选择了源ip作为IP地址,临时端口号也发生了变化。
fork和exec函数
#include
pid_t fork(void);/* 返回:在子进程中为0,在父进程中为子进程ID,-1——出错 */
fork
函数调用一次,却返回两次。
- 在调用它的进程(即父进程),它返回一次,返回值是派生出来的子进程的进程ID。 父进程可能有很多子进程,必须通过返回值跟踪记录子进程ID。
- 在子进程,它还返回一次,返回值为0。 子进程只有一个父进程,总可以通过
getppid
来得到父进程的ID
通过返回值可以判断当前进程是子进程还是父进程。
父进程在调用fork
之前打开的所有描述字在函数fork
返回后都是共享的。网络服务器会利用这一特性:
- 父进程调用
accept
。 - 父进程调用
fork
,已连接套接口就在父进程与子进程间共享。(一般来说就是子进程读、写已连接套接口,而父进程关闭已连接套接口)。
fork
有两个典型应用:
- 一个进程为自己派生一个拷贝,并发执行任务,这也是典型的并发网络服务器模型。
- 一个进程想执行其他的程序,于是调用
fork
生成一个拷贝,利用子进程调用exec
来执行新的程序。典型应用是shell。
以文件形式存储在硬盘上的可执行程序若要被执行,需要由一个现有进程调用exec
函数。我们将调用exec
的进程称为调用进程,新程序的进程ID并不改变,仍处于当前进程。
小结
客户和服务器,从调用socket
开始,返回一个套接口描述字。客户调用connect
,服务器调用bind
、listen
、accept
。最后套接口由close
关闭。
多数TCP服务器是调用fork
来实现并发处理多客户请求的。多数UDP服务器则是迭代的。
相关阅读
系统重启后nginx reload不生效原因分析
SRS开源直播服务 - StateThreads微线程框架学习
高性能网络编程3----TCP消息的接收
【每日课程推荐】机器学习实战!快速入门在线广告业务及CTR相应知识
此文已由作者授权腾讯云+社区发布,更多原文请点击
搜索关注公众号「云加社区」,第一时间获取技术干货,关注后回复1024 送你一份技术课程大礼包!
海量技术实践经验,尽在云加社区!