前面的管道、共享内存等等进程间通信,都是仅限于用在本机进程之间通信。网络间进程通信要解决的是不同主机进程间的相互通信问题(可把同机进程通信看作是其中的特例)。
为此,首先要解决的是网络间进程标识问题。同一主机上,不同进程可用进程号(process ID)唯一标识。但在网络环境下,各主机独立分配的进程号不能唯一标识该进程。例如,主机A赋于某进程号5,在B机中也可以存在5号进程,因此,“5号进程” 这句话就没有意义了。 其次,操作系统支持的网络协议众多,不同协议的工作方式不同,地址格式也不同。因此,网间进程通信还要解决多重协议的识别问题。
TCP/IP协议族已经帮我们解决了这个问题,网络层的“ip地址”可以唯一标识网络中的主机,而传输层的“协议+端口”可以唯一标识主机中的应用程序(进程)。这样利用三元组(ip地址,协议,端口)就可以标识网络的进程了,网络中的进程通信就可以利用这个标志与其它进程进行交互。
使用TCP/IP协议的应用程序通常采用应用编程接口:UNIX BSD的套接字(socket)和UNIX System V的TLI(已经被淘汰),来实现网络进程之间的通信。就目前而言,几乎所有的应用程序都是采用socket,而现在又是网络时代,网络中进程通信是无处不在,这就是为什么说“一切皆socket”。
socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,都可以用 “打开open –> 读写write/read –> 关闭close” 模式来操作。Socket就是该模式的一个实现, socket 即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭).
说白了Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。
有关文件描述符,如果不了解,可以查看这篇文章: 文件描述符 。
文件描述符其实就是一个整数,我们最熟悉的句柄是0、1、2三个,0是标准输入,1是标准输出,2是标准错误输出。0、1、2是整数表示的,对应的FILE *结构的表示就是stdin、stdout、stderr。
上文说到,socket 是一种特殊的文件,那么必然有文件描述符,
// 创建 socket 文件描述符 (TCP/UDP, 客户端 + 服务器)
int socket(int domain, int type, int protocol);
// 绑定端口号 (TCP/UDP, 服务器)
int bind(int socket, const struct sockaddr *address,socklen_t address_len);
// 开始监听socket (TCP, 服务器)
int listen(int socket, int backlog);
// 接收请求 (TCP, 服务器)
int accept(int socket, struct sockaddr* address,socklen_t* address_len);
// 建立连接 (TCP, 客户端)
int connect(int sockfd, const struct sockaddr *addr,socklen_t addrlen);
在生活中,A要电话给B,A拨号,B听到电话铃声后提起电话,这时A和B就建立起了连接,A和B就可以讲话了。等交流结束,挂断电话结束此次交谈。 打电话很简单解释了这工作原理:“open—write/read—close”模式。
如上图,服务器端先初始化Socket,然后与端口绑定(bind),对端口进行监听(listen),这个过程可以理解为开机,服务器已经做好了事前准备。然后调用accept阻塞,等待客户端连接。在这时如果有个客户端初始化一个Socket,然后连接服务器(connect),如果连接成功,这时客户端与服务器端的连接就建立了。客户端发送数据请求,服务器端接收请求并处理请求,然后把回应数据发送给客户端,客户端读取数据,最后关闭连接,一次交互结束。
#include
#include
int socket(int domain, int type, int protocol); // 返回一个文件描述符
socket函数 对应于 普通文件的打开操作。普通文件的打开操作返回一个文件描述字,而socket() 用于创建一个socket描述符(即它的返回值),它唯一标识一个 socket。这个socket 描述字跟文件描述字一样,后续的操作都有用到它,把它作为参数,通过它来进行一些读写操作。
socket函数的三个参数分别为:
注意:并不是上面的type和protocol可以随意组合的,如SOCK_STREAM不可以跟IPPROTO_UDP组合。当protocol为0时,会自动选择type类型对应的默认协议。
例如,我想要使用UDP协议进行通信,此时可以 int sock = socket(AF_INET,SOCK_DGRAM,0); 得到的 sock 在后续操作中一直要使用。
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen); // 成功返回0,失败返回 -1
正如上面所说,bind()函数把一个地址族中的特定地址赋给socket。例如对应AF_INET、AF_INET6就是把一个ipv4或ipv6地址和端口号组合赋给socket。
函数的三个参数分别为:
struct sockaddr_in {
sa_family_t sin_family; /* address family: AF_INET */
in_port_t sin_port; /* port in network byte order */
struct in_addr sin_addr; /* internet address */
};
/* Internet address. */
struct in_addr {
uint32_t s_addr; /* address in network byte order */
};
通常服务器在启动的时候都会绑定一个众所周知的地址(如ip地址+端口号),用于提供服务,客户就可以通过它来接连服务器;而客户端就不用指定,有系统自动分配一个端口号和自身的ip地址组合。这就是为什么通常服务器端在listen之前会调用bind(),而客户端就不会调用,而是在connect()时由系统随机生成一个。
关于 struct sockaddr。
socket API是一层抽象的网络编程接口,适用于各种底层网络协议,如IPv4、 IPv6,以及其他的协议等等。然而, 各种网络协议的地址格式并不相同,如下图:
由于每一个协议的结构体都不同,那么为了适应这些协议,就必须开发出多个 bind() 接口,这些 bind 接口的区别,仅仅是第二个参数的不同,这样未免过于繁琐,所以有了 struct sockaddr 的诞生。
例如,IPv4、 IPv6 地址类型 分别定义为常数AF_INET、 AF_INET6。这样, 只要取得某种协议格式的结构体的首地址, 不需要知道具体是哪种类型的 sockaddr 结构体,就可以根据地址类型字段确定结构体中的内容。比如,使用 socket 创建套接字的时候,第一个参数树 AF_INET ,表示的是 ipv4 ,那么在 bind 的时候,首先要创建一个 struct sockaddr_in local 结构体,然后往 loacl 中填入数据,接着调用 bind 接口,该接口的第二个参数传入 (struct sockaddr*)&local ,传入 lock 的地址并强转成 struct sockaddr* 类型。(可以查看下面的示例帮助理解)
关于网络字节序与主机字节序。
主机字节序就是我们平常说的大端和小端模式:不同的CPU有不同的字节序类型,这些字节序是指整数在内存中保存的顺序,这个叫做主机序。引用标准的Big-Endian和Little-Endian的定义如下:
a) Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。
b) Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。
网络字节序:4个字节的32 bit值以下面的次序传输:首先是0~7bit,其次8~15bit,然后16~23bit,最后是24~31bit。这种传输次序称作大端字节序。由于TCP/IP首部中所有的二进制整数在网络中传输时都要求以这种次序,因此它又称作网络字节序。字节序,顾名思义字节的顺序,就是大于一个字节类型的数据在内存中的存放顺序,一个字节的数据没有顺序的问题了。
所以:在将一个地址绑定到socket的时候,请先将主机字节序转换成为网络字节序,而不要假定主机字节序跟网络字节序一样使用的是Big-Endian,务必将其转化为网络字节序再赋给socket。
实际上,我们并不需要过于关心主机序列、网络序列是怎么组织的,因为有对应的接口帮我们实现这两种序列之间的转化,下面是一些网络字节序转为主机字节序、主机字节序转为网络字节序的函数。
#include
uint32_t htonl(uint32_t hostlong); // 主机转网络,32位数据
uint16_t htons(uint16_t hostshort); // 主机转网络,16位数据
uint32_t ntohl(uint32_t netlong); // 网络转主机,32位数据
uint16_t ntohs(uint16_t netshort); // 网络转主机,16位数据
如下,是一个使用 bind 的例子。
// 1.创建socket
listensock_ = socket(AF_INET, SOCK_STREAM, 0);
// 2. bind
struct sockaddr_in local;
memset(&local, 0, sizeof(local));
local.sin_family = AF_INET;
local.sin_port = htons(8888);
local.sin_addr.s_addr = htonl(INADDR_ANY); // INADDR_ANY 表示本机的所有地址
if (bind(listensock_, (struct sockaddr *)&local, sizeof(local)) < 0)
{
cerr << "bind error " << strerror(errno) << endl;
exit(-1);
}
int listen(int sockfd, int backlog); // 成功返回0,失败返回 -1
listen()函数只能在服务器进程中使用,让服务器进程进入监听状态,等待客户端的连接请求,listen()函数在一般在 bind()函数之后调用,在 accept()函数之前调用。
listen函数的第一个参数即为要监听的socket描述字,第二个参数表示本服务器中,全连接队列中数据的个数 = backlog + 1。socket()函数创建的socket默认是一个主动类型的,listen函数将socket变为被动类型的,等待客户的连接请求。
参数 backlog 用来描述 sockfd 的等待连接队列能够达到的最大值。在服务器进程正处理客户端连接请求的时候,可能还存在其它的客户端请求建立连接,因为 TCP 连接是一个过程,由于同时尝试连接的用户过多,使得服务器进程无法快速地完成所有的连接请求,那怎么办呢?直接丢掉其他客户端的连接肯定不是一个很好的解决方法。因此内核会在自己的进程空间里维护一个队列,这些连接请求就会被放入一个队列中,服务器进程会按照先来后到的顺序去处理这些连接请求,这样的一个队列内核不可能让其任意大,所以必须有一个大小的上限,这个 backlog 参数告诉内核使用这个数值作为队列的上限。而当一个客户端的连接请求到达并且该队列为满时,客户端可能会收到一个表示连接失败的错误,本次请求会被丢弃不作处理。
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen); // 成功则返回 0,失败返回-1
该函数用于客户端应用程序中,客户端调用 connect()函数将套接字 sockfd 与远程服务器进行连接,参数 addr 指定了待连接的服务器的 IP 地址以及端口号等信息,参数 addrlen 指定了 addr 指向的 struct sockaddr对象的字节大小。
客户端通过 connect()函数请求与服务器建立连接,对于 TCP 连接来说,调用该函数将发生 TCP 连接的握手过程,并最终建立一个 TCP 连接,而对于 UDP 协议来说,调用这个函数只是在 sockfd 中记录服务器IP 地址与端口号,而不发送任何数据。
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen); // 成功返回一个文件描述符,失败返回-1。
TCP服务器端依次调用socket()、bind()、listen()之后,就会监听指定的socket地址了。TCP客户端依次调用socket()、connect()之后就向TCP服务器发送了一个连接请求。TCP服务器监听到这个请求之后,就会调用accept()函数取接收请求,这样连接就建立好了。之后就可以开始网络I/O操作了,即类同于普通文件的读写I/O操作。
如果accept成功返回,则服务器与客户已经正确建立连接了,此时服务器通过accept返回的套接字来完成与客户的通信。服务器要给客户端发消息,那么必须使用 accept 成功返回的套接字,而不是使用 socket() 函数创建出来的套接字。
在调用 accept 成功之后,它的第二个参数就包含了客户端主机的信息,但是,addr 结构体中,主机的IP地址是用 32 位整型变量来表示的,和常用的字符串风格不符合,所以,需要将IP地址 进行从整形到字符串风格的转换。此外,服务器端在调用 bind() 接口的时候,如果 struct sockaddr 中的数据是自己指定 IP 地址(例如 “192.168.1.1”),而不是 INADDR_ANY (所有的IP地址,这是整形的风格),那么也需要进行从字符串风格,转换为整形,因为 struct sockaddr 结构体中,IP地址的类型就是整形。
#include
#include
#include
int inet_aton(const char *cp, struct in_addr *inp);
in_addr_t inet_addr(const char *cp);
in_addr_t inet_network(const char *cp);
char *inet_ntoa(struct in_addr in);
struct in_addr inet_makeaddr(int net, int host);
in_addr_t inet_lnaof(struct in_addr in);
in_addr_t inet_netof(struct in_addr in);
常用的有两个:
注意:
accept默认会阻塞进程,直到有一个客户连接建立后返回,它返回的是一个新可用的套接字,这个套接字是连接套接字。
此时我们需要区分两种套接字:
一个服务器通常通常仅仅只创建一个监听socket描述字,它在该服务器的生命周期内一直存在。此外,内核为每个由服务器进程接受的客户连接创建了一个已连接socket 描述字,当服务器完成了对某个客户的服务,相应的已连接socket描述字就被关闭。可以形象地比喻为,一个饭店,门口有一位负责招待客人进入店里的员工,店内有多个给客人提供服务的员工,门口的员工只负责揽客,店内的员工只负责招待客人,对应为:监听套接字只负责建立连接,连接套接字只负责进程之间的通信。
如果使用一个描述字的话,那么它的功能太多,使得使用很不直观,同时在内核确实产生了一个这样的新的描述字。连接套接字socketfd_new 并没有占用新的端口与客户端通信,依然使用的是与监听套接字socketfd一样的端口号。
如下是是用 accept 的一个例子:
struct sockaddr_in client;
socklen_t len = sizeof(client);
int sock = accept(listensock_, (struct sockaddr *)&client, &len);
if (sock < 0)
{
cerr << "accept error " << strerror(errno) << endl;
exit(-1);
}
string clientip = inet_ntoa(client.sin_addr);
uint16_t clientport = ntohs(client.sin_port);
至此服务器与客户已经建立好连接了。可以调用网络I/O进行读写操作了,即实现了网咯中不同进程之间的通信!网络I/O操作有下面几组:
以 read、write 两个函数为例
ssize_t read(int fd, void *buf, size_t count);
ssize_t write(int fd, const void *buf, size_t count);
read函数是负责从fd中读取内容。当读成功时,read返回实际所读的字节数,如果返回的值是0表示已经读到文件的结束了,小于0表示出现了错误。如果错误为EINTR说明读是由中断引起的,如果是ECONNREST表示网络连接出了问题。
write函数将buf中的nbytes字节内容写入文件描述符fd.成功时返回写的字节数。失败时返回-1,并设置errno变量。 在网络程序中,当我们向套接字文件描述符写时有俩种可能:
其它的便不仔细介绍这几对I/O函数了,主要就是分清返回值为 -1 的时候,errno 的情况,因为写程序的时候可以根据这个来区分不同的处理情况,具体参见man文档或者baidu、Google。
#include
int close(int fd);
在服务器与客户端建立连接之后,会进行一些读写操作,完成了读写操作就要关闭相应的socket描述字,好比操作完打开的文件要调用fclose关闭打开的文件。
这里写一个 UDP 通用的客户端和服务器的程序。
#pragma once
#include
#include
#include
#include
#include
#include
#include
#include
#include
typedef struct sockaddr sockaddr;
typedef struct sockaddr_in sockaddr_in;
class UdpSocket {
public:
UdpSocket() : fd_(-1)
{
}
bool Socket()
{
fd_ = socket(AF_INET, SOCK_DGRAM, 0);
if (fd_ < 0) {
perror("socket");
return false;
}
return true;
}
bool Close()
{
close(fd_);
return true;
}
bool Bind(const std::string& ip, uint16_t port)
{
sockaddr_in addr;
addr.sin_family = AF_INET;
addr.sin_addr.s_addr = inet_addr(ip.c_str());
addr.sin_port = htons(port);
int ret = bind(fd_, (sockaddr*)&addr, sizeof(addr));
if (ret < 0) {
perror("bind");
return false;
}
return true;
}
bool RecvFrom(std::string* buf, std::string* ip = NULL, uint16_t* port = NULL)
{
char tmp[1024 * 10] = {0};
sockaddr_in peer;
socklen_t len = sizeof(peer);
ssize_t read_size = recvfrom(fd_, tmp,
sizeof(tmp) - 1, 0, (sockaddr*)&peer, &len);
if (read_size < 0) {
perror("recvfrom");
return false;
}
// 将读到的缓冲区内容放到输出参数中
buf->assign(tmp, read_size);
if (ip != NULL) {
*ip = inet_ntoa(peer.sin_addr);
}
if (port != NULL) {
*port = ntohs(peer.sin_port);
}
return true;
}
bool SendTo(const std::string& buf, const std::string& ip, uint16_t port)
{
sockaddr_in addr;
addr.sin_family = AF_INET;
addr.sin_addr.s_addr = inet_addr(ip.c_str());
addr.sin_port = htons(port);
ssize_t write_size = sendto(fd_, buf.data(), buf.size(), 0, (sockaddr*)&addr, sizeof(addr));
if (write_size < 0) {
perror("sendto");
return false;
}
return true;
}
private:
int fd_;
};
#pragma once
#include "udp_socket.hpp"
#include
typedef std::function<void (const std::string&, std::string* resp)> Handler;
class UdpServer {
public:
UdpServer()
{
assert(sock_.Socket());
}
~UdpServer()
{
sock_.Close();
}
bool Start(const std::string& ip, uint16_t port, Handler handler)
{
// 1. 创建 socket
// 2. 绑定端口号
bool ret = sock_.Bind(ip, port);
if (!ret) {
return false;
}
// 3. 进入事件循环
for (;;) {
// 4. 尝试读取请求
std::string req;
std::string remote_ip;
uint16_t remote_port = 0;
bool ret = sock_.RecvFrom(&req, &remote_ip, &remote_port);
if (!ret) {
continue;
}
std::string resp;
// 5. 根据请求计算响应
handler(req, &resp);
// 6. 返回响应给客户端
sock_.SendTo(resp, remote_ip, remote_port);
printf("[%s:%d] req: %s, resp: %s\n", remote_ip.c_str(), remote_port,
req.c_str(), resp.c_str());
}
sock_.Close();
return true;
}
private:
UdpSocket sock_;
};
#pragma once
#include "udp_socket.hpp"
class UdpClient {
public:
UdpClient(const std::string& ip, uint16_t port) : ip_(ip), port_(port)
{
assert(sock_.Socket());
}
~UdpClient()
{
sock_.Close();
}
bool RecvFrom(std::string* buf)
{
return sock_.RecvFrom(buf);
}
bool SendTo(const std::string& buf)
{
return sock_.SendTo(buf, ip_, port_);
}
private:
UdpSocket sock_;
// 服务器端的 IP 和 端口号
std::string ip_;
uint16_t port_;
};