小朱同学..

Socket套接字编程

文章目录

1、网络字节序列
2、socket编程接口
- <1>socket常见ARI
- <2>sockaddr结构 VS sockaddr_in结构
3、UDP套接字
4、TCP套接字
5、总结

1、网络字节序列

内存中的多字节数据相对于内存地址有大端和小端之分, 磁盘文件中的多字节数据相对于文件中的偏
移地址也有大端小端之分, 网络数据流同样有大端小端之分。那么如何定义网络数据流的地址呢?

发送主机通常将发送缓冲区中的数据按内存地址从低到高的顺序发出;
接收主机把从网络上接到的字节依次保存在接收缓冲区中,也是按内存地址从低到高的顺序保存;
因此,网络数据流的地址应这样规定:先发出的数据是低地址,后发出的数据是高地址;
TCP/IP协议规定,网络数据流应采用大端字节序,即低地址高字节。
不管这台主机是大端机还是小端机, 都会按照这个TCP/IP规定的网络字节序来发送/接收数据;
如果当前发送主机是小端, 就需要先将数据转成大端; 否则就忽略, 直接发送即可;

为使网络程序具有可移植性,使同样的C代码在大端和小端计算机上编译后都能正常运行,可以调用以下库函数做网络字节序和主机字节序的转换。

这些函数名很好记,h表示host(主机),n表示network(网络),l表示32位长整数,s表示16位短整数。
例如htonl表示将32位的长整数从主机字节序转换为网络字节序,例如将IP地址转换后准备发送。
如果主机是小端字节序,这些函数将参数做相应的大小端转换然后返回。
如果主机是大端字节序,这些函数不做转换,将参数原封不动地返回。

2、socket编程接口

<1>socket常见ARI

socket()打开一个网络通讯端口,如果成功的话,就像open()一样返回一个文件描述符;
应用程序可以像读写文件一样用read/write在网络上收发数据;
对于IPv4, family参数指定为AF_INET;
对于TCP协议,type参数指定为SOCK_STREAM, 表示面向流的传输协议
protocol参数指定为0即可

服务器程序所监听的网络地址和端口号通常是固定不变的,客户端程序得知服务器程序的地址和端口号后就可以向服务器发起连接; 服务器需要调用bind绑定一个固定的网络地址和端口号;
bind()的作用是将参数sockfd和myaddr绑定在一起, 使sockfd这个用于网络通讯的文件描述符监听myaddr所描述的地址和端口号;
struct sockaddr *是一个通用指针类型,myaddr参数实际上可以接受多种协议的sockaddr结构体,而它们的长度各不相同,所以需要第三个参数addrlen指定结构体的长度

listen()声明sockfd处于监听状态,

如何理解listen第二个参数backlog？

backlog + 1表示在TCP层能够建立正常连接的个数(处于ESTABLISHED状态个数)，也就是最多允许有backlog + 1个客户端处于连接等待状态, 如果接收到更多的连接请求就忽略将其置为SYN_RECV状态表明三次握手没有成功, backlog不会设置太大(一般是5)。

注：正常连接的个数并不是只能在服务器维护这几个连接，而是在服务器忙没有来得及accpet取走所维护的连接个数。

其实上面之所以会有处于ESTABLISHED和SYN_RECV状态是因为Linux内核协议栈为一个tcp连接管理使用两个队列:

半链接队列（用来保存处于SYN_SENT和SYN_RECV状态的请求）
全连接队列（accpetd队列）（用来保存处于established状态，但是应用层没有调用accept取走的请求）。受listen第二个参数的影响，这个队列的长度也就是第二个参数backlog + 1。

全连接队列可以没有吗？为什么要维护这个队列？为什么不能太长？

不能，全连接队列存在的意义是为了能够使我们的服务充分利用，若是没有的话当我们服务端处理完客户端的请求时，此时去accept来获取链接就会获取不到。从而服务端就会处于一段空闲状态，也就不能保证服务端的效率最大化。
有可能此时我们的服务太忙了已经把服务打满了，来不及去接收新的服务请求只能先将其维护好使其处于ESTABLISHED状态，当服务处理完就可以立刻accept获取到连接。
维护队列也是有成本的，队列太长维护成本太高，不如把这部分物理内存让我们的服务来使用从而提升效率。所以我们维护的全连接队列实际是个短队列。

三次握手完成后, 服务器调用accept()接受连接;
如果服务器调用accept()时还没有客户端的连接请求,就阻塞等待直到有客户端连接上来;
address 是一个传出参数,accept()返回时传出客户端的地址和端口号;
如果给address 参数传NULL,表示不关心客户端的地址;
address _len参数是一个传入传出参数(value-result argument), 传入的是调用者提供的, 缓冲区address的长度以避免缓冲区溢出问题, 传出的是客户端地址结构体的实际长度(有可能没有占满调用者提供的缓冲区);

客户端需要调用connect()连接服务器;
connect和bind的参数形式一致, 区别在于bind的参数是自己的地址, 而connect的参数是对方的地址;

<2>sockaddr结构 VS sockaddr_in结构

socket API是一层抽象的网络编程接口,适用于各种底层网络协议,如IPv4、IPv6，然而, 各种网络协议的地址格式并不相同。

IPv4和IPv6的地址格式定义在netinet/in.h中,IPv4地址用sockaddr_in结构体表示,包括16位地址类型, 16位端口号和32位IP地址。
IPv4、IPv6地址类型分别定义为常数AF_INET、AF_INET6。这样,只要取得某种sockaddr结构体的首地址,不需要知道具体是哪种类型的sockaddr结构体,就可以根据地址类型字段确定结构体中的内容。
socket API可以都用struct sockaddr *类型表示, 在使用的时候需要强制转化成sockaddr_in; 这样的好处是程序的通用性, 可以接收IPv4, IPv6, 以及UNIX Domain Socket各种类型的sockaddr结构体指针做为参数;

sockaddr结构

struct sockaddr
  {
    __SOCKADDR_COMMON (sa_);	/* Common data: address family and length.  */
    char sa_data[14];		/* Address data.  */
  };

sockaddr_in结构

struct sockaddr_in
  {
    __SOCKADDR_COMMON (sin_);
    in_port_t sin_port;			/* Port number.  */
    struct in_addr sin_addr;		/* Internet address.  */

    /* Pad to size of `struct sockaddr'.  */
    unsigned char sin_zero[sizeof (struct sockaddr) -
			   __SOCKADDR_COMMON_SIZE -
			   sizeof (in_port_t) -
			   sizeof (struct in_addr)];
  };

虽然socket api的接口是sockaddr, 但是我们真正在基于IPv4编程时, 使用的数据结构是sockaddr_in; 这个结构里主要有三部分信息: 地址类型, 端口号, IP地址.

3、UDP套接字


/接收套接字上的数据
ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,struct sockaddr *src_addr, socklen_t *addrlen);    

/返回值：接收到的字节数，出错返回-1

/将消息发给套接字
ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,const struct sockaddr *dest_addr, socklen_t addrlen); 

参数：sockfd:文件描述符
     buf:接收缓存区
     len:缓存区大小
     flags:一般设为0
     dest_addr和addrlen为输出型参数
    
FILE *popen(const char *command, const char *type); 
/执行command中的命令,执行结果以文件返回。底层是fock创建子进程利用pipe通信。

下面上手写代码，先说下最终实现功能，通过套接字来进行UDP通信，在客户端上输入简单命令，服务端负责执行然后将执行结果回显到客户端。

server端

#include
#include
#include
#include
#include
#include

void Usage(std::string proc)
{
    std::cout << "Usage: \n\t" << proc << " server_post" << std:: endl;
}

// ./udp_server  serverport 
int main(int argc, char* argv[])
{
    if(argc != 2)
    {
        Usage(argv[0]);
        return 1;
    }
    //1.创建套接字，打开网络文件
    int sock = socket(AF_INET, SOCK_DGRAM, 0);
    if(sock < 0)
    {
        std::cerr<< "socket create error: " << errno << std::endl;
        return 1;
    }
    uint16_t port = atoi(argv[1]);
    // 2.给服务器绑定端口和ip(特殊处理)
    struct sockaddr_in local;
    local.sin_family = AF_INET;
    local.sin_port = htons(port); //此处的端口号,是我们计算机上的变量,是主机序列

    //INADDR_ANY-> 要所有发送到该主机,发送到该端口的数据
    local.sin_addr.s_addr = INADDR_ANY; //INADDR_ANY 实际就是值为0的一个宏

    if(bind(sock, (struct sockaddr*)&local, sizeof(local)) < 0)
    {
        std::cerr << "bind error: " << errno << std::endl;
        return 2;
    }

    //3.提供服务
    bool quit = false;
    char buffer[1024];
    while(!quit)
    {
        struct sockaddr_in peer;      //谁发送过来的
        socklen_t len = sizeof(peer); //长度
        //接收数据,最后两个参数为输型参数
        ssize_t cnt = recvfrom(sock, buffer, sizeof(buffer) - 1, 0 , (struct sockaddr*)&peer, &len);
        if(cnt > 0)
        {
            buffer[cnt] = 0; //向字符串一样看待

            //将buffer当成字符串命令来执行
            FILE* fp = popen(buffer, "r"); //popen,创建子进程,执行buffer中的命令，执行结果以文件方式返回
            std::string echo_hello;
            char line[1024] = {0};
            while(fgets(line, sizeof(line),fp) != NULL)
            {
                echo_hello += line;
            }
            pclose(fp);

            std::cout << "clinet# " << buffer << std::endl;

        
            //发送数据
            sendto(sock, echo_hello.c_str(), echo_hello.size(),0, (struct sockaddr*)&peer, len); 
        }
    }
    return 0;
}

client端

#include
#include
#include
#include
#include
#include

void Usage(std::string proc)
{
    std::cout << "Usage: \t" << proc << "  server_ip  server_post" << std:: endl;
}
// ./client server_ip server_port -->我们在执行的时候把ip和端口号传进来,参数不对就报错
int main(int argc, char *argv[])
{
    if(argc != 3)
    {
        Usage(argv[0]);
        return 0;
    }
    
    //1.创建套接字,打开网络文件
    int sock = socket(AF_INET, SOCK_DGRAM, 0);
    if(sock < 0)
    {
        std::cerr << "socket error: " << errno << std::endl;
        return 1;
    }

    //客户端需要显示的bind的吗？
    // a.首先，客户端也必须要有ip和port
    // b.但是，客户端不需要显示的bind！一旦显示bind就必须明确,client要和哪一个port关联
    // client指明的端口号，在client端一定会有吗？？有可能被占用，被占用导致client无法使用
    // server要的是port必须明确，而且不变，但client只要有就行！一般是由OS自动给你bind()
    // 就是client正常发送数据的时候，OS会自动给你bind，采用的是随机端口的方式！
    
    //2.发文件给谁
    struct sockaddr_in server;
    server.sin_family = AF_INET;            //通讯协议
    server.sin_port = ntohs(atoi(argv[2])); //端口号
    server.sin_addr.s_addr = inet_addr(argv[1]); // ip
    
    //3.使用服务
    while(1)
    {
        //发送数据 ->数据从哪里来
        std::cout << "MyShell $ ";
        char message[1024] = {0};
        fgets(message, sizeof(message), stdin);

        //发送数据
        sendto(sock, message, sizeof(message), 0, (struct sockaddr*)&server, sizeof(server));

        //接收数据
        struct sockaddr_in temp;    //此处temp就是一个“占位符”
        socklen_t len = sizeof(temp);
        char buffer[1024];
        ssize_t cnt = recvfrom(sock, buffer, sizeof(buffer), 0, (struct sockaddr*)& temp, &len);
        if(cnt > 0)
        {
            //在网络通信中,只有报文大小,或者字节流中字节个数,没有C/C++中字符串的概念
            buffer[cnt] = 0;
            std::cout << "server echo# " << buffer << std::endl;
        }
        else
        {
			//出错处理
        }   
    }
    return 0;
}

运行结果：

4、TCP套接字

通过套接字来进行TCP通信，在客户端上输入字符串，服务端显示并回显到客户端。