C语言网络编程基础(linux)

目录

  • 文件描述符与套接字
  • 网络编程的基本流程
  • 基础的函数和结构体(持续更新)
    • socket函数
    • sockaddr和sockaddr_in结构体
    • bind函数
    • listen函数
    • accept函数
    • recv函数
    • writev函数
    • readv函数
    • connect函数
    • fcntl函数
  • epoll相关函数
    • epoll_create
    • epoll_ctl函数
    • epoll_wait函数

文件描述符与套接字

在linux操作系统下,有万物皆文件的概念,当一个进程想要打开/创建一个文件时,内核会给进程返回一个文件描述符,文件描述符是一个非负数,常用int类型表示,起到索引的作用,是为了高效管理进程打开/创建的文件的,指向的是被打开的文件。所有I/O的系统操作也都是通过文件描述符来的;每一个进程都有一个文件描述符表,里面记录的就是进程打开/创建文件的记录

套接字是一种特殊的文件描述符,用于进程和进程之间的网络通信,常用在网络编程中

进程和进程之间通信主要有六种方式,分别是:
1.管道
2.消息队列
3.共享内存
4.信号
5.信号量
6.套接字.

套接字便是其中的一种.

网络编程的基本流程

C语言网络编程基础(linux)_第1张图片
这个流程很经典,就不过多赘述了.

基础的函数和结构体(持续更新)

函数太多了,这里只记录一些常用的函数

socket函数

#include 

int socket(int domain, int type, int protocol);

其中
domain表示指定套接字的地址族或协议族。常见的值包括:

AF_INET:用于IPv4 地址族。
AF_INET6:用于IPv6 地址族。
AF_UNIX 或 AF_LOCAL:用于本地(Unix 域)套接字通信。

type表示指定套接字的类型,常见的值包括:

SOCK_STREAM:用于基于流的 TCP 套接字。
SOCK_DGRAM:用于基于数据报的 UDP 套接字。
SOCK_RAW:用于原始套接字,允许更底层的数据包处理。

protocol 参数通常为 0,表示选择默认的协议。在大多数情况下,操作系统会自动选择正确的协议,例如,对于 IPv4 TCP 套接字,它会选择 TCP 协议。

返回值:socket函数的返回值是一个文件描述符(fd),经常作为网络编程中其他函数的参数.

常见的使用方式

int sockfd = socket(AF_INET, SOCK_STREAM, 0);
    if (sockfd == -1) {
        perror("socket");
        exit(EXIT_FAILURE);
    }

sockaddr和sockaddr_in结构体

sockaddr

#include 
struct sockaddr {  
     sa_family_t sin_family;//地址族
    char sa_data[14]; //14字节,包含套接字中的目标地址和端口信息               
   }; 

sockaddr已经被sockaddr_in取代了,这里就不详细说了。

sockaddr_in

#include或#include 

struct sockaddr_in {
    short int sin_family;      // 地址族(Address Family),通常为 AF_INET
    unsigned short int sin_port;  // 端口号(Port Number)
    struct in_addr sin_addr;     // IPv4 地址(32 位的 IPv4 地址)
    unsigned char sin_zero[8];   // 不使用,填充字节
};

sockaddr_in 是用于表示 IPv4 地址的 C 语言结构体,通常在网络编程中与套接字套接字相关的函数一起使用

常见的使用方式:

struct sockaddr_in addr;
    memset(&addr, 0, sizeof(addr));
    addr.sin_family = AF_INET;//绑定地址族,使用ipv4
    addr.sin_addr.s_addr = htonl(INADDR_LOOPBACK); // 127.0.0.1 //绑定地址
    addr.sin_port = htons(8000); //绑定端口

bind函数

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

1.sockfd参数表示要进行绑定的套接字文件描述符(是socket函数的返回值)

2.sockaddr 结构体是刚才上述所说的结构体,但是sockaddr不如sockaddr_in好用,所以一般情况下是定义一个sockaddr_in结构体,然后使用强制转换成sockaddr类型

3.addrlen参数表示结构体的长度

常用的使用方式:

 struct sockaddr_in server_addr;
    server_addr.sin_family = AF_INET;
    server_addr.sin_port = htons(8080);  // 端口号 8080
    server_addr.sin_addr.s_addr = INADDR_ANY;  // 任意地址
    memset(server_addr.sin_zero, 0, sizeof(server_addr.sin_zero));
    
if (bind(sockfd, (struct sockaddr *)&server_addr, sizeof(server_addr)) == -1) {
        perror("Bind failed");
        exit(1);
    }

listen函数

listen函数作用:让套接字变成可以被动连接的状态,等待客户端的连接

int listen(int sockfd, int backlog);

sockfd参数表示文件描述符

backlog参数表示等待连接队列的最大长度,即在调用 accept 函数之前可以排队等待的最大连接数。通常,这个值为一个正整数,决定了同时等待的连接数量。

常用的使用方法:

int backlog = 5; // 最大等待连接数
if (listen(sockfd, backlog) == -1) {
        perror("Listen failed");
        exit(1);
    }

accept函数

accept 函数用于接受传入的连接请求,通常在服务器端用于接受客户端的连接

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

1.sockfd是文件描述符
2.addr是 sockaddr结构体,用于接收客户端的地址,端口等信息,所以跟Bind函数调用时的sockaddr要区分开来

3.addrlen是结构体的大小

常见的使用方式:

 struct sockaddr_in new_addr;
 int new_sock;
 
 addr_size = sizeof(new_addr);
 new_sock = accept(sockfd, (struct sockaddr*)&new_addr, &addr_size);

返回值:在成功接受连接请求时返回一个新的套接字,该套接字用于与客户端进行通信。这个新套接字是已连接套接字,它是服务器与客户端之间的通信通道。

这里要重点强调一下,我们后续进行客户端和服务端之间的通信时,使用的是accept函数返回的新套接字,而之前用socket函数创建的旧套接字仍然在监听新的连接请求(用于接收连接请求,而不是直接用来通信)

recv函数

recv 函数用于从已连接套接字(或者数据报套接字)接收数据
注意是已连接的套接字

int recv(int sockfd, void *buf, size_t len, int flags);

1.sockfd是文件描述符
2.buf是接收数据的缓冲区指针
3.len是缓冲区的大小
4.flags通常设置为0

返回值是recv函数读到的字节数,如果返回值为 -1,表示读取失败,失败的原因会存储在errno里面
recv函数的返回值总结

常见的使用方式:

int bytes_read=recv(sockfd,buffer,sizeof(buffer),0);

recv函数是一个阻塞函数,如果在读取时,发现并没有数据可以读,就会被阻塞住,如果不想被阻塞住,可以用fcntl函数将文件描述符设置为非阻塞模式,具体操作请看fcntl函数.

recv 和 read 函数在某些方面类似,因为它们都用于从文件描述符中读取数据。然而,它们有一些区别:

来源:
recv 是套接字库函数,用于在网络编程中接收数据。它可以用于套接字(sockets)等网络通信相关的操作。
read 是标准C I/O 函数,通常用于文件描述符,但也可以用于套接字等。它更一般化,可用于读取任何可读的文件描述符。

参数:
recv 在最后一个参数中可以指定额外的选项(flags),允许对接收操作进行控制。
read 没有额外的选项参数,它只接受文件描述符、缓冲区和长度。

错误处理:
recv 返回的错误值可能包含更多关于套接字通信的信息,如连接已断开等。因此,错误代码可能更详细。
read 的错误码可能相对简单,不会提供关于底层通信的额外信息,但它可用于读取多种文件类型。

用法:
recv 主要用于网络编程,特别是在套接字通信中,用于接收数据。
read 主要用于文件和通用文件描述符的读取,可用于从文件、管道、套接字等读取数据。

writev函数

writev 函数用于将多个分散的数据写入文件描述符(通常是文件或套接字)
也被称为集中写,与write函数的最大区别就是writev函数可以一次性写出多个缓冲区,而write函数一次性只能写出一个缓冲区

ssize_t writev(int fd, const struct iovec *iov, int iovcnt);

1.fd参数表示文件描述符
2.iov参数表示指向iovec结构体数组的结构体指针
3.iovcnt表示数组中结构体的数量

iovec数组

struct iovec {
    void *iov_base;    // 缓冲区的起始地址
    size_t iov_len;    // 缓冲区的长度
};

常见的使用方式:

    iov[0].iov_base = buf1; //缓冲区的起始地址
    iov[0].iov_len = strlen(buf1);//缓冲区的长度!
    iov[1].iov_base = buf2;
    iov[1].iov_len = strlen(buf2);

    int fd = 1;  
    ssize_t bytes_written = writev(fd, iov, 2);//将这两个缓冲区的内容全部
    //                                           写入文件描述符

readv函数

用于把文件描述符中的数据一次性读到多个缓冲区中,也叫作分散读

ssize_t readv(int fd, const struct iovec *iov, int iovcnt);

使用方法和writev类似

iov[0].iov_base= buf1;
iov[0].iov_len=sizeof(buf1);
iov[1].iov_base = buf2;
iov[1].iov_len = sizeof(buf2);
ssize_t bytes_read = readv(fd,iov,2);

connect函数

connect 函数用于建立一个客户端套接字与服务端套接字之间的连接。它在客户端套接字上调用,指示客户端要连接到指定的服务器地址和端口。

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

1.sockfd表示要连接的客户端文件描述符
2.sockaddr表示连接时的地址及端口等信息
3.addrlen表示结构体的大小

常见使用方式:

int sockfd = socket(AF_INET, SOCK_STREAM, 0);
    if (sockfd == -1) {
        perror("socket");
        exit(1);
    }

    // 准备服务器地址信息
    struct sockaddr_in server_addr;
    server_addr.sin_family = AF_INET;
    server_addr.sin_port = htons(8080);  // 服务器端口
    server_addr.sin_addr.s_addr = inet_addr("127.0.0.1");  // 服务器IP地址

    // 连接到服务器
    if (connect(sockfd, (struct sockaddr *)&server_addr, sizeof(server_addr)) == -1) {
        perror("connect");
        exit(1);
    }

fcntl函数

fcntl 函数是一个在 Unix 和类 Unix 操作系统中使用的函数,主要用于控制文件描述符(file descriptor)的属性和执行各种操作。这包括修改文件状态标志、获取或设置文件描述符的属性、以及执行非阻塞操作等。具体来说,fcntl 函数的一些常见用途包括:

1.修改文件状态标志:通过 fcntl 函数,你可以修改文件描述符的状态标志,例如将文件设置为非阻塞模式,以便在读写操作时不会被阻塞。这是通过设置 O_NONBLOCK 标志实现的。

2.获取或设置文件描述符属性:你可以使用 fcntl 函数获取或设置文件描述符的各种属性,如获取或设置文件的访问模式、文件的拥有者、或文件的屏蔽字(file mode creation mask)等。

3.复制文件描述符:你可以使用 F_DUPFD 命令来复制一个文件描述符,这会创建一个新的文件描述符,指向与原始文件描述符相同的文件。

4.获取或设置文件锁:fcntl 函数还可用于获取或设置文件锁,以确保多个进程可以安全地访问共享文件。你可以使用 F_GETLK 命令来获取文件锁信息,或使用 F_SETLK 和 F_SETLKW 命令来设置或阻塞文件锁。

5.取消文件锁:通过 F_SETLK 命令,你还可以用来取消现有的文件锁。

参考链接:fcntl

#include 

int fcntl(int fd, int cmd, ... /* arg */);

1.fd是要操作的文件描述符
2.cmd是对应的操作命令,如下:

F_DUPFD:创建一个新的文件描述符,指向与原始文件描述符相同的文件。

F_GETFD:获取文件描述符的标志。

F_SETFD:设置文件描述符的标志。

F_GETFL:获取文件的状态标志(如 O_RDONLY、O_WRONLY、O_NONBLOCK 等)。

F_SETFL:设置文件的状态标志。

F_GETOWN:获取文件描述符的所有权(如进程 ID 或进程组 ID)。

F_SETOWN:设置文件描述符的所有权。

F_GETLK:获取文件锁的信息。

F_SETLK:设置文件锁,如果锁已存在则返回错误。

F_SETLKW:设置文件锁,如果锁已存在则等待。

使用例子:

//对文件描述符设置非阻塞
int setnonblocking(int fd)
{
    int old_option = fcntl(fd, F_GETFL);
    int new_option = old_option | O_NONBLOCK;// O_NONBOLOCK为非阻塞标志.
    fcntl(fd, F_SETFL, new_option);
    return old_option;
}

因为文件描述符的标志是一个位掩码,所以必须要先获取原来的状态,再跟新状态或运算,才可以修改文件描述符的状态.


epoll相关函数

epoll是linux操作系统,内核提供给用户态专门用于多路复用的系统调用函数,其作用是可以让一个进程维护多个socket.

epoll的流程
1.使用epoll_create函数创建一个指向内核事件表的文件描述符

2.使用epoll_ctl函数将想要监听的socket和想要监听的事件类型注册到epoll上

3.使用epoll_wait函数等待事件到达,进程/线程通过对应的事件处理方式处理事件

epoll_create

#include 
int epoll_create(int size)

作用:创建一个指向epoll内核事件表的文件描述符,返回值用于epoll其他函数的第一个参数

epoll_ctl函数

#include 
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)

用于将文件描述符注册到epoll上,或者对已经注册好的文件描述符修改和删除

1.第一个参数是epoll_create函数的句柄
2.第二个参数是一个命令,分别用三个宏表示注册,修改,删除

EPOLL_CTL_ADD (注册新的fd到epfd),
EPOLL_CTL_MOD (修改已经注册的fd的监听事件),
EPOLL_CTL_DEL (从epfd删除一个fd);

3.event参数表示要监听的事件

epoll_event结构体

struct epoll_event {
__uint32_t events; //表示事件的类型
epoll_data_t data; //
};

events对应的事件类型有如下几种:
EPOLLIN:表示对应的文件描述符可以读(包括对端SOCKET正常关闭)

EPOLLOUT:表示对应的文件描述符可以写

EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来)

EPOLLERR:表示对应的文件描述符发生错误

EPOLLHUP:表示对应的文件描述符被挂断;

EPOLLET:将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)而言的

EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里


epoll_data_t是一个共用体(联合体)表示用户数据,用来存储额外的信息

typedef union epoll_data {
    void *ptr;
    int fd;
    uint32_t u32;
    uint64_t u64;
} epoll_data_t;

ptr:一个指向 void 类型的指针,通常用于关联一个任意类型的指针。
fd:一个整数,通常用于关联一个文件描述符(比如套接字描述符)。
u32:一个32位的无符号整数。
u64:一个64位的无符号整数。

epoll_ctl常见的使用方式:(这里如果看不太懂events下面还有详解)

注册:

     epoll_event event;
     event.data.fd = fd;//设置文件描述符!
 #ifdef ET
     event.events = EPOLLIN | EPOLLET | EPOLLRDHUP;
 8#endif
 
#ifdef LT
    event.events = EPOLLIN | EPOLLRDHUP;
#endif

    if (one_shot)
        event.events |= EPOLLONESHOT;
    epoll_ctl(epollfd, EPOLL_CTL_ADD, fd, &event);
    setnonblocking(fd);

删除:

epoll_ctl(epollfd, EPOLL_CTL_DEL, fd, 0);
   close(fd);

修改

void modfd(int epollfd, int fd, int ev)
 {
     epoll_event event;
     event.data.fd = fd;
 
 #ifdef ET
     event.events = ev | EPOLLET | EPOLLONESHOT | EPOLLRDHUP;
 #endif
 
#ifdef LT
    event.events = ev | EPOLLONESHOT | EPOLLRDHUP;
#endif

    epoll_ctl(epollfd, EPOLL_CTL_MOD, fd, &event);
}

epoll_wait函数

用于等待事件的发生,当监控的文件描述符上有事件发生时,返回有事件发生的文件描述符的个数,通知进程处理事件

#include 
int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);

1.epfd是epoll_wait函数创建的句柄
2.events表示内核得到的事件的集合
3.maxevents表示events的大小,即能够处理的最大事件数
4.timeout表示超时时间:
-1:阻塞
0:非阻塞
大于0:指定毫秒数

常见的使用方式:

int epfd = epoll_create(1); // 创建 epoll 实例
struct epoll_event events[MaxEvents]; // 用于存储事件的数组

// 将需要监听的文件描述符添加到 epoll 实例(epfd)中,使用 epoll_ctl 函数。

int num_events = epoll_wait(epfd, events, MaxEvents, timeout);

epoll_ctl函数和epoll_wait函数中的events详解:

epoll_ctl 函数:
events 参数用于指定你希望监听的事件,这个参数是用于告诉 epoll 实例需要监听哪些事件的。在调用 epoll_ctl 函数时,你需要为 events 参数赋值,指定感兴趣的事件类型,如 EPOLLIN(可读事件)或 EPOLLOUT(可写事件)等。
events 参数通常是一个位掩码,可以使用位运算来指定多个事件,例如 EPOLLIN | EPOLLOUT 表示同时监听可读和可写事件。
events 参数的角色是告诉 epoll 实例你关心的事件类型以及要监听的文件描述符。

epoll_wait 函数:
events 参数用于接收 epoll_wait 函数返回的已发生事件的信息。在调用 epoll_wait 之前,你不需要为 events 参数赋值,因为它将由 epoll_wait 函数填充。
当 epoll_wait 函数返回时,它会将已发生的事件信息填充到 events 数组中。你可以检查每个事件的类型和相关的文件描述符,以确定发生了什么事件。

你可能感兴趣的:(c语言,网络,linux)