陈二狗灬

基于linux 5.0.1内核x86-64编译方式下的socket接口及系统调用深度分析

实验要求：

Socket API编程接口之上可以编写基于不同网络协议的应用程序；
Socket接口在用户态通过系统调用机制进入内核；
内核中将系统调用作为一个特殊的中断来处理，以socket相关系统调用为例进行分析；
socket相关系统调用的内核处理函数内部通过“多态机制”对不同的网络协议进行的封装方法；

　　请将Socket API编程接口、系统调用机制及内核中系统调用相关源代码、 socket相关系统调用的内核处理函数结合起来分析，并在X86 64环境下Linux5.0以上的内核中进一步跟踪验证。

实验环境：vmware 15.5下的ubuntu16.04虚拟机

基于内核：linux 5.0.1

内核编译方式：x86-64

内核位置：

~/kernel/linux-5.0.1

一、linux socket编程接口

　　socket起源于Unix，而Unix/Linux基本哲学之一就是“一切皆文件”，都可以用“打开open –> 读写write/read –> 关闭close”模式来操作。Socket就是该模式的一个实现， socket即是一种特殊的文件，一些socket函数就是对其进行的操作（读/写IO、打开、关闭）.
说白了Socket是应用层与TCP/IP协议族通信的中间软件抽象层， 它是一组接口。在设计模式中，Socket其实就是一个门面模式，它把复杂的TCP/IP协议族隐藏在Socket接口后面，对用户来说，一组简单的接口就是全部，让Socket去组织数据，以符合指定的协议。

针对套接字的系统数据结构：

1）、套接字API里有个函数socket，它就是用来创建一个套接字。套接字设计的总体思路是，单个系统调用就可以创建任何套接字，因为套接字是相当笼统的。一旦套接字创建后，应用程序还需要调用其他函数来指定具体细节。例如调用socket将创建一个新的描述符条目：

基于linux 5.0.1内核x86-64编译方式下的socket接口及系统调用深度分析_第1张图片

基于linux 5.0.1内核x86-64编译方式下的socket接口及系统调用深度分析_第2张图片

2）、虽然套接字的内部数据结构包含很多字段，但是系统创建套接字后，大多数字段还没有填写。应用程序创建套接字后在该套接字可以使用之前，必须调用其他的过程来填充这些字段。

3）、文件描述符和文件指针的区别：

文件描述符：在Linux系统中打开文件就会获得文件描述符，它是个很小的正整数。每个进程在PCB（Process Control Block）中保存着一份文件描述符表，文件描述符就是这个表的索引，每个表项都有一个指向已打开文件的指针。

文件指针：C语言中使用文件指针做为I/O的句柄。文件指针指向进程用户区中的一个被称为FILE结构的数据结构。FILE结构包括一个缓冲区和一个文件描述符。而文件描述符是文件描述符表的一个索引，因此从某种意义上说文件指针就是句柄的句柄（在Windows系统上，文件描述符被称作文件句柄）。

基本的SOCKET接口函数

　　在生活中，A要电话给B，A拨号，B听到电话铃声后提起电话，这时A和B就建立起了连接，A和B就可以讲话了。等交流结束，挂断电话结束此次交谈。打电话很简单解释了这工作原理：“open—write/read—close”模式。

　　服务器端先初始化Socket，然后与端口绑定(bind)，对端口进行监听(listen)，调用accept阻塞，等待客户端连接。在这时如果有个客户端初始化一个Socket，然后连接服务器(connect)，如果连接成功，这时客户端与服务器端的连接就建立了。客户端发送数据请求，服务器端接收请求并处理请求，然后把回应数据发送给客户端，客户端读取数据，最后关闭连接，一次交互结束。

这些接口的实现都是内核来完成。具体如何实现，可以看看linux的内核

socket()函数

　　socket函数对应于普通文件的打开操作。普通文件的打开操作返回一个文件描述字，而socket()用于创建一个socket描述符（socket descriptor），它唯一标识一个socket。这个socket描述字跟文件描述字一样，后续的操作都有用到它，把它作为参数，通过它来进行一些读写操作。

正如可以给fopen的传入不同参数值，以打开不同的文件。创建socket的时候，也可以指定不同的参数创建不同的socket描述符，socket函数的三个参数分别为：

protofamily：即协议域，又称为协议族（family）。常用的协议族有，AF_INET(IPV4)、AF_INET6(IPV6)、AF_LOCAL（或称AF_UNIX，Unix域socket）、AF_ROUTE等等。协议族决定了socket的地址类型，在通信中必须采用对应的地址，如AF_INET决定了要用ipv4地址（32位的）与端口号（16位的）的组合、AF_UNIX决定了要用一个绝对路径名作为地址。
type：指定socket类型。常用的socket类型有，SOCK_STREAM、SOCK_DGRAM、SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET等等（socket的类型有哪些？）。
protocol：故名思意，就是指定协议。常用的协议有，IPPROTO_TCP、IPPTOTO_UDP、IPPROTO_SCTP、IPPROTO_TIPC等，它们分别对应TCP传输协议、UDP传输协议、STCP传输协议、TIPC传输协议（这个协议我将会单独开篇讨论！）。

注意：并不是上面的type和protocol可以随意组合的，如SOCK_STREAM不可以跟IPPROTO_UDP组合。当protocol为0时，会自动选择type类型对应的默认协议。

　　当我们调用socket创建一个socket时，返回的socket描述字它存在于协议族（address family，AF_XXX）空间中，但没有一个具体的地址。如果想要给它赋值一个地址，就必须调用bind()函数，否则就当调用connect()、listen()时系统会自动随机分配一个端口。

bind()函数

　　正如上面所说bind()函数把一个地址族中的特定地址赋给socket。例如对应AF_INET、AF_INET6就是把一个ipv4或ipv6地址和端口号组合赋给socket。

函数的三个参数分别为：

sockfd：即socket描述字，它是通过socket()函数创建了，唯一标识一个socket。bind()函数就是将给这个描述字绑定一个名字。
addr：一个const struct sockaddr *指针，指向要绑定给sockfd的协议地址。这个地址结构根据地址创建socket时的地址协议族的不同而不同，如ipv4对应的是：

struct sockaddr_in {
    sa_family_t    sin_family; /* address family: AF_INET */
    in_port_t      sin_port;   /* port in network byte order */
    struct in_addr sin_addr;   /* internet address */
};

/* Internet address. */
struct in_addr {
    uint32_t       s_addr;     /* address in network byte order */
};

ipv6对应的是：

struct sockaddr_in6 { 
    sa_family_t     sin6_family;   /* AF_INET6 */ 
    in_port_t       sin6_port;     /* port number */ 
    uint32_t        sin6_flowinfo; /* IPv6 flow information */ 
    struct in6_addr sin6_addr;     /* IPv6 address */ 
    uint32_t        sin6_scope_id; /* Scope ID (new in 2.4) */ 
};

struct in6_addr { 
    unsigned char   s6_addr[16];   /* IPv6 address */ 
};

Unix域对应的是：

#define UNIX_PATH_MAX    108

struct sockaddr_un { 
    sa_family_t sun_family;               /* AF_UNIX */ 
    char        sun_path[UNIX_PATH_MAX];  /* pathname */ 
};

addrlen：对应的是地址的长度。

　　通常服务器在启动的时候都会绑定一个众所周知的地址（如ip地址+端口号），用于提供服务，客户就可以通过它来接连服务器；而客户端就不用指定，有系统自动分配一个端口号和自身的ip地址组合。这就是为什么通常服务器端在listen之前会调用bind()，而客户端就不会调用，而是在connect()时由系统随机生成一个。

网络字节序与主机字节序
主机字节序就是我们平常说的大端和小端模式：不同的CPU有不同的字节序类型，这些字节序是指整数在内存中保存的顺序，这个叫做主机序。
引用标准的Big-Endian和Little-Endian的定义如下：
　　a) Little-Endian就是低位字节排放在内存的低地址端，高位字节排放在内存的高地址端。
　　b) Big-Endian就是高位字节排放在内存的低地址端，低位字节排放在内存的高地址端。
网络字节序：4个字节的32 bit值以下面的次序传输：首先是0～7bit，其次8～15bit，然后16～23bit，最后是24~31bit。
这种传输次序称作大端字节序。 由于TCP/IP首部中所有的二进制整数在网络中传输时都要求以这种次序，因此它又称作网络字节序。
字节序，顾名思义字节的顺序，就是大于一个字节类型的数据在内存中的存放顺序，一个字节的数据没有顺序的问题了。
所以：在将一个地址绑定到socket的时候，请先将主机字节序转换成为网络字节序，而不要假定主机字节序跟网络字节序一样使用的是Big-Endian。
由于这个问题曾引发过血案！公司项目代码中由于存在这个问题，导致了很多莫名其妙的问题，所以请谨记对主机字节序不要做任何假定，
务必将其转化为网络字节序再赋给socket。

listen()、connect()函数

　　如果作为一个服务器，在调用socket()、bind()之后就会调用listen()来监听这个socket，如果客户端这时调用connect()发出连接请求，服务器端就会接收到这个请求。

　　listen函数的第一个参数即为要监听的socket描述字，第二个参数为相应socket可以排队的最大连接个数。socket()函数创建的socket默认是一个主动类型的，listen函数将socket变为被动类型的，等待客户的连接请求。

　　connect函数的第一个参数即为客户端的socket描述字，第二参数为服务器的socket地址，第三个参数为socket地址的长度。客户端通过调用connect函数来建立与TCP服务器的连接。

accept()函数

　　TCP服务器端依次调用socket()、bind()、listen()之后，就会监听指定的socket地址了。TCP客户端依次调用socket()、connect()之后就向TCP服务器发送了一个连接请求。TCP服务器监听到这个请求之后，就会调用accept()函数取接收请求，这样连接就建立好了。之后就可以开始网络I/O操作了，即类同于普通文件的读写I/O操作。

　　参数sockfd参数sockfd就是上面解释中的监听套接字，这个套接字用来监听一个端口，当有一个客户与服务器连接时，它使用这个一个端口号，而此时这个端口号正与这个套接字关联。当然客户不知道套接字这些细节，它只知道一个地址和一个端口号。参数addr这是一个结果参数，它用来接受一个返回值，这返回值指定客户端的地址，当然这个地址是通过某个地址结构来描述的，用户应该知道这一个什么样的地址结构。如果对客户的地址不感兴趣，那么可以把这个值设置为NULL。参数len如同大家所认为的，它也是结果的参数，用来接受上述addr的结构的大小的，它指明addr结构所占有的字节个数。同样的，它也可以被设置为NULL。

　　如果accept成功返回，则服务器与客户已经正确建立连接了，此时服务器通过accept返回的套接字来完成与客户的通信。

注意：

　　accept默认会阻塞进程，直到有一个客户连接建立后返回，它返回的是一个新可用的套接字，这个套接字是连接套接字。

此时我们需要区分两种套接字，

　　监听套接字: 监听套接字正如accept的参数sockfd，它是监听套接字，在调用listen函数之后，是服务器开始调用socket()函数生成的，称为监听socket描述字(监听套接字)

　　连接套接字：一个套接字会从主动连接的套接字变身为一个监听套接字；而accept函数返回的是已连接socket描述字(一个连接套接字)，它代表着一个网络已经存在的点点连接。

　　一个服务器通常通常仅仅只创建一个监听socket描述字，它在该服务器的生命周期内一直存在。内核为每个由服务器进程接受的客户连接创建了一个已连接socket描述字，当服务器完成了对某个客户的服务，相应的已连接socket描述字就被关闭。

　　自然要问的是：为什么要有两种套接字？原因很简单，如果使用一个描述字的话，那么它的功能太多，使得使用很不直观，同时在内核确实产生了一个这样的新的描述字。

　　连接套接字socketfd_new 并没有占用新的端口与客户端通信，依然使用的是与监听套接字socketfd一样的端口号

read()、write()等函数

　　万事具备只欠东风，至此服务器与客户已经建立好连接了。可以调用网络I/O进行读写操作了，即实现了网络中不同进程之间的通信！网络I/O操作有下面几组：

read()/write()
recv()/send()
readv()/writev()
recvmsg()/sendmsg()
recvfrom()/sendto()

　　read函数是负责从fd中读取内容.当读成功时，read返回实际所读的字节数，如果返回的值是0表示已经读到文件的结束了，小于0表示出现了错误。如果错误为EINTR说明读是由中断引起的，如果是ECONNREST表示网络连接出了问题。

　　write函数将buf中的nbytes字节内容写入文件描述符fd.成功时返回写的字节数。失败时返回-1，并设置errno变量。在网络程序中，当我们向套接字文件描述符写时有俩种可能。1)write的返回值大于0，表示写了部分或者是全部的数据。2)返回的值小于0，此时出现了错误。我们要根据错误类型来处理。如果错误为EINTR表示在写的时候出现了中断错误。如果为EPIPE表示网络连接出现了问题(对方已经关闭了连接)。

其它的我就不一一介绍这几对I/O函数了，具体参见man文档或者baidu、Google，下面的例子中将使用到send/recv。

close()函数

　　在服务器与客户端建立连接之后，会进行一些读写操作，完成了读写操作就要关闭相应的socket描述字，好比操作完打开的文件要调用fclose关闭打开的文件。

close一个TCP socket的缺省行为是把该socket标记为已关闭，然后立即返回到调用进程。该描述字不能再由调用进程使用，也就是说不能再作为read或write的第一个参数。

注意：close操作只是使相应socket描述字的引用计数-1，只有当引用计数为0的时候，才会触发TCP客户端向服务器发送终止连接请求。

二、系统调用机制

系统调用概述

　　计算机系统的各种硬件资源是有限的，在现代多任务操作系统上同时运行的多个进程都需要访问这些资源，为了更好的管理这些资源进程是不允许直接操作的，所有对这些资源的访问都必须有操作系统控制。也就是说操作系统是使用这些资源的唯一入口，而这个入口就是操作系统提供的系统调用（System Call）。在linux中系统调用是用户空间访问内核的唯一手段，除异常和陷入外，他们是内核唯一的合法入口。

　　一般情况下应用程序通过应用编程接口API，而不是直接通过系统调用来编程。在Unix世界，最流行的API是基于POSIX标准的。

　　操作系统一般是通过中断从用户态切换到内核态。中断就是一个硬件或软件请求，要求CPU暂停当前的工作，去处理更重要的事情。比如，在x86机器上可以通过int指令进行软件中断，而在磁盘完成读写操作后会向CPU发起硬件中断。

　　中断有两个重要的属性，中断号和中断处理程序。中断号用来标识不同的中断，不同的中断具有不同的中断处理程序。在操作系统内核中维护着一个中断向量表（Interrupt Vector Table），这个数组存储了所有中断处理程序的地址，而中断号就是相应中断在中断向量表中的偏移量。

　　一般地，系统调用都是通过软件中断实现的，x86-32系统上的软件中断由int $0x80指令产生，而128号异常处理程序就是系统调用处理程序system_call()，它与硬件体系有关，在entry.S中用汇编写。x86-64系统上的软件中断通过syscall指令产生，接下来就来看一下Linux下系统调用具体的实现过程。

为什么需要系统调用

　　linux内核中设置了一组用于实现系统功能的子程序，称为系统调用。系统调用和普通库函数调用非常相似，只是系统调用由操作系统核心提供，运行于内核态，而普通的函数调用由函数库或用户自己提供，运行于用户态。

　　一般的，进程是不能访问内核的。它不能访问内核所占内存空间也不能调用内核函数。CPU硬件决定了这些（这就是为什么它被称作“保护模式”）。

　　为了和用户空间上运行的进程进行交互，内核提供了一组接口。透过该接口，应用程序可以访问硬件设备和其他操作系统资源。这组接口在应用程序和内核之间扮演了使者的角色，应用程序发送各种请求，而内核负责满足这些请求(或者让应用程序暂时搁置)。实际上提供这组接口主要是为了保证系统稳定可靠，避免应用程序肆意妄行，惹出大麻烦。

　　系统调用在用户空间进程和硬件设备之间添加了一个中间层。该层主要作用有三个：

它为用户空间提供了一种统一的硬件的抽象接口。比如当需要读些文件的时候，应用程序就可以不去管磁盘类型和介质，甚至不用去管文件所在的文件系统到底是哪种类型。
系统调用保证了系统的稳定和安全。作为硬件设备和应用程序之间的中间人，内核可以基于权限和其他一些规则对需要进行的访问进行裁决。举例来说，这样可以避免应用程序不正确地使用硬件设备，窃取其他进程的资源，或做出其他什么危害系统的事情。
每个进程都运行在虚拟系统中，而在用户空间和系统的其余部分提供这样一层公共接口，也是出于这种考虑。如果应用程序可以随意访问硬件而内核又对此一无所知的话，几乎就没法实现多任务和虚拟内存，当然也不可能实现良好的稳定性和安全性。在Linux中，系统调用是用户空间访问内核的惟一手段；除异常和中断外，它们是内核惟一的合法入口。

API/POSIX/C库的区别与联系

　　一般情况下，应用程序通过应用编程接口(API)而不是直接通过系统调用来编程。这点很重要，因为应用程序使用的这种编程接口实际上并不需要和内核提供的系统调用一一对应。

一个API定义了一组应用程序使用的编程接口。它们可以实现成一个系统调用，也可以通过调用多个系统调用来实现，而完全不使用任何系统调用也不存在问题。实际上，API可以在各种不同的操作系统上实现，给应用程序提供完全相同的接口，而它们本身在这些系统上的实现却可能迥异。

　　在Unix世界中，最流行的应用编程接口是基于POSIX标准的，其目标是提供一套大体上基于Unix的可移植操作系统标准。POSIX是说明API和系统调用之间关系的一个极好例子。在大多数Unix系统上，根据POSIX而定义的API函数和系统调用之间有着直接关系。

　　Linux的系统调用像大多数Unix系统一样，作为C库的一部分提供如下图所示。C库实现了 Unix系统的主要API，包括标准C库函数和系统调用。所有的C程序都可以使用C库，而由于C语言本身的特点，其他语言也可以很方便地把它们封装起来使用。

　　从程序员的角度看，系统调用无关紧要，他们只需要跟API打交道就可以了。相反，内核只跟系统调用打交道；库函数及应用程序是怎么使用系统调用不是内核所关心的。

　　关于Unix的界面设计有一句通用的格言“提供机制而不是策略”。换句话说，Unix的系统调用抽象出了用于完成某种确定目的的函数。至干这些函数怎么用完全不需要内核去关心。区别对待机制(mechanism)和策略(policy)是Unix设计中的一大亮点。大部分的编程问题都可以被切割成两个部分:“需要提供什么功能”(机制)和“怎样实现这些功能”(策略)。

区别

　　api是函数的定义，规定了这个函数的功能，跟内核无直接关系。而系统调用是通过中断向内核发请求，实现内核提供的某些服务。

联系

　　一个api可能会需要一个或多个系统调用来完成特定功能。通俗点说就是如果这个api需要跟内核打交道就需要系统调用，否则不需要。
程序员调用的是API（API函数），然后通过与系统调用共同完成函数的功能。
因此，API是一个提供给应用程序的接口，一组函数，是与程序员进行直接交互的。
系统调用则不与程序员进行交互的，它根据API函数，通过一个软中断机制向内核提交请求，以获取内核服务的接口。
并不是所有的API函数都一一对应一个系统调用，有时，一个API函数会需要几个系统调用来共同完成函数的功能，甚至还有一些API函数不需要调用相应的系统调用（因此它所完成的不是内核提供的服务）。

系统调用的实现原理

基本机制

　　linux系统中64位汇编和32位汇编的系统调用主要有以下不同：
（1）系统调用号不同.比如x86中sys_write是4，sys_exit是1；而x86_64中sys_write是1, sys_exit是60。linux系统调用号实际上定义在/usr/include/asm/unistd_32.h和/usr/include/asm/unistd_64.h中。
（2）系统调用所使用的寄存器不同，x86_64中使用与eax对应的rax传递系统调用号，但是 x86_64中分别使用rdi/rsi/rdx传递前三个参数，而不是x86中的ebx/ecx/edx。
（3）系统调用使用“syscall”而不是“int 80”。

　　前文已经提到了64位Linux下的系统调用是通过syscall实现的，但是我们知道操作系统会有多个系统调用，而对于同一个中断号是如何处理多个不同的系统调用的？最简单的方式是对于不同的系统调用采用不同的中断号，但是中断号明显是一种稀缺资源，Linux显然不会这么做；还有一个问题就是系统调用是需要提供参数，并且具有返回值的，这些参数又是怎么传递的？也就是说，对于系统调用我们要搞清楚两点：

系统调用的函数名称转换。
系统调用的参数传递。

　　首先看第一个问题。实际上，Linux中每个系统调用都有相应的系统调用号作为唯一的标识，内核维护一张系统调用表，sys_call_table，表中的元素是系统调用函数的起始地址，而系统调用号就是系统调用在调用表的偏移量。在x86上，系统调用号是通过eax寄存器传递给内核的。比如fork（）的实现：

　　用户空间的程序无法直接执行内核代码。它们不能直接调用内核空间中的函数，因为内核驻留在受保护的地址空间上。如果进程可以直接在内核的地址空间上读写的话，系统安全就会失去控制。所以，应用程序应该以某种方式通知系统，告诉内核自己需要执行一个系统调用，希望系统切换到内核态，这样内核就可以代表应用程序来执行该系统调用了。

　　通知内核的机制是靠软件中断实现的。首先，用户程序为系统调用设置参数。其中一个参数是系统调用编号。参数设置完成后，程序执行“系统调用”指令。x86-32系统上的软中断由int产生，x86-64系统上的软中断由syscall产生。这个指令会导致一个异常：产生一个事件，这个事件会致使处理器切换到内核态并跳转到一个新的地址，并开始执行那里的异常处理程序。此时的异常处理程序实际上就是系统调用处理程序。它与硬件体系结构紧密相关。

　　新地址的指令会保存程序的状态，计算出应该调用哪个系统调用，调用内核中实现那个系统调用的函数，恢复用户程序状态，然后将控制权返还给用户程序。系统调用是设备驱动程序中定义的函数最终被调用的一种方式。

　　从系统分析的角度，linux的系统调用涉及4个方面的问题。

响应函数`sys_xxx`

　　响应函数名以“__sys_”开头，后跟该系统调用的名字。

例如

系统调用fork()的响应函数是sys_fork()(见Kernel/fork.c),

exit()的响应函数是sys_exit()(见kernel/fork.)。

系统调用表与系统调用号——数组与下标

　　文件~/kernel/linux-5.0.1/arch/sh/include/uapi/asm/unistd_64.h为每个系统调用规定了唯一的编号。

 gedit ~/kernel/linux-5.0.1/arch/sh/include/uapi/asm/unistd_64.h

　　可以看到，linux 5.0.1 x86-64位下的系统调用号共有394个，与socket有关的如下图：

用表格总结如下：

系统调用	描述
socketcall	socket系统调用
socket	建立socket
bind	绑定socket到端口
connect	连接远程主机
accept	响应socket连接请求
send	通过socket发送信息
sendto	发送UDP信息
sendmsg	参见send
recv	通过socket接收信息
recvfrom	接收UDP信息
recvmsg	参见recv
listen	监听socket端口
select	对多路同步I/O进行轮询
shutdown	关闭socket上的连接
getsockname	取得本地socket名字
getpeername	获取通信对方的socket名字
getsockopt	取端口设置
setsockopt	设置端口参数
sendfile	在文件或端口间传输数据
socketpair	创建一对已联接的无名socket

　　假设用name表示系统调用的名称，那么系统调用号与系统调用响应函数的关系是：以系统调用号_NR_name作为下标，可找出系统调用表sys_call_table(见linux-5.0.1/arch/sh/kernel/syscalls_64.S )中对应表项的内容，它正好是该系统调用的响应函数sys_name的入口地址。

　　系统调用表sys_call_table记录了各sys_name函数在表中的位置。有了这张表，就很容易根据特定系统调用在表中的偏移量，找到对应的系统调用响应函数的入口地址。系统调用表共256项，余下的项是可供用户自己添加的系统调用空间。

　　在Linux中，每个系统调用被赋予一个系统调用号。这样，通过这个独一无二的号就可以关联系统调用。当用户空间的进程执行一个系统调用的时候，这个系统调用号就被用来指明到底是要执行哪个系统调用。进程不会提及系统调用的名称。

　　系统调用号相当关键，一旦分配就不能再有任何变更，否则编译好的应用程序就会崩溃。Linux有一个“未实现”系统调用sys_ni_syscall()，它除了返回一ENOSYS外不做任何其他工作，这个错误号就是专门针对无效的系统调用而设的。

　　因为所有的系统调用陷入内核的方式都一样，所以仅仅是陷入内核空间是不够的。因此必须把系统调用号一并传给内核。在x86-64上，系统调用号是通过rax寄存器传递给内核的。在陷人内核之前，用户空间就把相应系统调用所对应的号放入eax中了。这样系统调用处理程序一旦运行，就可以从rax中得到数据。其他体系结构上的实现也都类似。

　　内核记录了系统调用表中的所有已注册过的系统调用的列表，存储在sys_call_table中。它与体系结构有关，一般在entry.s中定义。这个表中为每一个有效的系统调用指定了惟一的系统调用号。sys_call_table是一张由指向实现各种系统调用的内核函数的函数指针组成的表：
　　system_call()函数通过将给定的系统调用号与NR_syscalls做比较来检查其有效性。如果它大于或者等于NR syscalls,该函数就返回一ENOSYS。否则，就执行相应的系统调用。

进程的系统调用命令转换为syscall中断的过程

　　宏定义_syscallN()见(arch/x86/include/asm/unisted.h)用于系统调用的格式转换和参数的传递。N取0~5之间的整数。

参数个数为N的系统调用由_syscallN()负责格式转换和参数传递。系统调用号放入rax寄存器，启动syscall后，规定返回值送rax寄存器。

系统调用功能模块的初始化

　　x86-64位系统：start_kernel --> trap_init --> cpu_init --> syscall_init

void syscall_init(void)
{
    wrmsr(MSR_STAR, 0, (__USER32_CS << 16) | __KERNEL_CS);
    wrmsrl(MSR_LSTAR, (unsigned long)entry_SYSCALL_64);
  ...

系统调用的正常执行

　　用户态程序发起系统调用，对于x86-64位程序应该是直接跳到entry_SYSCALL_64;

　　64位的系统调用服务例程:

SYM_CODE_START(entry_SYSCALL_64)
...
    /* IRQs are off. */
    movq    %rax, %rdi
    movq    %rsp, %rsi
    call    do_syscall_64        /* returns with IRQs disabled */
 * [do_syscall_64](https://github.com/torvalds/linux/blob/ab851d49f6bfc781edd8bd44c72ec1e49211670b/arch/x86/entry/common.c#L282)


#ifdef CONFIG_X86_64
__visible void do_syscall_64(unsigned long nr, struct pt_regs *regs)
{
...
    if (likely(nr < NR_syscalls)) {
        nr = array_index_nospec(nr, NR_syscalls);
        regs->ax = sys_call_table[nr](regs);
...
}
#endif

系统调用表的初始化

　　64位下的sys_call_table 数组都是由如下目录下的代码初始化的。

/linux-5.0.1/arch/x86/entry/entry_64.S

内核如何为各种系统调用服务

　　当进程需要进行系统调用时，必须以C语言函数的形式写一句系统调用命令。该命令如果已在某个头文件中由相应的_syscallN()展开，则用户程序必须包含该文件。当进程执行到用户程序的系统调用命令时，实际上执行了由宏命令_syscallN()展开的函数。系统调用的参数由各通用寄存器传递，然后执行syscall，以内核态进入入口地址system_call。

内核如何为系统调用的参数传递参数

　　除了系统调用号以外，大部分系统调用都还需要一些外部的参数输人。所以，在发生异常的时候，应该把这些参数从用户空间传给内核。最简单的办法就是像传递系统调用号一样把这些参数也存放在寄存器里。在x86-64系统上，rdi, rsi, rdx, r10,r8,r9按照顺序存放前六个参数。需要六个以上参数的情况不多见，此时，应该用一个单独的寄存器存放指向所有这些参数在用户空间地址的指针。

　　给用户空间的返回值也通过寄存器传递。在x86-64系统上，它存放在rax寄存器中。接下来许多关于系统调用处理程序的描述都是针对x86-64版本的。基本上，所有体系结构的实现都很类似。

　　说了这么多关于linux系统调用机制的知识，不如来两张图清晰地说明32位和64位下系统调用的详细过程：

32 位的系统调用：

64 位的系统调用：

三、socket相关系统调用的内核处理函数跟踪分析

　　本次的socket系统调用内核处理函数的跟踪分析基于上次构建的Menu OS系统，即通过在Menu OS系统上运行TCP客户端/服务器程序，然后用gdb设置断点来跟踪分析socket内核处理函数。

　　还是先跑起来我们的Menu OS系统，以调试模式运行：

qemu-system-x86_64 -kernel linux-5.0.1/arch/x86/boot/bzImage -initrd rootfs.img -s -S -append nokaslr

　　在跟踪socket系统调用内核处理函数之前，先设置之前讲的x86-64位下的系统调用过程，看行不行得通：

　　 ok，四个断点都出现了，再次验证了x86-64位系统下的系统调用初始化过程：start_kernel --> trap_init --> cpu_init --> syscall_init，接下来若系统调用正常执行，会直接跳到entry_SYSCALL_64，如下图设置断点：

　　这便是linux x86-64位系统调用的通用过程，由于本次实验主要分析socket系统调用及内核处理函数的源码，所以对这四个通用的系统调用便不再分析了，下面主要通过设置断点跟踪socket相关函数：

查看Menu OS根目录rootfs.img的主要组成源文件main.c

　　在开始跟踪之前有必要看看main.c中的服务端replyhi和客户端hello是如何通过socket通信的，打开main.c，由于程序较长，现主要给出socket通信的主要部分：

cd ~/kernel/menu
gedit main.c

 1 #include"syswrapper.h"
 2 #define MAX_CONNECT_QUEUE   1024
 3 int Replyhi()
 4 {
 5     char szBuf[MAX_BUF_LEN] = "\0";
 6     char szReplyMsg[MAX_BUF_LEN] = "hi\0";
 7     InitializeService();
 8     while (1)
 9     {
10         ServiceStart();
11         RecvMsg(szBuf);
12         SendMsg(szReplyMsg);
13         ServiceStop();
14     }
15     ShutdownService();
16     return 0;
17 }
18 
19 int StartReplyhi(int argc, char *argv[])
20 {
21     int pid;
22     /* fork another process */
23     pid = fork();
24     if (pid < 0)
25     {
26         /* error occurred */
27         fprintf(stderr, "Fork Failed!");
28         exit(-1);
29     }
30     else if (pid == 0)
31     {
32         /*     child process     */
33         Replyhi();
34         printf("Reply hi TCP Service Started!\n");
35     }
36     else
37     {
38         /*     parent process     */
39         printf("Please input hello...\n");
40     }
41 }
42 
43 int Hello(int argc, char *argv[])
44 {
45     char szBuf[MAX_BUF_LEN] = "\0";
46     char szMsg[MAX_BUF_LEN] = "hello\0";
47     OpenRemoteService();
48     SendMsg(szMsg);
49     RecvMsg(szBuf);
50     CloseRemoteService();
51     return 0;
52 }

　　可以看到Replyhi里调用了先后调用了 InitializeService()、ServiceStart()、RecvMsg()、SendMsg()、ServiceStop()、shutdownService()；hello先后调用了OpenRemoteService()、SendMsg()、RecvMsg()、CloseRemoteService()；那这些函数里面又调用了什么socket接口呢，再看看头文件 syswrapper.h里面定义了什么吧：

gedit syswrapper.h

#define PORT                5001
#define IP_ADDR             "127.0.0.1"
#define MAX_BUF_LEN         1024

/* private macro */
#define PrepareSocket(addr,port)                        \
        int sockfd = -1;                                \
        struct sockaddr_in serveraddr;                  \
        struct sockaddr_in clientaddr;                  \
        socklen_t addr_len = sizeof(struct sockaddr);   \
        serveraddr.sin_family = AF_INET;                \
        serveraddr.sin_port = htons(port);              \
        serveraddr.sin_addr.s_addr = inet_addr(addr);   \
        memset(&serveraddr.sin_zero, 0, 8);             \
        sockfd = socket(PF_INET,SOCK_STREAM,0);
        
#define InitServer()                                    \
        int ret = bind( sockfd,                         \
                        (struct sockaddr *)&serveraddr, \
                        sizeof(struct sockaddr));       \
        if(ret == -1)                                   \
        {                                               \
            fprintf(stderr,"Bind Error,%s:%d\n",        \
                            __FILE__,__LINE__);         \
            close(sockfd);                              \
            return -1;                                  \
        }                                               \
        listen(sockfd,MAX_CONNECT_QUEUE); 

#define InitClient()                                    \
        int ret = connect(sockfd,                       \
            (struct sockaddr *)&serveraddr,             \
            sizeof(struct sockaddr));                   \
        if(ret == -1)                                   \
        {                                               \
            fprintf(stderr,"Connect Error,%s:%d\n",     \
                __FILE__,__LINE__);                     \
            return -1;                                  \
        }
/* public macro */               
#define InitializeService()                             \
        PrepareSocket(IP_ADDR,PORT);                    \
        InitServer();
        
#define ShutdownService()                               \
        close(sockfd);
         
#define OpenRemoteService()                             \
        PrepareSocket(IP_ADDR,PORT);                    \
        InitClient();                                   \
        int newfd = sockfd;
        
#define CloseRemoteService()                            \
        close(sockfd); 
              
#define ServiceStart()                                  \
        int newfd = accept( sockfd,                     \
                    (struct sockaddr *)&clientaddr,     \
                    &addr_len);                         \
        if(newfd == -1)                                 \
        {                                               \
            fprintf(stderr,"Accept Error,%s:%d\n",      \
                            __FILE__,__LINE__);         \
        }        
#define ServiceStop()                                   \
        close(newfd);
        
#define RecvMsg(buf)                                    \
       ret = recv(newfd,buf,MAX_BUF_LEN,0);             \
       if(ret > 0)                                      \
       {                                                \
            printf("recv \"%s\" from %s:%d\n",          \
            buf,                                        \
            (char*)inet_ntoa(clientaddr.sin_addr),      \
            ntohs(clientaddr.sin_port));                \
       }
       
#define SendMsg(buf)                                    \
        ret = send(newfd,buf,strlen(buf),0);            \
        if(ret > 0)                                     \
        {                                               \
            printf("send \"hi\" to %s:%d\n",            \
            (char*)inet_ntoa(clientaddr.sin_addr),      \
            ntohs(clientaddr.sin_port));                \
        }

　　一步步分析总结得出基于TCP的replyhi和hello的通信过程：即replyhi先后调用了linux socket接口中的socket()、bind()、listen()、accept()、recv()、send()、close()；hello先后调用了socket()、connect()、send()、recv()、close()，完美，这不就是基于TCP的C/S通信编程吗？口说无凭，实践是检验真理的唯一标准，现在一起用gdb追踪分析这些socket接口系统调用相应的内核处理函数吧！

用GDB追踪分析socket接口内核处理函数

先跑起来我们部署好TCP通信的Menu OS系统：

qemu-system-x86_64 -kernel linux-5.0.1/arch/x86/boot/bzImage -initrd rootfs.img -append nokaslr -s //这次不加S，即让系统先跑，不用一开始暂停

　　打开一个新的命令行，用gdb连接Menu OS服务器，端口1234，开始调试Menu OS系统：

gdb
file linux-5.0.1/vmlinux
target remote:1234

设置断点：由于不知道用的哪个send和recv内核处理函数，所以多设置两个关于send、recv的断点；

b  __sys_socket
b  __sys_bind
b  __sys_listen
b  __sys_connect
b  __sys_accept4
b  __sys_recvmsg
b  __sys_sendmsg
b  __sys_recvfrom
b  __sys_sendto
b  __sys_shutdown

查看断点：

info breakpoints

如图所示：

　　现在在gdb中按c运行Menu OS，然后在Menu OS中打开服务器，即输入replyhi：

　　可以看到服务器运行到第一个断点__sys_socket函数处停止，在gdb中输入list或 l 可以看到函数源代码，继续往下运行：

　　replyhi一直运行到__sys_accept4处停止，等待Menu OS继续运行，这时候服务端已经调用__sys_accept4，准备好接受客户端的连接请求了，现在需要在Menu OS中输入hello打开客户端，如下图：

　　很好，gdb又捕捉到了__sys_socket断点，只不过这次是客户端hello的__sys_socket内核处理函数，go on！

　　追踪完毕，发现后续hello客户端发出请求连接__sys_connect，与服务器建立连接，然后客户端、服务器互发消息，即调用了__sys_recvfrom和__sys_sendto，通过以上的跟踪发现简直与TCP下的C/S socket通信如出一辙，如果想看相应的内核处理函数，只需在断点处输入list即可，比如__sys_socket源码如下：（其他函数便不再一一给出了，可以自己去看）

int __sys_socket(int family, int type, int protocol)
1327    {
1328        int retval;
1329        struct socket *sock;
1330        int flags;
1331    
(gdb) 
1332        /* Check the SOCK_* constants for consistency.  */
1333        BUILD_BUG_ON(SOCK_CLOEXEC != O_CLOEXEC);
1334        BUILD_BUG_ON((SOCK_MAX | SOCK_TYPE_MASK) != SOCK_TYPE_MASK);
1335        BUILD_BUG_ON(SOCK_CLOEXEC & SOCK_TYPE_MASK);
1336        BUILD_BUG_ON(SOCK_NONBLOCK & SOCK_TYPE_MASK);
1337    
1338        flags = type & ~SOCK_TYPE_MASK;
1339        if (flags & ~(SOCK_CLOEXEC | SOCK_NONBLOCK))
1340            return -EINVAL;
1341        type &= SOCK_TYPE_MASK;
(gdb) 
1342    
1343        if (SOCK_NONBLOCK != O_NONBLOCK && (flags & SOCK_NONBLOCK))
1344            flags = (flags & ~SOCK_NONBLOCK) | O_NONBLOCK;
1345    
1346        retval = sock_create(family, type, protocol, &sock);
1347        if (retval < 0)
1348            return retval;
1349    
1350        return sock_map_fd(sock, flags & (O_CLOEXEC | O_NONBLOCK));
1351    }

总结：

　　本次的实验带领大家学习了linux socket编程接口的机制以及其背后的系统调用和内核函数处理过程；之前我们都是直接用这些socket接口进行网络程序设计，殊不知其背后隐藏着诸多“秘密”，原来操作系统为我们当了免费苦力，这个时候情不自禁地佩服写OS内核的前辈，正是有了OS才让网络编程变得如此简单，相信大家做完这个实验后都能对socket网络编程及背后的系统调用有着更深一步的理解，知识无界，望大家保持好奇心，继续探索~~~

你可能感兴趣的:(基于linux 5.0.1内核x86-64编译方式下的socket接口及系统调用深度分析)

DeepSeek API 速成教程 ftpeak Python AI python 开发语言 AI编程
1.获取API密钥要想使用DeepSeekAPI，必须拥有API密钥。方法如下：进入DeepSeek（DeepSeek）平台，并免费注册（用手机号或微信账号注册）。找到创建API密钥的入口，按照指引生成属于你的API密钥。这个密钥是调用API的重要凭证，务必妥善保管，不要泄露给他人。（如下图：）2.安装必要的库（1）Request模式在Python环境中，你可以使用requests库来发送HTTP
Python网络爬虫实战：抓取猫眼TOP100电影信息莱财一哥
本文还有配套的精品资源，点击获取简介：在Python中，Web爬虫是获取互联网数据的关键技能。本教程将指导如何结合使用requests库和正则表达式来从猫眼电影网站的TOP100榜单中抓取电影信息。首先通过requests库发送HTTP请求获取网页内容，然后运用正则表达式提取电影名和评分等信息。在进行网络爬虫时，遵守robots.txt规则，设置请求延时，并考虑处理网站的反爬虫策略。对于更复杂的网
Python 日志组件Loguru快速入门 ftpeak Python python 开发语言
Python自身具有默认的日志组件-loggin，功能强大且专业度强，正因如此，要真正的用好logging组件的复杂度可不低。你是否曾因懒配置logging组件而只是对其简单配置一下或直接使用print()？……我曾有过，但日志记录是每个应用的基础，能极大简化调试过程。然而，可以通过Loguru组件来极度轻松的使用日志，你没有任何理由不从项目伊始就使用它——只需fromloguruimportlo
Python面向对象(OOP)速成教程 ftpeak Python python 开发语言
Python是一门支持面向对象编程（OOP）的语言，面向对象编程的核心概念包括类、对象、封装、继承和多态。下面通过具体的范例来详细介绍这些概念的使用一、类和对象类是对象的设计稿，定义了对象的属性和方法；对象是类的实例。#定义一个类classDog:#类属性species="Canisfamiliaris"def__init__(self,name,age):#实例属性self.name=names
Python并发多进程编程 ftpeak Python 网络爬虫 python 开发语言前端
一、多进程（Multiprocessing）多进程是指在操作系统中同时运行多个进程，每个进程都有自己独立的内存空间和系统资源。Python的multiprocessing模块提供了多进程编程的支持。优点可以利用多核CPU的优势，并行执行任务，提高程序的运行效率。各个进程之间相互独立，一个进程的崩溃不会影响其他进程。缺点进程的创建和销毁开销较大。进程之间的通信和数据共享相对复杂。代码示例import
Nginx开启目录浏览功能时加密码的方法 wjf63000 nginx linux centos
环境：CentOS71.安装工具sudoyuminstallhttpd-tools2.创建密码文件和用户使用htpasswd命令来创建密码文件并添加用户。以下命令会创建一个名为.htpasswd的文件，并添加一个名为your_username的用户。sudohtpasswd-c/etc/nginx/.htpasswdyour_username执行上述命令后，系统会提示你输入并确认该用户的密码。如果
react 组件封装原则_如何基于antd封装自己的react组件并发布到npm 楚云卿 react 组件封装原则
引言在前端项目开发过程中，有大量重复的内容，比如布局相似的模块，较多的功能表单等，我们可以提炼成组件来提升效率，减少重复建设。文章以实际工作中的项目为例，介绍如何将项目中常用的组件进行封装并发布到npm中。1前提要求在开始前你需要具备以下条件：安装了Node&npm安装了Git基本掌握npm，git使用方法熟练使用JavaScript&ES6&CSS基本掌握React熟悉React,antd2开始
node建立博客系统遇到的问题，1，乱码。2，multer的使用错误。3使用session问题... weixin_33901926 python
2019独角兽企业重金招聘Python工程师标准>>>1，乱码文件存储为utf-8格式后还是报错。原来这个设置只对新建文件编码有效，旧文件不处理的，我还以为旧文件也给转换了。2，上传文件的multer模块使用错误。throw new TypeError('app.use() requires middleware functions');这里是multer的版本错误。可以使用如下代码解决问题//
订单日记为“容易设计”提供全方位的进销存管理支持雪兽软件 ERP系统进销存软件订单日记
感谢容易（苏州）文化创意设计有限公司选择使用订单日记！容易（苏州）文化创意设计有限公司，成立于2006年，位于江苏省苏州吴中经济开发区，是一家以从事销售时尚女包、旅行便携包、礼品包等产品为主的企业。在业务不断壮大的过程中，想使用一种既能提升运营效率又能节省成本的系统管理工具，在市场上多方比较和考察后最终选择了订单日记。订单日记是轻量级高效的进销存管理工具，它的管理模块很多，对容易（苏州）文化创意设
T2.小牛架炮 - 美团机试真题题解什码情况大厂笔试真题题解算法数据结构 c++
题目描述在无限大的棋盘中有n个炮，第个炮的坐标是(xi,yi)。已知每个炮的攻击方式是:先选一个攻击方向(上、下、左、右），该方向上看见的第一个棋子为“炮架”，该炮可以通过炮架攻击到炮架后面的棋子(只能攻击到炮架后面的第一个)。小牛希望你求出每个炮第一次攻击能攻击到多少个炮。输入描述第一行输入一个正整数n，代表炮的数量。接下来的几行，每行输入两个整数xi,yi，代表每个炮所在的坐标。1usingn
Kubernetes核心组件详解：从原理到实践 ivwdcwso 运维 kubernetes 容器云原生 k8s
引言在云原生时代，Kubernetes（简称k8s）已成为容器编排的事实标准。无论是小型创业公司还是全球性企业，都在使用它管理复杂的分布式系统。但你是否好奇过，这个强大的系统内部是如何运作的？本文将深入剖析Kubernetes的核心组件，揭示其设计哲学与协作机制，帮助开发者、运维人员及架构师真正理解其底层逻辑。©ivwdcwso(ID:u012172506)一、Kubernetes架构全景Kube
AI工具使用手册：笑着学会让DeepSeek叫你主人 skyksksksksks AI个人杂记人工智能深度学习神经网络自然语言处理机器学习
【别慌！你的智商还没欠费】各位父老乡亲兄弟姐妹们，今天我们要研究的是这个号称"赛博菩萨"的DeepSeek。先说好了啊，这玩意儿绝对比你家二哈听话，比前男友靠谱，关键还不用买狗粮！下面这张表请含泪收藏：功能对比DeepSeek你家二哈前男友响应速度0.5秒拆家2小时起已读不回3天+知识储备全网数据只会要饭王者荣耀段位售后服务24小时在线随地大小便人间蒸发术使用成本网费电费狗粮+沙发钱青春损失费—我
Java基础入门流程控制全解析：分支、循环与随机数实战 shy2005_5_31 Java全栈开发学习 java python 开发语言 intellij-idea java-ee jvm
引言流程控制是编程语言的核心逻辑结构，决定了程序的执行顺序与逻辑判断能力。本文以分支结构、循环结构和随机数生成为核心，结合代码示例与底层原理，全面解析Java中流程控制的应用场景与实战技巧。一、分支结构1.if分支作用：根据条件表达式的结果（true/false）决定代码执行路径。三种形式单分支if(条件){//条件为true时执行}双分支if(条件){//条件为true时执行}else{//条件
jmeter-AES加密 ramsey17 jmeter java
AES(全称：AdvancedEncryptionStandard)对称加密算法，也就是加密和解密用到的密钥是相同的，这种加密方式加密速度非常快，适合经常发送数据的场合，如：数据加密存储、网络通信加密等。在进行接口测试或接口压测时，有些比较核心的接口有可能会用AES方式对接口的入参或响应内容进行加密/解密。Jmeter对AES加密/解密，当前可以通过beanshell的方式处理。代码如下：impo
TCP为什么可靠？菜就多练少说计算机网络 tcp/ip 网络网络协议
TCP（传输控制协议）通过多种机制来确保可靠的数据传输。可靠传输意味着确保数据在从源到目标的过程中，不仅要完整无误地到达，还要按照正确的顺序到达，而且如果在传输过程中出现丢失或错误的情况，TCP会进行修正。下面详细阐述TCP协议如何实现这一点。1.数据分段与序列号TCP将应用层的数据拆分成多个小块，称为“段”（segment），每个段包含一个序列号。序列号用于标识TCP段的顺序，确保接收方能够按照
springboot Actuator 介绍 stayhungerstayflush spring基础介绍 spring boot 后端 java
SpringBootActuator深度解析与实战指南一、开篇导言SpringBootActuator是SpringBoot生态中用于实现应用监控与管理的关键模块，为生产级应用提供了开箱即用的运维能力。本文将深入剖析其核心机制，并通过实战案例演示如何构建企业级的应用监控体系。二、核心概念深度解析1.端点（Endpoints）体系端点作为Actuator的核心交互接口，通过HTTP和JMX两种协议暴
如何部署Java应用到服务器 DKPT #软件开发服务器环境搭建服务器服务器
准备工作：确保服务器上安装了Java运行环境（JRE或JDK）。安装Web服务器，如ApacheTomcat、Jetty或WildFly。配置服务器网络，确保可以远程访问。打包Java应用：使用IDE（如IntelliJIDEA或Eclipse）或构建工具（如Maven或Gradle）将Java项目打包成WAR或JAR文件。上传应用到服务器：使用FTP、SCP或其他文件传输工具将打包好的文件上传到
onnx处理和TensorRT量化推理相关代码工具天亮换季人工智能算法深度学习
一.说明在模型量化过程中，经常要使用一些工具对onnx或者量化后的模型（这里以TensorRT为例）进行推理，往往需要一些处理工具，比如：拆分或者合并onnx；修改onnx中的量算子QuantizeLinear的scale值；以及使用onnxruntime进行推理；TensorRT的序列化文件的inference；隐式量化生成量化校准表…现提供一些封装好的工具，作为记录，方便日后查阅使用"
word处理控件Aspose.Words教程：使用 Python 删除 Word 中的空白页 CodeCraft Studio 文档管理控件 word python 开发语言
Aspose.Words是一种高级Word文档处理API，用于执行各种文档管理和操作任务。API支持生成，修改，转换，呈现和打印文档，而无需在跨平台应用程序中直接使用MicrosoftWord。AsposeAPI支持流行文件格式处理，并允许将各类文档导出或转换为固定布局文件格式和最常用的图像/多媒体格式。Aspose.wordsfor.net下载Aspose.wordsforforPython下载
【Agent实战】RAG方式+结构化prompt（CoT）+API工具结合ChatGPT4o能力Agent项目实践（货物上架位置推荐助手）姚瑞南 RAG技术应用探索大模型落地探索及agent搭建 prompt chatgpt 自然语言处理人工智能 AIGC
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）目录结论效果图示1.prompt2.API工具封装3.知识库搭建4.测试用例结论成功利用ChatGPT4o版本结合RAG知识库方式，通过结构化prompt（CoT）调用API工具为用
接口测试中常见的问题有哪些？ Feng.Lee 漫谈测试可用性测试测试工具接口测试 API测试
目录一、请求参数问题必填字段缺失参数数据类型错误边界值或超限值问题参数组合错误二、响应结果问题HTTP状态码错误数据结构不符合预期业务逻辑错误数据一致性错误三、异常场景处理不足未处理异常输入未处理超时或服务不可用重复请求问题四、安全相关问题鉴权缺失或漏洞敏感数据未加密越权访问五、性能问题高并发下接口崩溃资源泄漏响应时间过长接口测试需关注：我们在进行测试时候，好多测试不方便在页面中进行执行，接口测试
从青铜到王者：六大排序算法实战解析 AAEllisonPang Python python 算法排序算法
前言在编程的世界里，排序算法如同一颗璀璨的明珠，闪耀着智慧的光芒。它不仅是计算机科学的基础知识点，更是每一位程序员必备的技能。今天，就让我们一同走进排序算法的世界，深入探究冒泡排序、选择排序、插入排序、快速排序、归并排序、堆排序这六大经典算法的精髓所在，为你提供一份全面、深入、实用的指南。一、冒泡排序：简单易懂的入门算法冒泡排序是一种简单直观的排序算法，它重复地走访过要排序的数列，依次比较相邻的两
Pandas数据清洗手册（参数解析与实战）步入烟尘 Python超入门指南全册 pandas 数据清洗开发语言 python
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
适配器模式详解：原理、C++代码实现、结构图、场景及优缺点五木大大 C++随想录适配器模式 c++c语言码蚁软件算法设计模式
一、原理及代码适配器模式是一种结构型设计模式，用于将一个类的接口转换成客户端所期望的另一个接口。这可以让原本由于接口不兼容而不能在一起工作的类能够协同工作。适配器模式通常包括三个角色：目标接口（Target）、适配器（Adapter）和被适配者（Adaptee）。适配器模式的原理如下：目标接口（Target）定义了客户端使用的特定接口。适配器（Adapter）实现了目标接口，并持有一个被适配者的实
回流（Reflow）与重绘（Repaint）：原理、性能影响与优化策略冬冬小圆帽前端 javascript html
回流（Reflow）和重绘（Repaint）是浏览器渲染页面时的两个关键过程，它们对页面性能有重要影响。理解它们的机制以及如何优化，可以帮助我们编写更高效的代码。下面我们将结合代码深度分析回流和重绘。1.回流和重绘的基本概念1.1回流（Reflow）回流是指浏览器计算页面布局的过程。当页面中的元素发生几何属性（如宽度、高度、位置等）变化时，浏览器需要重新计算元素的几何信息，并重新构建渲染树（Ren
Webpack 优化深度解析：从构建性能到输出优化的全面指南冬冬小圆帽 webpack 前端 node.js
Webpack是一个强大的模块打包工具，广泛应用于现代前端开发中。随着项目规模的增大，Webpack的构建速度和输出文件的优化变得尤为重要。1.Webpack优化的核心目标Webpack优化的主要目标包括：减少构建时间：加快开发环境的构建速度，提升开发体验。减小输出文件体积：减少生产环境的资源体积，提升页面加载性能。提升缓存利用率：通过合理的文件哈希和代码分割，提升资源的缓存命中率。提高代码质量：
YOLO系列模型从v1到v10的演进剑走偏锋o.O YOLO 目标跟踪人工智能
文章目录引言YOLOv1:开创单阶段目标检测先河发布时间与背景核心创新模型架构训练策略与优化YOLOv2:提升精度与速度的平衡发布时间与背景核心创新模型架构训练策略与优化YOLOv3:多尺度检测与残差连接发布时间与背景核心创新模型架构训练策略与优化YOLOv4:引入注意力机制与优化模块发布时间与背景核心创新模型架构训练策略与优化YOLOv5:工程优化与实际应用的结合发布时间与背景核心创新模型架构训
基于Spring接口，集成Caffeine+Redis两级缓存码事通 spring java spring boot
在上一篇文章Redis+Caffeine两级缓存，让访问速度纵享丝滑中，我们介绍了3种整合Caffeine和Redis作为两级缓存使用的方法，虽然说能够实现功能，但实现手法还是太粗糙了，并且遗留了一些问题没有处理。本文将在上一篇的基础上，围绕两个方面进行进一步的改造：JSR107定义了缓存使用规范，spring中提供了基于这个规范的接口，所以我们可以直接使用spring中的接口进行Caffeine
十大排序算法迷茫的羔羊羊数据结构与算法排序算法算法数据结构
1.冒泡排序（BubbleSort）冒泡排序重复地走访过要排序的数列，一次比较两个元素，如果它们的顺序错误就把它们交换过来，直到整个数列有序。publicclassBubbleSort{publicstaticvoidbubbleSort(int[]arr){intn=arr.length;//外层循环控制排序的轮数for(inti=0;iarr[j+1]){//交换arr[j]和arr[j+1]
替换word模板内容 Java实现一头酸奶牛_ 工具类 java
文章目录第一步：准备文件第二步：将word文件另存为.xml格式第三步：放到idea中的一个目录下第四步：修改占位符第五步：代码示例第六步：效果图1第六步：效果图2第一步：准备文件这里以这个文件为例，在要替换的地方用占位符$replaceXX@替换。第二步：将word文件另存为.xml格式第三步：放到idea中的一个目录下这里已src目录为例第四步：修改占位符第五步：代码示例packagecom.
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &