吃着火锅x唱着歌

UNIX网络编程卷一学习笔记第五章 TCP客户/服务器程序示例

本章将编写一个完整的TCP客户/服务器程序，这个简单例子是执行以下步骤的一个回射服务器：
1.客户从标准输入读入一行文本，并写给服务器；
2.服务器从网络输入读入这行文本，并回射给客户；
3.客户从网络输入读入这行回射文本，并显示在标准输出上。

如上图，我们在客户与服务器之间画了两个单向箭头，但实际上它们构成一个全双工的TCP连接。fets和fputs函数来自标准IO函数库，writen和readline这两个函数是我们编写的。

大多数TCP/IP实现已经提供了以上这种回射服务器，有使用UDP的，也有使用TCP的。

回射输入行这样的客户/服务器程序是一个简单而有效的网络应用程序的例子，实现任何客户/服务器网络应用所需的所有基本步骤可通过本例阐明，若想把本例扩充成自己的应用程序，只需修改服务器对来自客户的输入的处理过程。

TCP回射服务器的main函数：

#include "unp.h"

int main(int argc, char **argv) {
    int listenfd, connfd;
    pid_t childpid;
    socklen_t clilen;
    struct sockaddr_in cliaddr, servaddr;
    
    listenfd = Socket(AF_INET, SOCK_STREAM, 0);
    
    bzero(&servaddr, sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_addr.s_addr = htonl(INADDR_ANY);    // 捆绑通配地址，告诉系统，如果系统是多宿主机，我们接受目的地址为任何本地接口的地址
    servaddr.sin_port = htons(SERV_PORT);    // 在头文件unp.h中，SERV_PORT的值定义为9877

    Bind(listenfd, (SA *)&servaddr, sizeof(servaddr));
    
    Listen(listenfd, LISTENQ);
    
    for (; ; ) {
        clilen = sizeof(cliaddr);
        connfd = Accept(listenfd, (SA *)&cliaddr, &clilen);    // 服务器阻塞于此，等待客户连接的完成
        
        if ((childpid = Fork()) == 0) {    /* child process */
            Close(listenfd);    /* close listening socket */
            str_echo(connfd);    /* process the request */
            exit(0);
        }
        Close(connfd);    /* parent closes connected socket */
    }
}

以上程序中，SERV_PORT应该比1023大，因为我们不需要一个保留端口；要比5000大，以免与许多源自Berkeley的实现分配临时端口的范围冲突；要比49152小，以免与临时端口号的正确范围冲突；还应该不和任何已注册的端口冲突。

上例中，fork函数返回后，子进程关闭监听套接字，父进程关闭已连接套接字，之后子进程调用str_echo处理客户请求。

以下是TCP回射服务器的str_echo函数，它从客户读入数据，并把它们回射给客户：

#include "unp.h"

void str_echo(int sockfd) {
    ssize_t n;
    char buf[MAXLINE];
    
again:
    while ((n = read(sockfd, buf, MAXLINE)) > 0) {
        Writen(sockfd, buf, n);
    }
    
    if (n < 0 && errno == EINTR) {
        goto again;
    } else if (n < 0) {
        err_sys("str_echo: read error\n");
    }
}

以上代码中，read函数从套接字读入数据，writen函数把读到的内容回射给客户。如果客户关闭连接，那么接收到客户的FIN将导致服务器子进程的read函数返回0，这又导致str_echo函数的返回，从而在main函数中终止子进程。

以下是TCP回射客户程序的main函数：

#include "unp.h"

int main(int argc, char **argv) {
    int sockfd;
    struct sockaddr_in servaddr;
    
    if (argc != 2) {
        err_quit("usage: tcpcli ");
    }
    sockfd = Socket(AF_INET, SOCK_STREAM, 0);
    
    bzero(&servaddr, sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_port = htons(SERV_PORT);
    Inet_pton(AF_INET, argv[1], &servaddr.sin_addr);
    
    Connect(sockfd, (SA *)&servaddr, sizeof(servaddr));
    
    str_cli(stdin, sockfd);    /* do it all，完成客户剩余部分的处理工作 */
    
    exit(0);
}

TCP回射客户程序str_cli函数：

#include "unp.h"

void str_cli(FILE *fp, int sockfd) {
    char sendline[MAXLINE], recvline[MAXLINE];
    
    while (Fgets(sendline, MAXLINE, fp) != NULL) {
        Writen(sockfd, sendline, strlen(sendline));
        if (Readline(sockfd, recvline, MAXLINE) == 0) {
            err_quit("str_cli: server terminated prematurely");
        }
        Fputs(recvline, stdout);
    }
}

以上代码中的fgets函数读入一行文本，它在以下情况会返回：读入了MAXLINE-1字节、遇到EOF、读到换行符，之后writen函数把读到的该行发给服务器。

readline函数从服务器读入回射行，fputs函数把它写到标准输出。

当遇到文件结束符或错误时，fgets函数返回一个空指针，客户的循环于是被终止。包裹函数Fgets会检查是否发生错误，如果发生则终止进程，因此Fgets函数只会在遇到文件结束符时才返回一个空指针。

首先在linux主机上后台启动服务器：

服务器启动后，会阻塞到accept调用，在启动客户前，运行netstat检查服务器监听套接字的状态：

上图中只给出了第一行的标题和我们最关心的那行，该命令列出系统中所有套接字的状态，可能会有大量输出，我们必须指定-a（-all）选项查看所有套接字，包括监听套接字和非监听套接字，否则不会列出监听套接字。

以上输出是我们所期望的，它处于LISTEN状态，有通配的本地地址，本地端口为9877。netstat用星号表示一个为0的IP地址（INADDR_ANY）或为0的端口号。

之后在同一主机上启动客户，并指定服务器的主机IP为127.0.0.1（环回地址），当然我们也可指定该地址为主机的非环回IP地址：

客户调用connect会引起TCP的三路握手过程，当三路握手完成后，客户中的connect函数和服务器的accept函数均返回，连接于是建立。接着会发生如下步骤：
1.客户调用str_cli函数，该函数阻塞于fgets调用，因为我们还未曾键入过一行文本。
2.服务器中的accept函数返回时，服务器调用fork，再由子进程调用str_echo，该函数调用readline，readline函数调用read，而read函数在等待客户送入一行文本期间阻塞。
3.服务器父进程再次调用accept并阻塞，等待下一个客户连接。

至此，我们有3个正在睡眠的进程：客户进程、服务器父进程、服务器子进程。

以上步骤中，我们先列出客户的步骤，原因在于客户收到三路握手的第2个分节时，connect函数就返回了，而服务器要直到收到三路握手的第3个分节才返回，即在connect函数返回后再过RTT的一半才返回。

既然是在同一台主机上运行客户和服务器，netstat会给出对应所建立TCP连接的两行额外输出：

上图中第一个ESTABLISHED行对应服务器子进程的套接字，因为它的本地端口号是9877；第二个ESTABLISHED行对应客户进程的套接字，因为它的本地端口号是42758。如果我们在不同主机上运行客户和服务器，那么客户主机就只输出客户进程的套接字，服务器主机也只输出两个父子服务器进程的套接字。

我们也可以用ps命令检查这些进程的状态和关系：

上图中使用了ps命令的特定的命令行参数限定了它只输出与本讨论相关的信息。从上图可见，客户和服务器运行在同一个窗口中（即pts/6，表示伪终端号6）。PID和PPID列给出了进程间的父子关系，子进程的PPID是父进程的PID，因此，第一个tcpserv01是父进程，第二个tcpserv01是子进程，而父进程的PPID是shell（bash）。

上图中3个网络进程的STAT列都是S，表明进程在为等待某些资源而睡眠，WCHAN列给出了睡眠状态的进程的情况，Linux在进程阻塞于accept或connect函数时，输出wait_for_connect；进程阻塞于套接字输入或输出时，输出tcp_data_wait；进程阻塞于终端IO时，输出read_chan。

至此连接已建立，不论我们在客户的标准输入中键入什么，都会回射到它的标准输出中：

如上图，我们键入的两行都得到了回射，接着我们键入终端EOF字符（Control-D）以终止客户。然后如果立即执行netstat命令，会看到如下结果：

如上图，当前连接的客户端（它的本地端口为42758）进入了TIME_WAIT状态，而监听服务器仍在等待另一个客户连接。上图中我们让命令netstat的输出通过管道作为grep程序的输入，从而只输出与服务器的众所周知端口相关的文本行，这样做也删掉了标题行。

如果我们把客户的标准输入重定向到一个二进制文件，则可能不能正常工作。如果二进制文件的前3个字节为二进制数1、二进制数0、换行符，由于fgets函数最多读入MAXLINE-1字节，除非碰到换行符或到达文件尾而提前返回，因此fgets函数会读入3个字节，然而在计算要发送的串的长度时，strlen函数会返回1，因为第2个字节就是空字节了，客户于是只把第一个字节发送给服务器，导致服务器阻塞在readline函数上，等待一个换行符，而客户也阻塞在等待服务器的应答上，这就是所谓的死锁，两个进程都阻塞在等待因对方原因而永远不会到达的事件上。此处的问题在于，fgets函数以一个空字节表示所返回数据的结尾，因此它读入的数据不能含有空字节。

如果我们将Telnet作为客户与我们的回射服务器通信，会发生什么？Telnet把输入行转换成NVT ASCII，意味着以CR后跟LF的双字节序列终止每一行，而我们自己的客户程序只用换行符终止每一行。我们仍然可以使用Telnet客户与我们的服务器通信，因为我们的服务器回射每个字符，包括换行符前的回车符。

正常终止客户和服务器的步骤：
1.当我们键入EOF字符时，fgets函数返回一个空指针，于是str_cli函数返回。
2.当str_cli函数返回到客户的main函数后，main调用exit终止进程。
3.进程终止的部分工作是关闭所有打开的描述符，因此客户打开的套接字由内核关闭。这导致TCP发送一个FIN给服务器，服务器TCP则以ACK响应，这是TCP连接终止序列的前半部分。至此，服务器套接字处于CLOSE_WAIT状态，客户套接字处于FIN_WAIT_2状态。
4.当服务器TCP接收到FIN时，服务器子进程阻塞于readline调用，于是readline函数返回0，这会导致str_echo函数返回服务器子进程的main函数。
5.服务器子进程通过调用exit来终止。
6.服务器子进程中所有打开描述符随之关闭，子进程关闭已连接套接字会引发TCP连接终止序列的最后两个分节：一个从服务器到客户的FIN和一个从客户到服务器的ACK。至此，连接完全终止，客户套接字进入TIME_WAIT状态。
7.在服务器子进程终止时，给父进程发送一个SIGCHLD信号，但本例中我们没有在代码中捕获该信号，而该信号的默认行为是被忽略。既然父进程未加处理，子进程于是进入僵死状态：

如上图，子进程的状态是Z（僵死）。

信号是告知某个进程发生了某个事件的通知，有时也称为软件中断。信号通常是异步发生的，进程预先不知道信号的准确发生时刻。

信号可以：
1.由一个进程发给另一个进程（或自身）；
2.由内核发给某个进程。

SIGCHLD信号就是内核在任何一个进程终止时发给它的父进程的一个信号。

每个信号都有一个与之相关的处置（disposition），也称为行为（action），我们通过调用sigaction来设定一个信号的处置，有三种选择：
1.我们可以提供一个函数，只要有特定信号发生它就被调用，这样的函数称为信号处理函数，这种行为称为捕获信号。有两个信号不能捕获，它们是SIGKILL和SIGSTOP，信号处理函数的参数只有一个，且是信号值，它没有返回值，其函数原型如下：

void handler(int signo);

对大多信号来说，调用sigaction并指定信号发生时要调用的函数就是捕获信号所需的全部工作，但SIGIO、SIGPOLL、SIGURG信号还要求捕获它的进程做额外工作。
2.我们可以把某信号的处置设定为SIG_IGN来忽略它，SIGKILL和SIGSTOP不能被忽略。
3.我们可以把某个信号的处置设定为SIG_DFL来使用它的默认处置。默认处置通常是在收到信号后终止进程，其中某些信号还在当前工作目录产生一个核心映像（core image，也称内存影像）。有个别信号的默认处置是忽略，SIGCHLD和SIGURG（带外数据到达）就是默认处置为忽略的其中两个信号。

POSIX建立信号处置的方法是调用sigaction函数，但该函数有点复杂，简单的方法是使用signal函数，它第一个参数是信号名，第二个参数为指向函数的指针或常值SIG_IGN或常值SIG_DFL。但signal函数是早于POSIX出现的历史悠久的函数，调用它时，不同的实现提供不同的信号语义以达成向后兼容，而POSIX明确规定了调用sigaction时的信号语义。我们的解决方法是定义自己的signal函数，它只是调用POSIX的sigaction函数，这就以期望的POSIX语义提供了一个简单的接口，我们把该函数与早先出现的err_XXX函数和包裹函数等一起包含在自己的函数库中。我们的signal函数如下：

#include "unp.h"

Sigfunc *signal(int signo, Sigfunc *func) {
    struct sigaction act, oact;
    
    act.sa_handler = func;    // 设置信号处理函数
    sigemptyset(&act.sa_mask);
    act.sa_flags = 0;
    if (signo == SIGALRM) {
#ifdef SA_INTERRUPT
        act.sa_flags |= SA_INTERRUPT;    /* SunOS 4.x */
#endif
    } else {
#ifdef SA_RESTART
        act.sa_flags |= SA_RESTART;    /* SVR4, 4.4BSD */
#endif    
    }
    if (sigaction(signo, &act, &oact) < 0) {
        return SIG_ERR;
    }
    return oact.sa_handler;
}

以上程序中，函数signal的正常函数原型因层次太多显得很复杂：

void (*signal(int signo, void (*func)(int)))(int);

为简化它，我们在头文件unp.h中定义了如下Sigfunc类型：

typedef void Sigfunc(int);

Sigfunc类型为仅有一个整数参数且不返回值的函数类型，signal函数的原型于是变为：

Sigfunc *signal(int signo, Sigfunc *func);

signal函数的第二个参数和返回值都是指向信号处理函数的指针。

POSIX允许我们指定一组信号，它们在信号处理函数被调用时阻塞，任何阻塞的信号都不能递交给进程。以上程序中，我们把sa_mask成员设为空集，意味着在该信号处理函数运行期间，不阻塞额外的信号。POSIX保证被捕获的信号在其信号处理函数运行期间总是阻塞的。

上例程序中，SA_RESTART标志是可选的，如果设置，被相应信号中断的系统调用将由内核自动重启。如果被捕获的信号不是SIGALRM且SA_RESTART有定义，我们就设置该标志，对SIGALRM进行处理的原因在于，产生SIGALRM信号的目的通常是为IO操作设置超时，此时我们希望受阻塞的IO系统调用被该信号中断掉。一些早期的系统（如SunOS 4.x）默认会自动重启被中断的系统调用，而SA_INTERRUPT标志使内核不再自动重启被中断的系统调用，如果定义了SA_INTERRUPT标志，我们就在被捕获的信号是SIGALRM时设置它。

以上代码中，我们的返回值像旧的signal函数的行为一样，返回信号处理函数或SIG_ERR。

POSIX信号语义：
1.一旦安装了信号处理函数，它就一直安装着，不像较早期的系统一样每执行一次就将其拆除。
2.在一个信号处理函数运行期间，正被递送的信号是阻塞的，且安装处理函数时传递给sigaction函数的sigaction结构的成员sa_mask信号集中指定的额外信号也被阻塞。
3.如果一个信号在被阻塞期间产生了一次或多次，那么该信号被解阻塞后通常只递交一次，即Unix信号默认是不排队的。POSIX实时标准1003.1b定义了一些排队的可靠信号，但我们本书不使用。
4.sigprocmask函数可选择性地阻塞或解阻塞一组信号，使得我们可以在一段临界区代码执行期间，防止捕获某些信号，以此保护这段代码（防止在临界区中进入信号处理函数，导致其他线程等待过久）。

设置僵死状态的目的是维护子进程信息，以便父进程在以后某个时间获取，这些信息包括子进程的进程ID、终止状态、资源利用信息（CPU时间、内存使用量等）。如果一个进程终止，而该进程有子进程处于僵死状态，那么它的所有僵死子进程的父进程ID将被重置为1（init进程），继承这些子进程的init进程将清理它们（即init进程将wait它们，从而去除它们的僵死状态）。有些Unix系统在ps命令的输出的COMMAND栏以指明僵死进程。

我们不愿意留存僵死进程，因为它们会占用内核空间，最终可能导致我们耗尽进程资源。无论何时我们fork子进程后都得wait它们，以防它们变成僵死进程，为此我们建立一个俘获SIGCHLD信号的信号处理函数，在函数中我们调用wait，我们可以在服务器的listen调用后增加以下函数调用建立SIGCHLD信号的信号处理函数：

Signal(SIGCHLD, sig_chld);

名为sig_chld的信号处理函数代码如下：

#include "unp.h"

void sig_chld(int signo) {
    pid_t pid;
    int stat;
    
    pid = wait(&stat);
    printf("child %d terminated\n", pid);
    return;
}

上例代码中，在信号处理函数中调用如printf这样的标准IO函数是不合适的，我们这里调用printf只为查看子进程何时终止。

System V和Unix 98标准下，如果一个进程把SIGCHLD的处置设为SIG_IGN，则它的子进程不会变为僵死进程，但POSIX没有明确表示要这样做，处理僵死进程的可移植方法就是捕获SIGCHLD，并调用wait或waitpid。

在回射服务器中加入信号处理函数后（使用的signal函数来自系统自带的函数库，而非我们自己编写的版本），在Solaris 9下编译该回射服务器，有如下结果：

上图经过的步骤如下：
1.我们键入EOF终止客户进程后，客户TCP发送一个FIN给服务器，服务器响应一个ACK。
2.收到客户的FIN导致服务器TCP递送一个EOF给子进程阻塞中的readline函数，从而子进程终止。
3.当SIGCHLD信号递交时，父进程阻塞于accept调用，sig_chld函数被执行，其wait函数取到子进程的PID和终止状态，然后是printf调用，最后从sig_chld函数返回。
4.服务器的SIGCHLD信号是在父进程阻塞于慢系统调用accept时由父进程捕获的，内核会使accept函数返回一个EINTR错误，而父进程没有处理该错误，于是终止。

在以上运行于Solaris 9环境下的例子中，其标准C函数库提供的signal函数不会使内核自动重启被中断的系统调用，即SA_RESTART标志在系统函数库的signal函数中没有设置。有些系统会自动重启被中断的系统调用，如果我们在4.4 BSD环境下使用系统函数库版本的signal函数运行以上例子，内核将重启被中断的系统调用，于是accept函数不会返回错误。我们定义自己的signal函数的理由之一就是应对不同操作系统之间的这个潜在问题。

我们在本书中总是在信号处理函数中显式给出return语句，即使对于返回值类型为void的函数而言，从结尾处掉出和执行return语句效果是一样的，我们也还是使用return语句，这样在读代码时，可以提醒我们返回可能会中断一个系统调用。

术语慢系统调用适用于可能永远阻塞的系统调用，如多数网络支持函数都属于这类，例如，如果客户连接到服务器上，那么服务器的accept函数就不会返回；如果回射客户进程永远不发那行要求服务器回射的文本，那么服务器的read调用将永不返回。其他慢系统调用的例子是对管道和终端设备的读、写。磁盘IO不属于慢系统调用，它们一般都会返回到调用者（假设没有灾难性硬件故障）。

适用于慢系统调用的规则是：当阻塞于某个慢系统调用的一个进程捕获某个信号且相应信号处理函数返回时，该系统调用可能返回一个EINTR错误。有些内核自动重启某些被中断的系统调用，不过为了便于移植，我们编写捕获信号的程序时（如大多数的并发服务器都捕获SIGCHLD），我们需要对慢系统调用返回EINTR有所准备。可移植性问题是由POSIX的SA_RESTART标志是可选的有关。有些实现尽管支持SA_RESTART标志，也不是所有被中断的系统调用都会自动重启，例如大多源自伯克利的实现都不会自动重启select函数，其中的一些实现从不会自动重启accept或recvfrom函数。

为了处理被中断的accept函数，对其做以下修改：

for (; ; ) {
    clilen = sizeof(cliaddr);
    if ((connfd = accept(listenfd, (SA *)&cliaddr, &clilen)) < 0) {
        if (errno == EINTR) {
            continue;    /* back to for() */
        } else {
            err_sys("accept error");
        }
    }
}

以上代码中，我们调用的是accept函数本身而非其包裹函数Accept，因为我们需要自己处理该函数失败的情况。

以上代码所做的事情就是自己重启被中断的系统调用。对于accept、read、write、select、open之类的函数来说，以上做法是合适的，但对于connect函数返回EINTR时，我们不能再次调用它，否则将立即返回一个错误（若connect失败，则该套接字不再可用，必须关闭）。当connect函数被捕获的信号中断且没有自动重启时，我们必须调用select函数来等待连接建立成功。

以下函数用来处理已终止的子进程：

wait和waitpid函数均返回两个值：返回值是已终止子进程的进程ID；statloc指针返回一个表示子进程终止状态的整数。我们可以调用3个宏来检查终止状态，来辨别子进程是正常终止的，还是由某个信号杀死的，还是仅仅由作业控制停止而已。还有一些宏用于接着获取子进程的退出状态、杀死子进程的信号值、停止子进程的作业控制信号的值。

调用wait的进程如果没有已终止的子进程，但有一个或多个子进程仍在执行，则wait函数将阻塞到现有子进程第一个终止为止。

waitpid函数就等待哪个子进程以及是否阻塞给了我们更多的控制。waitpid函数的pid参数指明我们想等待的子进程ID，可以传-1表示等待第一个终止的子进程（还有一些处理进程组ID的可选值，但本书中用不到）；options参数允许我们指定选项，常用选项是WNOHANG，它告知内核在没有已终止子进程时不要阻塞。

我们现在说明函数wait和waitpid在用来清理已终止子进程时的区别，为此，我们将修改客户程序，使客户建立5个与服务器的连接，随后调用str_cli函数时仅用第一个连接发送数据，建立多个连接的目的是从并发服务器上派生多个子进程：

以下是与服务器建立了5个连接的TCP客户程序：

#include "unp.h"

int main(int argc, char **argv) {
    int i, sockfd[5];
    struct sockaddr_in servaddr;
    
    if (argc != 2) {
        err_quit("usage: tcpcli ");
    }
    for (i = 0; i < 5; ++i) {
        sockfd[i] = Socket(AF_INET, SOCK_STREAM, 0);
        
        bzero(&servaddr, sizeof(servaddr));
        servaddr.sin_family = AF_INET;
        servaddr.sin_port = htons(SERV_PORT);
        Inet_pton(AF_INET, argv[1], &servaddr.sin_addr);
        
        Connect(sockfd[i], (SA *)&servaddr, sizeof(servaddr));
    }
    str_cli(stdin, sockfd[0]);    /* do it all */
    
    exit(0);
}

当以上客户进程终止时，所有打开的描述符由内核关闭（我们没有调用close，只调用了exit），且所有5个连接基本在同一时刻终止，这引发了5个FIN，每个连接一个，它们使服务器的5个子进程基本在同一时刻终止，这又导致差不多在同一时刻有5个SIGCHLD信号递交给父进程：

这种同一信号多个实例的递交会造成问题。我们首先在后台运行服务器（已安装SIGCHLD的信号处理函数），接着运行新客户：

我们注意到服务器只有一个输出，而我们预期所有5个子进程都终止了，运行ps命令我们将发现，其他4个子进程仍作为僵死进程存在着：

建立一个信号处理函数并在其中调用wait并不足以防止出现僵死进程，问题在于，所有5个信号都在信号处理函数执行之前产生，而信号处理函数只执行一次，因为Unix信号一般是不排队的。不过有时候，依赖于FIN到达服务器主机的时机，信号处理函数可能会执行2~5次。

以上问题的解决方法是调用waitpid而不是wait，以下是sig_chld函数的最终正确版本：

#include "unp.h"

void sig_chld(int signo) {
    pid_t pid;
    int stat;
    
    while ((pid = waitpid(-1, &stat, WNOHANG)) > 0) {
        printf("child %d terminated\n", pid);
    }
    
    return;
}

以上代码中，我们在一个循环内调用waitpid，以获取所有已终止子进程的状态。我们必须指定WNOHANG选项，它告知waitpid函数在有尚未终止的子进程在运行时不要阻塞。我们不能再循环内调用wait，因为wait函数会在正运行的子进程尚未终止时阻塞。

以下是服务器程序的最终正确版本，它正确处理accept返回的EINTR，并建立一个调用waitpid的SIGCHLD信号处理函数：

#include "unp.h"

void str_echo(int sockfd) {
    ssize_t n;
    char buf[MAXLINE];
    
again:
    while ((n = read(sockfd, buf, MAXLINE)) > 0) {
        Writen(sockfd, buf, n);
    }
    
    if (n < 0 && errno == EINTR) {
        goto again;
    } else if (n < 0) {
        err_sys("str_echo: read error\n");
    }
}

int main(int argc, char **argv) {
    int listenfd, connfd;
    pid_t childpid;
    socklen_t clilen;
    struct sockaddr_in cliaddr, servaddr;
    
    listenfd = Socket(AF_INET, SOCK_STREAM, 0);
    
    bzero(&servaddr, sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_addr.s_addr = htonl(INADDR_ANY);    // 捆绑通配地址，告诉系统，如果系统是多宿主机，我们接受目的地址为任何本地接口的地址
    servaddr.sin_port = htons(SERV_PORT);    // 在头文件unp.h中，SERV_PORT的值定义为9877

    Bind(listenfd, (SA *)&servaddr, sizeof(servaddr));
    
    Listen(listenfd, LISTENQ);
 
    Signal(SIGCHLD, sig_chld);
   
    for (; ; ) {
        clilen = sizeof(cliaddr);
        if ((connfd = accept(listenfd, (SA *)&cliaddr, &clilen)) < 0) {
            if (errno = EINTR) {
                continue;    /* back to for() */
            } else {
                err_sys("accept error");
            }
        }
        
        if ((childpid = Fork()) == 0) {    /* child process */
            Close(listenfd);    /* close listening socket */
            str_echo(connfd);    /* process the request */
            exit(0);
        }
        Close(connfd);    /* parent closes connected socket */
    }
}

以上是为了展示我们在网络编程时可能遇到的3种情况：
1.当fork子进程时，必须捕获SIGCHLD信号。
2.当捕获信号时，必须处理被中断的系统调用。
3.SIGCHLD的信号处理函数必须正确编写，应使用waitpid函数以免留下僵死进程。

还有一种情形会导致accept函数返回一个非致命错误，此时只需再次调用accept，以下分组序列在较忙的服务器上会出现：

如上图，三路握手完成从而连接建立后，客户TCP却发送了一个RST，在服务器看来，该连接已由TCP排队，之后在服务器进程调用accept之前，RST到达。

模拟这种情况的一个简单方法是，启动服务器，调用sock、bind、listen，然后在调用accept前睡眠一小段时间。在服务器进程睡眠时，启动客户进程，调用socket、connect，一旦connect函数返回，就设置SO_LINGER套接字选项产生这个RST，然后终止。

如何处理上述这种中止的连接依赖于不同的实现。源自Berkeley的实现完全在内核中处理中止的连接，服务器进程根本看不到。大多SVR 4实现返回一个错误给服务器进程，作为accept函数的返回结果，这些SVR 4实现返回一个EPROTO（protocol error，协议错误）作为errno值，而POSIX指出返回的errno值必须是ECONNABORTED（software caused connection abort，软件引起的连接中止）。POSIX作出修改的理由在于，流子系统中发生某些致命的协议相关事件时，也会返回EPROTO，要是对于由客户引起的一个已建立连接的非致命终止也返回同样的错误，服务器就不知道该不该再次调用accept，换成ECONNABORTED错误后，服务器就可以忽略它，再次调用accept就行。

源自Berkeley的内核不把该错误传递给进程的做法的步骤在TCPv2中有阐述。

现在我们启动客户和服务器，然后杀死服务器子进程，这是在模拟服务器进程崩溃的情形，然后查看客户将发生什么，步骤如下：
1.在同一主机上启动客户和服务器，并在客户上键入一行文本，验证一切正常。
2.找到服务器子进程的进程ID，执行kill命令杀死它。作为进程终止处理的部分工作，子进程中所有打开着的描述符都被关闭，这导致向客户发送一个FIN，而客户TCP会响应一个ACK。这是TCP连接终止工作的前半部分。
3.SIGCHLD信号被发送给服务器父进程，并得到处理。
4.客户TCP接收来自服务器TCP的FIN并响应一个ACK，但客户进程还阻塞在fgets调用上，等待从终端接收一行文本。
5.此时，在另一个窗口上运行stat命令，观察套接字状态，我们会发现TCP连接终止序列的前半部分已经完成：

6.在客户上再键入一行文本：

如上图，我们键入another line时，str_cli函数调用writen，客户TCP接着把数据发送给服务器，TCP允许这么做，因为客户TCP接收到FIN只是表示服务器进程不再发送任何数据，FIN的接收并没有告知客户TCP服务器进程已终止（但本例中，它确实是终止了）。当服务器TCP接收到来自客户的数据时，既然先前打开那个套接字的进程已经终止，于是响应一个RST，该RST可通过tcpdump观察到。此时，连接被终止，连接终止序列的最后两个分节不再发送，并且该RST使得服务器端（主动执行连接关闭的一端）不再经历TIME_WAIT状态。
7.但客户进程看不到这个RST，因为它在调用writen后立即调用了readline，并且由于第2步中接收到的FIN，readline函数返回0（表示EOF），我们的客户未预期收到EOF，于是打印出错信息server terminated prematurely（服务器过早终止）并退出。
8.当客户终止时，它所有打开着的描述符都被关闭。

上述讨论还取决于客户调用readline既可能发生在服务器的RST被客户收到之前，也可能发生在收到之后，如果readline调用发生在收到RST之前（如上所述），那么结果是客户得到一个预期外的EOF，否则结果是由readline函数返回一个ECONNRESET（connection reset by peer，对方复位连接错误）。

上例的问题在于，当FIN到达套接字时，客户正阻塞在fgets调用上，客户实际上在应对两个描述符，即套接字和用户输入，它不能单纯阻塞在这两个源中某个特定源的输入上，而是应该阻塞在任何一个源的输入上，这正是select和poll函数的目的之一。

如果客户不理会readline函数返回的错误，继续写更多数据到服务器上，这种情况是可能的，如客户可能在读回数据前执行两次对服务器的写操作，而RST由第一次写操作引发时。当一个进程向某个已收到RST的套接字执行写操作时，内核向该进程发送一个SIGPIPE信号，该信号的默认行为是终止进程，因此进程必须捕获它以免被终止。不论该进程是捕获了该信号并从其信号处理函数返回，还是简单地忽略该信号，写操作都将返回EPIPE错误。

一个在usenet上的FAQ（Frequently Asked Question，经常问及的问题）是如何在第一次写操作时而非第二次写操作时捕获SIGPIPE信号，这是不可能的，按上述讨论，第一次写操作引发RST，第二次写引发SIGPIPE信号。写一个已接收了FIN的套接字没问题，但写一个已接收了RST的套接字则是一个错误。

为了看有了SIGPIPE信号会发生什么，我们修改客户程序：

void str_cli(FILE *fp, int sockfd) {
    char readline[MAXLINE], recvline[MAXLINE];
    while (Fgets(sendline, MAXLINE, fp) != NULL) {
        Writen(sockfd, sendline, 1);
        sleep(1);
        Writen(sockfd, sendline + 1, strlen(sendline) - 1);
        if (Readline(sockfd, recvline, MAXLINE) == 0) {
            err_quit("str_cli: server terminated prematurely");
        }
        Fputs(recvline, strout);
    }
}

我们做的修改就是调用writen两次，第一次把文本行数据的第1个字节写入套接字，暂停1秒后，第二次把同一文本行中剩余字节写入套接字，目的是让第一次writen调用引发一个RST，再让第二个writen调用产生SIGPIPE。

我们启动客户，键入一行文本，看到它被正确回射后，在服务器主机上终止服务器子进程，接着键入另一行文本bye，结果是没有任何回射，而shell告诉我们客户进程因为SIGPIPE信号死亡了，当前台进程未执行core dump就死亡时，有些shell不显示任何信息。处理SIGPIPE的建议方法取决于它发生时应用进程想做什么，如果没有特殊的事情要做，则将信号处理办法直接设置为SIG_IGN，并且在写失败后查看errno是否是EPIPE错误，如果是则停止写入；如果信号出现时需采取特殊措施（可能需要在日志中登记），则要捕获该信号，以便在信号处理函数中执行所期望的动作，但如果使用了多个套接字，该信号的递交无法告诉我们哪个套接字出了错，如果我们确实需要知道哪个write出了错，需要在write函数失败后查看errno是否是EPIPE。

为了查看当服务器主机崩溃后会发生什么，我们必须在不同主机上运行客户和服务器，我们先启动服务器，再启动客户，接着在客户上键入一行文本以确认连接工作正常，然后从网络上断开服务器主机，然后在客户上键入另一行文本，这样同时也模拟了当客户发送数据时服务器主机不可达情形（即建立连接后某些中间路由器又不工作了）。步骤如下：
1.当服务器主机崩溃时，服务器进程不会在已有的网络连接上发出任何东西。这里我们假设的是主机崩溃，而不是执行命令关机。
2.在客户上键入一行文本，它由writen函数写入内核，再由客户TCP作为一个数据分节送出。客户随后阻塞于readline调用，等待回射应答。
3.用tcpdump观察网络会发现，客户TCP持续重传数据分节，试图从服务器上接收一个ACK。TCPv2给出了TCP重传的一个典型模式：源自Berkeley的实现重传该分节12次，共等待约9分钟才放弃重传。当客户TCP最后终于放弃时（假设客户TCP持续重传期间，服务器主机没有重新启动；或服务器主机没有崩溃过，且中间路由在客户TCP持续重传期间一直不可用），给客户进程返回一个错误，既然客户阻塞在readline调用上，该调用将返回一个错误。假设服务器主机已崩溃，从而对客户的数据分节没有响应，那么readline函数返回的错误是ETIMEDOUT；如果某个中间路由器判定服务器主机已不可达，该路由器从而响应一个destination unreachable（目的不可达）ICMP消息，那么readline函数返回的错误是EHOSTUNREACH或ENETUNREACH。

尽管客户最终会发现对端主机已崩溃或不可达，但有时我们需要比9分钟更快地检测出这种情况，此时可对readline调用设置一个超时。

以上讨论的情形只有在我们向服务器主机发送数据时才能检测出它已崩溃，如果我们想不主动发送数据就检测出服务器主机的崩溃，需要SO_KEEPALIVE套接字选项。

在以上讨论中，我们发送数据时，服务器主机仍处于崩溃状态，我们将模拟服务器主机在客户TCP持续重传期间重启。模拟这种情形的最简单方法是：先建立连接，再从网络上断开服务器主机，将它关机后再重启，最后把它重新连接到网络中（我们不想客户知道服务器主机的关机）。

假设没有使用SO_KEEPALIVE选项，所发生的的步骤如下：
1.启动服务器和客户，并在客户键入一行文本以确认连接已建立。
2.服务器主机崩溃并重启。
3.在客户上键入一行文本，它将作为一个TCP数据分节发送到服务器主机。
4.当服务器主机崩溃后重启时，它的TCP丢失了崩溃前所有连接信息，因此服务器TCP对所收到的来自客户的数据分节响应一个RST。
5.当客户TCP收到该RST时，客户正阻塞于readline调用，导致该调用返回ECONNRESET错误。

以上过程中，如果服务器进程在服务器主机重启后又启动了，那么服务器TCP在收到消息后还是会返回一个RST。

如果对客户而言检测服务器主机是否崩溃很重要，即使客户不主动发送数据也要能检测出来，就需要使用其他技术（如SO_KEEPALIVE套接字选项或某些客户/服务器心博函数）。

当服务器进程正在运行时，如果服务器被关机，如果是Unix系统被关机，init进程通常先给所有进程发送SIGTERM信号（该信号可被捕获），等待一段固定时间（通常在5到20秒之间），然后给所有仍在运行的进程发送SIGKILL信号（该信号不可被捕获）。这样给所有运行的进程一小段时间来清除和终止，如果我们捕获SIGTERM信号后没有终止，我们的服务器将由SIGKILL信号终止。当服务器子进程终止时，它的所有打开着的描述符都被关闭，随后发送FIN给客户。对于客户，需要使用select或poll函数，使服务器进程的终止一经发生（收到服务器的FIN），客户机就能检测到。

在TCP客户和服务器可以彼此通信前，每一端都得指定连接的套接字对：本地IP地址、本地端口、外地IP地址、外地端口，下图中使用粗圆点标出了这4个值：

上图处于客户的角度，因为只调用了socket和connect，外地IP地址和外地端口在客户调用connect时指定，两个本地值通常由内核作为connect的一部分来选定。客户也可在调用connect前，通过调用bind来指定其中一个或全部两个本地值，但这种做法并不常见。

上图中客户的IP地址是基于路由选定的，它的前提是套接字尚未绑定某本地IP地址，当发送第一个SYN建立连接时，IP路由功能会查看目的IP地址（服务器的IP地址），搜索路由表来确定外出接口和下一跳，这个外出接口的主IP地址用作源IP地址。

客户建立连接后可用getsockname函数获取由内核指定的两个本地值。

下图是服务器角度的上图：

本地端口（服务器的众所周知端口）由bind函数指定，bing函数中指定的服务器本地IP地址通常是通配IP地址，如果服务器在一个多宿主机上绑定通配IP地址，那么它可以在连接建立后通过getsockname函数获取本地IP地址。另外两个外地值由accept函数返回给服务器。如果服务器调用accept后又调用了exec，则可通过getpeername函数获取客户IP地址和端口号。

如上图，如果客户在connect调用中指定的服务器主机IP地址是与服务器右侧的数据链路关联的IP地址，会发生什么？假设服务器主机支持弱端系统模型，那么一切正常，目的IP地址是右端数据链路的IP地址的数据报，到达左端数据链路时也能被服务器主机接受。

修改服务器程序，它仍从客户读入一行文本，但新服务器期望该文本行包含由空格分开的两个整数，服务器将返回两个整数的和，只需要修改服务器的str_echo函数：

void str_echo(int sockfd) {
    long arg1, arg2;
    ssize_t n;
    char line[MAXLINE];

    for (; ; ) {
        if ((n = Readline(sockfd, line, MAXLINE)) == 0) {
            return;    /* connection closed by other end */
        }
        // 读取以如下内容为开头的串：由一个或多个空格、tab分隔的两个数字
        if (sscanf(line, "%ld%ld", &arg1, &arg2) == 2) {
            snprintf(line, sizeof(line), "%ld\n", arg1 + arg2);
        } else {
            snprintf(line, sizeof(line), "input error\n");
        }
        n = strlen(line);
        Writen(sockfd, line, n);
    }
}

不论客户和服务器的主机字节序如何，以上程序都正常工作。

现在将客户和服务器程序修改为通过套接字传递二进制结构，当这样的客户和服务器运行在主机字节序不同或所支持的长整数大小不一致的两个主机上时，不能正常工作。

还是求两数之和，如果我们将两个数字放在一个结构中，将结果放在另一个结构中：

struct args {
    long arg1;
    long arg2;
};

struct result {
    long sum;
};

为此我们需要修改客户的str_cli函数：

void str_cli(FILE *fp, int sockfd) {
    char sendlline[MAXLINE];
    struct args args;
    struct result result;
    
    while (Fgets(sendline, MAXLINE, fp) != NULL) {
        if (sscanf(sendline, "%ld%ld", &args.arg1, &args.arg2) != 2) {
            printf("invalid input: %s", sendline);
            continue;
        }
        Writen(sockfd, &args, sizeof(args));
        if (Readn(sockfd, &result, sizeof(result)) == 0) {
            err_quit("str_cli: server terminated prematurely");
        }
        printf("%ld\n", result.sum);
    }
}

同时还要修改服务器的str_echo函数：

void str_echo(int sockfd) {
    ssize_t n;
    struct args args;
    struct result result;
    for (; ; ) {
        if ((n = Readn(sockfd, &args, sizeof(args)) == 0) {
            return;    /* connection closed by other end */
        }
        result.sum = args.arg1 + args.arg2;
        Writen(sockfd, &result, sizeof(result));
    }
}

在具有相同体系结构的两个主机上运行客户和服务器程序，可以正常工作：

但如果在具有不同体系结构的两个主机上运行同样的客户和服务器程序，如服务器运行在SPARC架构的freebsd系统上（大端字节序），客户运行在Intel的linux系统上（小端字节序），则不能正常工作：

问题在于客户以小端字节序格式通过套接字送出两个二进制整数，却被服务器解释成了大端字节序整数。我们看到这对客户和服务器对于正整数，看起来工作正常，但对于负整数则工作失常了。由于客户运行在小端字节序的主机上，32位的整数1按下图格式存放：

上图4个字节按A、A+1、A+2、A+3的顺序通过套接字发送，大端字节序的服务器这样存放这4个字节：

对于服务器来说，值0x01000000是16777216。类似地，由客户发送的整数2将被服务器解释成0x02000000，即33554432，这两个整数的和为50331648，即0x03000000，服务器把这个和发给客户后，客户将它解释为了3。

而32位的整数-22在客户的小端字节序主机上如下图所示，采用的是负数的二进制补码表示：

它在大端字节序的服务器上被解释成0xeaffffff，即-352321537；类似地，-77在大端字节序上被表示成0xb3ffffff，即-1275068417。服务器上这两个整数相加的结果为0x9efffffe，即-1627389954。这个大端字节序的和发送给客户后以小端字节序解释的值是0xfeffff9e，即-16777314。

如果我们在把两个数字传给服务器前对每个参数调用htonl，再让服务器做加法前对每个参数调用ntohl，则在32位机器上可以正常工作。虽然这两个函数中的l曾经表意long（长整数），但它们只能操作32位整数，在64位系统上一个长整数可能占64位，这两个函数就不能工作了。

如果客户运行在以32位存储长整数的主机上，而服务器在以64位存储长整数的主机上，则在上例中，服务器会永远阻塞在readn函数，因为客户发送的是2个32位值，而服务器等待的是2个64位值（通过sizeof函数获取args结构的大小为64位）。如果客户和服务器所在主机对调，则客户会发送两个64位值，但服务器只读入第一个64位值，并把它解释为2个32位值，第二个64位值仍在服务器套接字的接收缓存中，之后服务器向客户发送1个32位值，但客户会等待读入1个64位值，因此客户会永远阻塞在readn函数。

上例中存在3个问题：
1.不同实现以不同格式存储二进制数，最常见的格式是大端字节序和小端字节序。
2.不同实现在存储相同的C数据类型时可能存在差异，大多32位UNIX系统使用32位表示长整型，而64位系统使用64位表示同样的数据类型。对于short、int、long等整数类型，它们的大小不确定。
3.不同实现给结构打包的方式存在差异，取决于各种数据类型所用位数以及机器对齐限制。因此，通过套接字传二进制结构不明智。

解决数据格式问题的常用方法：
1.把所有数值数据作为文本串传递，这里假设客户和服务器具有相同字符集。
2.显示定义所支持数据类型的二进制格式（位数、大端或小端字节序），并以这样的格式在客户与服务器间传递所有数据。RPC软件包通常使用这种技术。

验证向收到RST的套接字继续写会产生SIGPIPE信号：编写一个SIGPIPE信号处理函数，它显示一条消息后就返回，调用connect前建立该信号处理函数，把服务器的端口号改为13，即daytime服务器，连接建立后，调用sleep睡眠2秒，然后调用write向套接字中写若干字节，之后再sleep2秒，再往套接字中write若干字节。第一次睡眠2秒用于让daytime服务器发送应答并关闭它的连接所在端，第一次write导致发送一个数据分节到服务器，服务器则响应以RST（因为daytime服务器已关闭了它的套接字），第二个sleep函数让客户收到服务器的RST，于是第二个write函数引发SIGPIPE信号，由于信号处理函数返回主控制流，write函数于是返回EPIPE错误。以下是引发SIGPIPE信号的客户进程代码：

#include "unp.h"

void sig_pipe(int signo) {
    printf("SIGPIPE received\n");
    return;
}

int main(int argc, char **argv) {
    int sockfd; 
    struct sockaddr_in servaddr;
    
    if (argc != 2) {
        err_quit("usage: tsigpipe ");
    }

    sockfd = Socket(AF_INET, SOCK_STREAM, 0);

    bzero(&servaddr, sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_port = htons(13);    /* daytime server */
    Inet_pton(AF_INET, argv[1], &servaddr.sin_addr);

    Signal(SIGPIPE, sig_pipe);

    Connect(sockfd, (SA *)&servaddr, sizeof(servaddr));

    sleep(2);
    Write(sockfd, "hello", 5);
    sleep(2);
    Write(sockfd, "world", 5);

    exit(0);
}

运行它：

你可能感兴趣的:(UNIX网络编程卷一（第三版）,网络,tcp/ip,unix)

前端简单数据存储：跳过后端数据库的一种高效策略，应对一些不需要后端访问数据库的简单操作：静态 Markdown 文件存储【D＇accumulation】前端数据库学习 vscode html5 vue.js
问题提出：在一些应用场景中，有些数据并不重要，也不需要频繁地进行动态增删改查，比如品牌历史、产品介绍等说明性内容。为此，我选择在前端直接存储这些静态数据，跳过后端数据库调用。本文将分享如何利用Vue工程中直接存放Markdown文件与内嵌数据，将数据管理与业务逻辑解耦，从而实现快速开发、便于维护和灵活更新的目的。静态Markdown文件存储方法案例：原理：将Markdown文件（如brandHis
AMD异步模块介绍【D＇accumulation】前端学习
基本介绍AMD（AsynchronousModuleDefinition，异步模块定义）是一种用于JavaScript模块化编程的规范，它允许JavaScript代码以异步方式加载模块及其依赖。它最初是为了解决浏览器端JavaScript代码模块化的问题，最著名的实现是RequireJS。AMD出现背景JavaScript发展初期，所有代码都写在一个.js文件里，或者通过有哪些特点AMD主要用于浏
AI 生成 PPT 网站介绍与优缺点分析 KL_lililli 人工智能 powerpoint
随着人工智能技术不断发展，利用AI自动生成PPT已成为提高演示文稿制作效率的热门方式。本文将介绍几款主流的AIPPT工具，重点列出免费使用机会较多的网站，并对各平台的优缺点进行详细分析，帮助用户根据自身需求选择合适的工具。1.免费及免费试用机会较多的网站1.1Tome网址：Tome–TheAIassistantforsales简介：Tome是一款专注于AI助力讲故事与演示制作的工具，用户只需输入简
Java 数组终极详解可问可问春风 java基础 java 开发语言
以下是Java数组终极详解，覆盖底层原理、操作技巧、高频陷阱及性能优化方法，帮助您全面掌握数组的精髓：一、数组核心概念速查表特性描述存储类型相同数据类型元素的连续内存块长度固定数组长度在创建时确定，不可动态扩展索引访问从0开始索引，支持随机存取（时间复杂度O(1)）内存分配数组变量存储的是堆内存中数组对象的引用地址默认值初始化int[]默认0，boolean[]默认false，对象数组默认null
何同学采访苹果CEO库克上热搜，网友表示自愧不如程序员的店小二
昨日，22岁B站知名UP主“老师好我叫何同学”采访了苹果CEO蒂姆-库克，登上微博热搜榜，引起了网友们的热议。何同学是北京邮电大学学霸，22岁的大学生，出于兴趣的原因在B站注册账号发布数码产品的测评视频，他做的视频和别人不一样，称得上机圈顶流。因为在B站发了一个5G测评视频，让何同学彻底火了，仅有40个视频，在B站累计播放已超过1.7亿次，粉丝数达到了673万，何同学还作为嘉宾参加了央视一套的《开
【「暴富幻觉」与「圈层陷阱」的深层解构】调皮的芋头神经网络深度学习机器学习
「暴富幻觉」与「圈层陷阱」的深层解构：大祥哥事件背后的社会心理图谱一、认知错位：达克效应下的「圈层跃升」陷阱虚假能力曲线当普通人突然获得巨额财富时（如大祥哥B站年收入破千万），其社会地位感知曲线会陡峭上升，但实际认知能力仍处于原有水平。这种剪刀差导致**达克效应（D-Keffect）**显现——越是缺乏社会经验的人，越容易高估自身判断力。圈层符号的认知绑架骗子通过私人飞机合影（伪造）、米其林餐厅包
Fyrox 游戏引擎教程秋或依
Fyrox游戏引擎教程Fyrox3Dand2DgameenginewritteninRust项目地址:https://gitcode.com/gh_mirrors/fy/Fyrox项目介绍Fyrox是一个功能丰富的游戏引擎，使用Rust语言编写。它支持2D和3D游戏开发，并提供了一个场景编辑器，方便开发者进行游戏内容的创建和管理。Fyrox引擎的前身是rg3d，自2019年以来一直在积极开发中。项
LLM大模型提示工程Prompt Engineering Langchain prompt langchain 私有化大模型人工智能产品经理 ai大模型 LLM
在LLM中影响词汇的分布主要通过两种方式，一种是通过提示（Prompting），另外一种就是通过训练（Training）。提示是影响词汇分布最简单的方法，通过给LLM输入提示文本（有时会包含指令和示例）使得词汇的分布概率发生变化。以上一篇中提到的例子说明，最初的语句是“我写信给农场，希望他们送我一个宠物，他们送给我一只（）“词汇的分布如下：代码语言：javascript**复制牛0.1羊0.2狗0
JC-6511 直流控制单元：充电桩的 “智慧大脑” DZCY_ 科技
在新能源汽车蓬勃发展的今天，充电桩作为电动汽车的能量补给站，其性能和智能化程度至关重要。而今天要给大家介绍的JC-6511直流控制单元，堪称直流充电桩的“智慧大脑”，为充电桩的高效、稳定运行提供了强大的核心支持。这一创新产品由南京简充电气科技有限公司精心打造，凝聚了该公司在电气科技和新能源领域的深厚expertise和创新精神。一、主控板的强大基石南京简充电气科技有限公司研发的JC-6511直流控
Excel 小黑第19套荷包蛋大王iovo excel
对应大猫19鼠标右键标签修改颜色将文本文件导入工作表中：数据-现有链接-浏览更多选择员工档案（若预览是乱七八糟的文字，将文件格式改成简体中文）分隔符号看题目要求注意：将身份证号设置为文本格式将一列数据分成两列显示：插入一个新的列，-数据-分列文件类型选择固定宽度，再建立分列线，分列完成再修改一下标题适当调整表格的行高和列宽：从A列选到N列，双击（列宽）；Ctrl+A全选，开始-格式修改（行高）创建
用ACM模式模板刷hot100 boguboji java
面试手撕给的模板基础上写给的模板一般是下面这样把while内容删除（一般刷hot100题目输入不需要同时输入几组）第一个方法里写处理输入输出自己再写一个方法，就是力扣里的核心代码（加上static）第一个处理输入输出的方法里面调用第二块的方法importjava.util.*;publicclassMain{publicstaticvoidmain(String[]args){Scannerin=
深入浅出JVM性能优化：从理论到实践 rider189 java jvm
一、JVM架构与内存模型深度解析1.1JVM运行时数据区全景图方法区（元空间）：存储类信息、常量池等元数据堆内存：对象实例存储核心区域YoungGeneration（新生代）Eden区（对象诞生地）Survivor区（S0/S1，存活对象过渡区）OldGeneration（老年代）虚拟机栈：线程私有，存储栈帧本地方法栈：Native方法调用程序计数器：线程执行位置指示器1.2对象生命周期管理对象创
【开源宝藏】30天学会CSS - DAY6 第六课流光文字动画 hikktn 开源宝藏开源 css 前端
第0步：项目结构lighting-text/├─index.html└─style.cssindex.html：包含列表，其中每个放一个字母或符号。style.css：设置背景、文字样式，以及关键帧动画（lighting）让文字逐个闪光。第1步：编写HTML结构在index.html中，核心就是一个无序列表，每个对应一个字母/符号：CSSAnimationDESAFIO♡CSS代码要点每个都是一个
Centos7搭建Zabbix4.x监控HCL模拟网络设备：zabbix-server搭建及监控基础02 wusam zabbix HCL SNMP 网络监控
兰生幽谷，不为莫服而不芳；君子行义，不为莫知而止休。2.HCL网络设备的远程登录及snmp-agent配置华三网络设备的snmp-agent设置方法(1)配置Agent#配置Agent的IP地址为1.1.1.1/24，并确保Agent与NMS之间路由可达。（配置步骤略）#设置Agent使用的SNMP版本为v1/v2c、只读团体名为public，读写团体名为private。system-view[A
数据结构【红黑树模拟实现】北方留意尘 C++数据结构数据结构
目录红黑树：基于AVL树改进红黑树的性质红黑树基本结构insert基本结构新增节点的默认颜色为红色节点性质总结情况一:cur为红，p为红，g为黑，u存在且为红情况二:cur为红，p为红，g为黑，u不存在/u存在且为黑(单旋+变色)情况三:cur为红，p为红，g为黑，u不存在/u存在且为黑(双旋+变色)insert代码实现验证是否为红黑树源码链接红黑树：基于AVL树改进AVL树控制平衡因子，严格要求
设计模式：深度解析单例模式 WeiLai1112 设计模式单例模式设计模式面试 java 后端分布式中间件
深度解析单例模式：从理论到实践1.引言在软件开发中，设计模式是解决常见问题的经典解决方案。单例模式（SingletonPattern）作为创建型模式之一，广泛应用于需要全局唯一实例的场景。本文将深入探讨单例模式的定义、实现方式、优缺点以及应用场景，并结合实际项目经验，为大厂面试中的深度追问提供详细解决方案。2.单例模式的定义与结构2.1定义单例模式确保一个类只有一个实例，并提供一个全局访问点。它通
记一次MyBatis分页莫名其妙的失效，首次执行合适，后续执行分页失效且异常废材是怎么养成的 mybatis
代码几乎一样，为啥这个xml配置的就会出现莫名其妙的问题呢org.mybatis.spring.MyBatisSystemException:nestedexceptionisorg.apache.ibatis.type.TypeException:Couldnotsetparametersformapping:ParameterMapping{property='mybatis_plus_fir
Java Panama 项目：Java 与 AI 的融合 AI天才研究院计算 Java实战 DeepSeek R1 &大数据AI人工智能大模型人工智能 java python
JavaPanama项目：Java与AI的融合Java在AI领域的优势Java在AI领域的优势主要体现在以下几个方面：强大的生态系统：Java拥有丰富的库和框架，为AI开发提供了坚实的基础。跨平台性：Java的“一次编写，到处运行”特性，降低了AI应用的运维成本。高性能与稳定性：Java虚拟机（JVM）的优化和垃圾回收机制，确保了AI应用的高效运行和内存管理。实时数据处理能力：Java可以高效处理
leetcode:15.三数之和 uncle_ll 编程练习-Leetcode leetcode 三数之和双指针算法训练营数组
15.三数之和来源：力扣（LeetCode）链接:https://leetcode.cn/problems/3sum给你一个包含n个整数的数组nums，判断nums中是否存在三个元素a，b，c，使得a+b+c=0？请你找出所有和为0且不重复的三元组。注意：答案中不可以包含重复的三元组。示例1：输入：nums=[-1,0,1,2,-1,-4]输出：[[-1,-1,2],[-1,0,1]]示例2：输入
WebAssembly 与 JavaScript：高性能 Web 开发的未来 vvilkim JavaScript 现代WEB技术 wasm javascript 开发语言
在现代Web开发中，性能始终是一个关键问题。随着Web应用变得越来越复杂，开发者需要更高效的工具和技术来满足用户对速度和响应能力的需求。WebAssembly（简称Wasm）正是为此而生。它是一种低级的二进制指令格式，旨在为Web提供接近原生代码的执行性能。与此同时，它与JavaScript的关系也备受关注。本文将深入探讨WebAssembly是什么，以及它与JavaScript如何协同工作。什么
Windows操作系统部署Tomcat详细讲解 web15085415935 面试学习路线阿里巴巴 windows tomcat java
Tomcat是一个开源的JavaServlet容器，用于处理JavaWeb应用程序的请求和响应。以下是关于Tomcat的用法大全：一、安装Tomcat下载访问ApacheTomcat官方网站（https://tomcat.apache.org/），根据你的操作系统（如Windows、Linux、macOS）和需求选择合适的版本进行下载。例如，对于开发环境，通常选择较新的稳定版本。安装（以Windo
详细说明脚本评估和耗时较长的任务混血哲谈性能优化
在网页性能优化中，脚本评估和耗时较长的任务是两大关键性能瓶颈。它们直接影响页面的加载速度、交互响应以及用户体验。以下是对这两个概念的详细说明及优化策略：一、脚本评估（ScriptEvaluation）1.定义脚本评估指浏览器解析（Parsing）、编译（Compiling）和执行（Executing）JavaScript代码的全过程。这一过程通常包括：解析：将文本形式的JavaScript代码转换
Linux第零节：Linux命令速查图表（按功能分类）熊峰峰 5.Linux linux php
Linux命令速查图表（按功能分类）思维导图示意Linux命令文件操作权限管理系统管理网络操作文本处理压缩归档ls/cd/pwdmkdir/rm/cpcat/less/findchmodchownps/top/killshutdown/unamecurl/netstatnc/tcpdumpgrep/awk/sedtar/zip/unzip一、文件与目录操作命令功能描述常用选项示例ls列出目录内容-
Kubernetes Init 容器：实现 Nginx 和 PHP 对 MySQL 的依赖检查曹天骄 kubernetes nginx php
在设计KubernetesPod时，如果需要在启动Nginx和PHP之前等待MySQL启动完成，可以通过初始化容器（initC）来实现。初始化容器可以用于检查MySQL是否可用，只有在MySQL可用后，才会继续启动主容器（Nginx和PHP）。设计思路初始化容器（initC）:使用一个简单的脚本或工具（如mysql-client）来检查MySQL服务是否可用。如果MySQL可用，初始化容器成功退出
通过stm32最小系统板实现串口收发功能超561 stm32学习笔记 stm32 嵌入式硬件单片机
使用时请确保系统时钟配置正确本文使用到两个串口其配置方式一样USART1初始化函数Usart1_InitvoidUsart1_Init(unsignedintbaud){GPIO_InitTypeDefgpio_initstruct;USART_InitTypeDefusart_initstruct;NVIC_InitTypeDefnvic_initstruct;RCC_APB2PeriphClo
Latex 插入图片或表格导致页面空白过多 (??(#?)???(???/ 论文阅读
如图所示：Latex插入图片或表格导致页面空白过多我们可以采用这个方式来减少空白。\documentclass{article}\usepackage{graphicx}%包含图形支持\usepackage{caption}%提供更多对caption的控制%设置标题上方和下方的间距\setlength{\abovecaptionskip}{0.cm}%上方\setlength{\belowcapt
LeetCode第104题_二叉树的最大深度 @蓝莓果粒茶算法 leetcode 算法职场和发展 c++数据结构 python c#
LeetCode第104题：二叉树的最大深度题目描述给定一个二叉树，找出其最大深度。二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。说明:叶子节点是指没有子节点的节点。难度简单问题链接https://leetcode.cn/problems/maximum-depth-of-binary-tree/示例示例1：输入：root=[3,9,20,null,null,15,7]输出：3示例2：输
Tomcat升级步骤 qq_33928223 软件部署 tomcat java
以下是ApacheTomcat升级的一般步骤，具体操作可能因环境和需求有所不同，请根据实际情况进行调整：1.确定当前版本和目标版本确认当前版本:查看当前正在运行的Tomcat版本。$CATALINA_HOME/bin/version.sh选择目标版本:根据需求选择要升级到的目标版本（如从8.x到9.x或更高版本）。2.备份现有安装备份配置文件：server.xmlweb.xmlcontext.xm
ISO 14229 诊断服务测试要求概述小马测试之道 #车载测试全栈指南车载系统
ISO14229诊断服务测试要求概述大家好！我是小马，今天要和大家分享汽车电子领域另一个重要标准——ISO14229统一诊断服务(UDS)的测试要求。作为汽车诊断通信的基础，UDS协议对于车辆故障诊断、ECU刷新和维护至关重要。无论你是诊断工具开发者，还是ECU软件工程师，这篇文章都能帮你理清UDS测试的关键环节。让我们一起深入了解如何确保诊断服务的可靠性和一致性吧！1.标准简介ISO14229是
JavaScript（JS）单线程影响速度 ok060 javascript 开发语言 ecmascript
js单线程影响速度在JavaScript（JS）中，单线程的本质是其执行模型的核心特点，这意味着同一时间只能执行一个任务。这种设计使得JS在处理诸如DOM操作、用户交互等任务时更为直观和安全，因为它避免了复杂的多线程并发问题，如竞态条件（raceconditions）和死锁（deadlocks）。然而，单线程的特性也确实影响了其处理大量计算或I/O密集型任务时的性能。影响速度的原因阻塞性操作：在单
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

UNIX网络编程卷一 学习笔记 第五章 TCP客户/服务器程序示例

你可能感兴趣的:(UNIX网络编程卷一（第三版）,网络,tcp/ip,unix)

UNIX网络编程卷一学习笔记第五章 TCP客户/服务器程序示例