ce123

Linux的多任务编程-进程

进程的概念

进程是指一个具有独立功能的程序在某个数据集合上的一次动态执行过程,它是系统进行资源分配和调度的基本单元.一次任务的运行可以并发激活多个进程,这些进程相互合作来完成该任务的一个最终目标.

进程的特性:并发性,动态性,交互性,独立性,异步性.

进程的种类:交互式进程,批处理进程,实时进程.

进程和程序是有本质区别的:程序是静态的一段代码,是一些保存在非易失性存储器的指令的有序集合,没有任何执行的概念;而进程是一个动态的概念,它是程序执行的过程,包括了动态创建,调度和消亡的整个过程,它是程序执行和资源管理的最小单位.

进程状态:运行状态,可中断的阻塞状态,不可中断的阻塞状态,可终止的阻塞状态,暂停状态,跟踪状态,僵尸状态,僵尸撤销状态.

进程状态转换关系:

进程是构成Linux系统应用的一块基石,它代表了一个Linux系统上的绝大部分活动,不管你是系统程序员,应用程序员,还是系统管理员,弄明白Linux的进程管理将使你"一切尽在掌握".
一个正在运行的程序(或者叫进程),是由程序代码,数据,变量(占用着系统内存),打开的文件(文件描述符)和一个环境组成.通常,Linux系统会让进程共享代码和系统库,所以在任何时刻内存里都只有代码的一份拷贝.例如,不管有多少进程在调用printf()函数,内存里只需要有一份它的代码就够了.
每个进程都会分配到一个独一无二的数字编号,我们称之为"进程标识码"(Process identifier,PID),它这是一个正整数,取值范围从2到32768.当一个进程被启动的时候,它会分配到一个未使用的编号数字做为自己的PID.虽然该编号是唯一的,但是当一个进程终止后,其PID就可以再次使用了.根据系统具体实现的不同,大多数的系统则会将所有可有的PID轮过一圈后,再考虑使用之前释放出的PID.

Linux内核通过惟一的进程标识符PID来标识每个进程.PID存放在进程描述符的pid字段中.在Linux中获得当前进程的进程号(PID)和父进程号(PPID)的系统调用函数分别为getpid()和getppid().

进程的数据结构

表示进程的数据结构是struct task_struct.task_struct结构是进程实体的核心,Linux内核通过对该结构的相关操作来控制进程,task_struct结构是一个进程存在的唯一标志,也就是通常说的进程控制块(PCB,Process Control Block).
Linux将所有task_struct结构的指针存储在task数组中,数组的大小就是系统能容纳的进程数目,默认为512.

进程的内存结构

进程的创建

与其他的操作系统有所不同,为了实现创建进程的开销尽可能低,在Linux中"创建一个新的进程"与"在一个进程中运行一个给定的操作"是有所区别的.不过这样的区别在概念上并不十分重要,而是通过这样的观点设计出的Linux内核具有了很好的多进程性能,这样的设计思想是值得我们去学习的.一个现有的进程可以调用fork()函数创建一个新的进程.

fork()函数用于从已存在的进程中创建一个新进程.新进程称为子进程,而原进程称为父进程.使用fork()函数得到的子进程是父进程的一个复制品,它从父进程处继承了整个进程的地址空间,包括进程上下文、代码段、进程堆栈、内存信息、打开的文件描述符、信号控制设定、进程优先级、进程组号、当前工作目录、根目录、资源限制和控制终端等,而子进程所独有的只有它的进程号、资源使用和计时器等.fork函数的原型和返回值如下:

注:unistd.h 是 C 和 C++ 程序设计语言中提供对 POSIX 操作系统 API 的访问功能的头文件的名称.该头文件由 POSIX.1 标准(单一UNIX规范的基础)提出,故所有遵循该标准的操作系统和编译器均应提供该头文件(如 Unix 的所有官方版本,包括 Mac OS X,Linux 等).对于类 Unix 系统,unistd.h 中所定义的接口通常都是大量针对系统调用的封装,如 fork,pipe 以及各种 I/O 原语(read,write,close 等等).

fork()函数的使用很简单,下面通过一个简单的例子来进一步学习.

int main()
{
    pid_t pid;
    char *message;
    int n = 6;/* 全局变量 */

    printf("fork program starting\n");
    pid = fork();
    switch(pid) 
    {
    case -1:
        perror("fork failed");
        exit(1);
    case 0:
        message = "This is the child";
        n ++;
        break;
    default:
        message = "This is the parent";
        n --;
        break;
    }
    printf("%s: pid = %d, n=%d\n",message,getpid(),n); 

    exit(0);
}

一般来说,在fork()之后是父进程还是子进程先执行是不确定的.这取决于内核所使用的调度算法.如果要求父子进程之间同步,则要使用某种形式的进程间同步进步.在这个例子中,可以看到父进程优先于子进程执行,但不能保证在所有的环境中都是这样的顺序.

子进程创建后就具有了自己的地址空间,因此在子进程中对变量的做的操作(n++),没有对父进程造成影响,这两个变量具有同样的名字,但在内存中位置是不同的,从输出的结果可以看到,父进程的n值最后为5,而子进程的n最后为7.

文件描述符共享

调用fork()的时候,子进程从父进程继承的属性都被设置为这些属性在父进程中的相同值.但是,之后两个进程按照各自的方式运行,多数情况下相互独立.例如,如果子进程改变了目录,则父进程的目录不受影响.

但是,已经打开的文件则是该规则的一个例外.已打开的文件描述符是共享的,一个进程对一个共享文件描述符的动作也会影响到该文件对于其他进程的状态.考虑下面的情况:一个进程通过fork()创建了一个子进程,父子进程都想标准输出写操作,如果父进程的标准输出已经重定向,那么子进程写到标准输出时,它将更新与父进程共享该文件的偏移量.请看下面的例子:

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>

int main()
{
    pid_t pid;
    char *message ;
    int n = 6;/* 全局变量 */
    /* 输出重定向 */
    message = “Message From STDOUT\n”;
    if (write(STDOUT_FILENO, message ,sizeof(message)-1) != sizeof(message)-1)
        perror(“write error”)

    printf("fork program starting\n");
    pid = fork();
    switch(pid) 
    {
    case -1:
        perror("fork failed");
        exit(1);
    case 0:
        message = "This is the child";
        n ++;
        break;
    default:
        message = "This is the parent";
        n --;
        sleep(2);
        break;
    }
    printf("%s: pid = %d, n=%d\n",message,getpid(),n); 

    exit(0);
}

而如果重定向该程序的输出:

在这个例子中,当父进程等待子进程时,子进程写到标准输出;而在子进程终止后,父进程也写到标准输出上,并且知道其输出会添加在进程所写数据之后.所以将标准输出重定向到一个文件后,等到了两条"fork program starting"信息.如果父子进程不共享同一个文件偏移量,这种形式的交互就很难实现.特别是当多个文件描述符指向同一个打开的文件,只有当所有的这些文件描述符都关闭后,该文件才会关闭. 有两种常见的模式处理文件描述符共享:

如果父进程只需等待子进程完成,自己不做任何文件操作,那么父进程无需对其描述符做任何处理.当子进程终止后,它曾进行读,写操作的任意共享描述的文件偏移量已执行了相应的更新;
如果父,子进程各自执行不同的任务,在fork()之后,关闭它父,子进程各自们不使用的文件描述符,这样就不会干扰对方使用的文件描述符.这种方法在网络服务程序中经常使用.我们后面在讲解网络编程时会进行重点分析.

vfork函数

vfork()函数的调用和返回值与fork()相同,但两者的实现不同.

它与fork的不同之处在于它并不将父进程的地址空间完全复制到子进程中,vfork出来的子进程是在父进程的空间中运行的,如果这是子进程修改了某个变量,这会影响到父进程.
vfork存在的目的就是为了在创建子进程后调用exec去执行一个新的程序,由于没有了复制动作,创建和执行新程序的销量得到了优化和提高.
vfork和fork的另一个区别是:vfork保证子进程有限运行,在它调用exec或者exit后父进程才可能调度运行.而fork的父子进程运行顺序是不定的.

对于某些没有虚拟存储器的操作系统,如uClinux,它与Linux的区别在于前者没有fork()调用,只有vfork().因此在这类操作系统上创建新进程时需要特别的注意下列事项:

调用vfork()后,父进程被挂起直到子进程调用exec(),或者子进程退出才能继续；
进程在vfork()返回后直接运行在父进程的栈空间,并使用父进程的内存和数据.

exec()函数族

fork()函数是用于创建一个子进程,该子进程几乎拷贝了父进程的全部内容,但是,这个新创建的进程如何执行呢？这个exec函数族就提供了一个在进程中启动另一个程序执行的方法.因此,当用fork()函数创建子进程后,子进程往往要调用一个exec()函数以执行另一个程序.exec()函数实际上是一个函数族,共有6个不同的exec()函数可供使用,它们是:

#include <unistd.h>
int execl (const char *pathname, const char *arg0, …);
int execv (const char *pathname, char *const argv[]);
int execle (const char *pathname, const char *arg0, …, char *const envp[]);
int execve (const char *pathname, char *const argv[], char *const envp[]);
int execlp (const char *filename, const char *argv0,…);
int execvp (const char *filename, char *const argv[]);

该函数出错时返回-1.

下面通过一个例子来说明exec()函数的用法:

#include <unistd.h>
#include <stdio.h>

int main()
{
    printf("Start exec() \n");
    execlp("ps", "ps", "-ax", 0);
    printf("Done.\n");
    exit(0);
}

exec函数族使用区别:
查找方式

前四个函数的查找方式都是完整的文件目录路径,而最后两个函数(以p结尾的函数)可以只给出文件名,系统就会自动从环境变量“$PATH”所指出的路径中进行查找.

参数传递方式

两种方式:逐个列举,将所有参数整体构造指针数组传递
以函数名的第五位字母来区分的,字母为"l"(list)的表示逐个列举的方式.其语法为char *arg;字母为"v"(vertor)的表示将所有参数整体构造指针数组传递,其语法为*const argv[].

环境变量

exec函数族可以默认系统的环境变量,也可以传入指定的环境变量.这里,以"e"(Enviromen)结尾的两个函数execle、execve就可以在envp[]中指定当前进程所使用的环境变量.

exec函数执行失败,常见原因:

找不到文件或路径,此时errno被设置为ENOENT;
数组argv和envp忘记用NULL结束,此时errno被设置为EFAULT;
没有对应可执行文件的运行权限,此时errno被设置为EACCES.

在很多linux系统中,6个函数中只有execve是内核的系统调用,另外5个只是库函数,它们最终都要调用该系统调用,这6个函数的关系如下图所示:

在这种结构中,execlp和execvp函数使用系统PATH环境变量.函数execve函数的功能最丰富,但需要的参数也最多,所以应该根据实际需要选择合适的函数.下面我们通过一个而简单的例子来说明exec函数的用法.

#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>

int main()
{
    printf("Start exec() \n");
    execlp("ps", "-ax", (char *)0);
    printf("Done.\n");
    exit(0);
}

函数的运行结果如下:

注意:

如果将execlp("ps", "-ax", (char *)0);写成execlp("ps", "-ax", 0);,在编译的时候会出现"函数调用中缺少哨兵 [-Wformat]"的警告!
"Done."的输出始终没有出现,是因为ps完全替换了调用它的进程,所有原进程执行到execlp函数后就不可能再继续执行原来的指令了.

下面我们再来看一个复杂的例子,这个例子由两个例程组成.

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>

int main()
{
    pid_t pid;
    const char *usr_envp[ ] = {"MYDEFINE=unknown","PATH=/tmp", (char *)0};

    printf ("Begin fork()\n");
    pid = fork();
    switch(pid) 
    {
    case -1:
        perror("fork failed");
        exit(1);
    case 0:
        if (execle("/tmp/child","myarg1","my arg2", (char *)0, usr_envp)<0)
              perror("execle failed");
        break;
    default:
        break;
    }

    if (waitpid (pid, NULL, 0) < 0)
        perror("waitpid failed");
    printf ("parent exiting\n");
    exit(0);
}

在该程序中的父进程中首先创建了一个新进程,然后在子进程中调用execle函数,并将命令行参数和环境变量字符都传给了新进程.子进程的功能就是打印出所有的命令行参数和所有的环境变量字符串.子进程的代码如下:

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>

int main ( int argc , char *argv[ ] ,char *envp[])
{
    int i;
    char **ptr;
   
    printf ("child starting\n");
    
    for ( i = 0; i < argc; i++)
       printf ("argv[%d] : %s\n",i, argv[i]);
    
    for ( ptr = envp; *ptr != 0 ; ptr++)
       printf ("%s\n",*ptr);
    printf ("child exiting\n");
    exit(0);
}

下图是该程序的运行结果:

进程的终止

一个C语言的程序总是从main()函数开始执行的,main()函数的原型为:

int main (int argc, char *argv[ ])

其中,argc是命令行参数的数目,argv是指向参数的各个指针所构成的数组.当内核执行C程序时,即使用exec()函数执行一个程序,内核首先开启一个特殊的启动例程,该例程从内核取得命令行参数和环境变量值,然后调用main()函数.
而一个进程终止则存在正常终止和异常终止两种情况。

1. 正常终止的三种方式

一个进程正常终止有三种方式:

由main()函数返回;

调用exit()函数;

调用_exit()或_Exit()函数.

由main函数返回的程序,一般会在函数的结尾处通过return语句指明函数的返回值,如果不指定这个返回值,main函数通常会返回0.但这种特性与编译器有关,因此为了程序的的通用性,应该主动养成使用return语句的习惯.

下面是一个使用exit函数的例子.
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>

int main()
{
    pid_t pid;
   
    char 	*message ;
    int  exit_code ;

    printf ("Begin fork()\n");

    pid = fork();
    switch(pid) 
    {
    case -1:
        perror("fork failed");
        exit(1);
    case 0:
        message = "This is the child";
        exit_code = 37; 
       break;
    default:
        message = "This is the parent";
       exit_code = 0; 
        break;
    }
    printf("%s: pid = %d\n",message,getpid()); 
    
    if(pid) {
        int stat_val;
        pid_t child_pid;
        child_pid = wait(&stat_val);

        printf("Child has finished: PID = %d\n", child_pid);
        if(WIFEXITED(stat_val))
            printf("Child exited with code %d\n", WEXITSTATUS(stat_val));
        else
            printf("Child terminated abnormally\n");
    }
    exit (exit_code);
}
可以看出,在主进程中得到了子进程的退出状态值37.获得该值的方法将在后面详细讲解.

2. 异常终止的两种方式

当进程接收到某些信号时;或是调用abort()函数,它产生SIGABRT信号.这是前一种的特例.

这便是进程异常终止的两种方式。一个进程正常退出后传递了一个退出状态给系统,如return语句和exit()等函数.退出值是一个8位值,通常为一个int型的值.通常退出状态0表示正常退出,任何非0的退出状态表示出现了某种错误.

exit()和_exit()
exit()和_exit()函数都是用来终止进程的.当程序执行到exit()或_exit()时,进程会无条件地停止剩下的所有操作,清除包括各种数据结构,并终止本进程的运行.

exit()和_exit()的区别

_exit()函数的作用是直接使进程停止运行,清除其使用的内存空间,并销毁其在内核中的各种数据结构；
exit()函数则在这些基础上作了一些包装,在执行退出之前加了若干道工序.
exit()函数与_exit()函数最大的区别就在于exit()函数在终止当前进程之前要检查该进程打开过哪些文件,把文件缓冲区中的内容写回文件，就是上图中的"清理I/O缓冲"一项.

一个进程正常退出后传递了一个退出状态给系统,如return语句和exit函数.退出值是一个8位值,通常为一个int型的值.通常退出状态0表示正常退出,任何非0的退出状态表示出了某种错误.

进程的退出状态

前面我们已经多次用到了wait()和waitpid(),这两个函数的原型是:

wait()函数是用于使父进程(也就是调用wait()的进程)阻塞,直到一个子进程结束或者该进程接到了一个指定的信号为止.如果该父进程没有子进程或者他的子进程已经结束,则wait()就会立即返回。
waitpid()的作用和wait()一样,但它并不一定要等待第一个终止的子进程,它还有若干选项,如可提供一个非阻塞版本的wait()功能,也能支持作业控制

下面有几个宏可判别结束情况:
WIFEXITED(status)如果子进程正常结束则为非0 值.
WEXITSTATUS(status)取得子进程exit()返回的结束代码,一般会先用WIFEXITED来判断是否正常结束才能使用此宏.

WIFSIGNALED(status)如果子进程是因为信号而结束则此宏值为真.
WTERMSIG(status) 取得子进程因信号而中止的信号代码,一般会先用WIFSIGNALED来判断后才使用此宏.

WIFSTOPPED(status) 如果子进程处于暂停执行情况则此宏值为真.一般只有使用WUNTRACED时才会有此情况.
WSTOPSIG(status) 取得引发子进程暂停的信号代码,一般会先用WIFSTOPPED来判断后才使用此宏.

waitpid函数可以提供wait函数所没有的三个特性:

waitpid可等待一个特定的进程,而wait函数则返回任意终止子进程的状态;
waitpid函数提供了一个wait的非阻塞版本(使用WNOHANG选项);
waitpid支持作业控制(利用WUNTRACED和WCONTINUED选项).

下面是一个例子.

#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>
#include <stdlib.h>

int main(int argc, char *argv[])
{
    pid_t pid, w;
    int status;  
    char 	*message ;
    printf ("Begin fork()\n");

    pid = fork();
    switch(pid) 
    {
    case -1:
        perror("fork failed");
        exit(EXIT_FAILURE);
    case 0:
        message = "This is the child";
        printf("%s: pid = %d\n",message,getpid());
        
	if (argc == 1)
            pause();                    
        _exit(atoi(argv[1]));
       break;
    default:
        message = "This is the parent";
        break;
    }
    printf("%s: pid = %d\n",message,getpid()); 

    do {
            w = waitpid(pid, &status, WUNTRACED | WCONTINUED);
            if (w == -1) 
            { 
                perror("waitpid"); 
                exit(EXIT_FAILURE); 
            }
            
	    if (WIFEXITED(status)) {
                printf("exited, status=%d\n", WEXITSTATUS(status));
            } 
            
	    else if (WIFSIGNALED(status)) {
                printf("killed by signal %d\n", WTERMSIG(status));
            } 
            
            else if (WIFSTOPPED(status)) {
                printf("stopped by signal %d\n", WSTOPSIG(status));
            } 
            
           else if (WIFCONTINUED(status)) {
                printf("continued\n");
            }
        } while (!WIFEXITED(status) && !WIFSIGNALED(status));
        exit(EXIT_SUCCESS);
}

我们首先看看带参数运行的结果:

子进程创建后就立即退出了,并返回参数值15,接下来看看不带参数执行的结果,为了方便向进程发送信号,将进程运行在后台.

Zombie进程

创建子进程是十分容易的,但你必须密切注意子进程的执行情况.当一个子进程结束运行的时候,它与其父进程之间的关联还会保持到父进程也正常地结束运行或者父进程调用了wait()才告终止.因此,进程表中代表子进程的数据项是不会立刻释放的,虽然不再活跃了,可子进程还停留在系统里,因为它的退出码还需要保存起来以备父进程中后续的wait()调用使用.它将成为一个Zombie 进程("僵尸进程").

软件测试分类 @旺仔牛奶功能测试
目录一、按测试技术划分1、白盒测试2、黑盒测试3、灰盒测试二、按测试阶段划分1、单元测试2、集成测试3、系统测试4、验收测试（正式验收测试、Apha测试、Beta测试）三、按被测试对象是否运行划分1、动态测试2、静态测试四、按不同的测试手段划分1、手工测试2、自动化测试五、按软件质量特性内容划分1、功能测试（界面测试）2、可靠性测试3、易用性测试4、性能测试（负载测试、压力测试、并发测试、稳定性测
导师要求一天完成综述，我7分钟搞定——打造一个全本地DeepResearch助手小洛~·~ 人工智能深度学习 chatgpt gpt AI写作
1.项目背景LocalDeepResearcher是一个本地化运行的AI研究助手，旨在通过结合大语言模型（LLM）和搜索工具，实现自动化深度研究并生成结构化报告。该项目由LangChainAI开发，支持本地模型（例如通过Ollama运行的deepseek-r1:7b）和云端模型（例如Claude、GPT），并集成了多种搜索引擎（如Tavily、DuckDuckGo）。其本地优先的设计确保了数据隐私
【锂电池SOC估计】 Matlab基于BP神经网络的锂电池SOC估计天天Matlab代码科研顾问 matlab 神经网络开发语言
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍摘要:电池荷电状态(StateofCharge,SOC)的精确估计对于电动汽车、储能系统等应用至关重要。传统的SOC估计方法存在精度受限、算法复杂等问题。本文提出了一种基于反向传播(BackPropagation,BP)神经网络的锂电池SO
【LangGraph 】“工作流”的核心就是围绕一个共享的 `State` 等风来不如迎风去 AI入门与实战 langgraph
是的。LangGraph里“工作流”的核心就是围绕一个共享的State（也常被命名为AgentState或者类似的TypedDict/Pydantic模型）来组织的：State本质上是整个流程的“快照”，所有跨节点需要保留或传递的数据，都必须定义在这个结构里。LangGraph在执行节点（node）时，会把当前的State传入该节点，节点内部可以读写它，然后再返回一个新的（或被修改过的）State
Unity引擎开发：VR渲染技术_（19）.VR项目实例开发 chenlz2007 虚拟现实游戏2 unity vr lucene 游戏引擎 json 全文检索
VR项目实例开发在本节中，我们将通过一个具体的虚拟现实项目实例，详细介绍如何在Unity引擎中实现VR渲染技术。我们将从项目的基本设置开始，逐步讲解如何创建VR场景、配置相机、添加交互元素、优化性能等方面的内容。通过本节的学习，您将能够掌握在Unity中开发VR项目的基本流程和技术要点。1.项目基本设置1.1创建新的VR项目首先，打开UnityHub并创建一个新的项目。选择“3D”模板，然后在项目
结构力学优化算法：多目标优化：遗传算法与结构优化_2024-08-08_19-41-25.Tex chenjj4003 材料力学2 算法 javascript 前端人工智能线性代数
结构力学优化算法：多目标优化：遗传算法与结构优化绪论结构优化的重要性在工程设计中，结构优化扮演着至关重要的角色。它旨在通过最小化成本、重量或应力等目标，同时确保结构的强度、刚度和稳定性满足设计要求，来提高结构的性能和效率。结构优化可以帮助工程师在设计初期就避免潜在的结构问题，减少材料浪费，降低生产成本，同时提升产品的竞争力。多目标优化的概念多目标优化是指在优化过程中同时考虑多个目标函数的优化问题。
七天学完十大机器学习经典算法-05.从投票到分类：K近邻(KNN)算法完全指南
接上一篇《七天学完十大机器学习经典算法-04.随机森林：群众智慧的机器学习实践》想象一下，你搬进了一个新小区。想知道这个小区整体氛围如何？最直接的方法就是看看你最近的几家邻居是什么样的人——如果邻居们都很安静、整洁，小区大概率不错；如果邻居们深夜喧哗、环境杂乱，你可能就得重新考虑了。K近邻（K-NearestNeighbors,KNN）算法的核心思想，就如同这个观察邻居的过程。它是机器学习中最直观
分类预测 | MATLAB实现BP神经网络多特征分类预测 matlab科研社分类 matlab 神经网络
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍近年来，随着大数据时代的到来以及计算能力的显著提升，人工智能技术得到了飞速发展。在众多人工智能算法中，反向传播神经网络（BackPropagationNeuralNetwork,BP神经网络）凭借其强大的非
RabbitMQ中，basicAck、basicNack和basicReject是三种核心的消息确认机制 CATTLECODE rabbitmq 分布式
channel.basicNack(message.getMessageProperties().getDeliveryTag(),false,true); channel.basicReject(message.getMessageProperties().getDeliveryTag(),false);channel.basicAck(message.getMessageProperties(
AI测试方法二狗子82 ai 功能测试测试用例 AIGC
1.创建高质量的测试数据集为了验证标签的准确性，需要构建一个丰富的测试数据集。该数据集应包括多种场景和风格的输入文本：正常对话、非正式对话、含有拼写错误或语法问题的文本等。包括模棱两可或复杂情境的文本，看看模型是否能正确分类。确保数据集中有足够的标签种类分布，这样可以测试模型是否能应对不同类别的文本内容。2.多轮对话的上下文跟踪对于涉及多轮对话或长文本的情况，模型需要正确理解整个对话的上下文。例如
敏感数据流动治理：API 调用中的动态脱敏技术实践 KKKlucifer rxjava android
在数字化转型加速推进的当下，API已成为企业数据流通的"神经网络"，但伴随而来的敏感数据泄露风险正呈指数级增长。Gartner报告显示，2023年全球企业数据泄露事件中，39%源于API接口滥用，而传统静态脱敏技术在复杂业务场景下的防护效能已下降42%。动态脱敏技术作为应对API数据流动安全的核心方案，通过实时识别、智能处理、动态响应的全流程防护，正成为企业构建数据安全流动体系的关键技术支撑。保旺
非结构化文档的自动化敏感标识方法技术解析 KKKlucifer 自动化运维
在数字化时代，企业与组织面临的数据形态正发生深刻变革。据统计，非结构化数据占企业数据总量的80%以上，涵盖文本、邮件、PDF、日志、社交媒体内容等多种形式。这些数据中往往蕴含着大量敏感信息，如个人身份信息、商业机密、医疗记录等，一旦泄露将造成严重的安全风险。然而，非结构化文档缺乏统一的数据模型和格式规范，传统基于结构化数据的敏感信息识别方法难以直接应用，面临着三大核心挑战：语义理解复杂性：自然语言
电子文档全生命周期审计：构建企业数据安全的 “时间指纹“ 体系
在数字化转型深入推进的今天，电子文档作为企业知识资产与商业机密的主要载体，其全生命周期的安全管理已成为数据安全体系的核心环节。据IBM《2023数据泄露报告》显示，43%的数据泄露事件源于内部操作疏忽，而缺乏完整的文档审计轨迹导致62%的企业无法追溯泄露源头。电子文档全生命周期审计策略，通过对文档创建、流转、使用、归档到销毁的全流程行为记录与分析，构建起可追溯、可验证、可预警的安全防护网，正成为企
frp内网穿透及sshuttle 段帅龙呀 Linux linux
frpssh配合sshuttle可以真实模拟，直接访问内网vmwareip地址FRP内网穿透一、所需环境：服务端：1台有公网ip并且安装有docker的服务器、域名客户端：有1台或者多台安装docker的服务器如果有域名需要添加对应的解析有防火墙或者安全组需要开放对应端口，frps监听7000，frpsdashboard监听7500，client本次示例是6000，根据实际情况修改本篇笔记均使用u
docker安装nginx并配置ssl证书，代理宿主机服务 Blueeyedboy521 开发工具 nginx ssl docker
目录1、拉取镜像2、创建映射目录3、先启动一个nginx容器用于cp对应的文件夹类型，用于后期挂载使用4、映射容器文件5、停止当前nginx容器，并删除7、拷贝ssl证书8、配置nginx.conf9、运行10、进入容器11、查看日志12、代理宿主机服务查看宿主机在docker中的ip配置docker上安装的nginx1、拉取镜像dockerpullnginx2、创建映射目录#首先，创建目录ngi
Redis 持久化之 AOF 策略
1.什么是AOFAOF是appendonlyfile，AOF文件中记录了每次的操作指令，在启动Redis时，会将AOF文件中的数据读取出来以恢复数据。2.开启AOFRedis默认关闭AOF，可以通过将Redis配置文件中的appendonly设置为yes，这样就开启了AOF，此时RDB就会关闭，只能使用AOF和RDB中的一个。3.AOF的工作流程用户执行指令后，会将该指令写入到AOF缓冲区（aof
信息抽取数据集全景分析：分类体系、技术演进与挑战_DEEPSEEK 致Great 分类数据挖掘人工智能
信息抽取数据集全景分析：分类体系、技术演进与挑战摘要信息抽取（IE）作为自然语言处理的核心任务，是构建知识图谱、支持智能问答等应用的基础。近年来，随着深度学习技术的发展和大规模预训练模型的兴起，IE数据集呈现爆发式增长，其分析与评估对模型研发和领域迁移至关重要。本文基于对158个主流IE数据集的系统性梳理，首次提出“信息提取与命名实体识别数据集分类体系”。该体系涵盖8大类别（命名实体识别、关系提取
【docker】如何正确拉取langgraph-api 等风来不如迎风去 AI入门与实战 docker 容器运维
加这些配置都没用#设置代理环境变量exportHTTP_PROXY=http://127.0.0.1:7890exportHTTPS_PROXY=http://127.0.0.1:7890#设置更长的超时时间exportDOCKER_CLIENT_TIMEOUT=
自然语言处理之文本生成：Recurrent Neural Networks (RNN)：序列模型与语言模型 zhubeibei168 自然语言处理自然语言处理 rnn 语言模型人工智能机器翻译生成对抗网络
自然语言处理之文本生成：RecurrentNeuralNetworks(RNN)：序列模型与语言模型自然语言处理简介NLP的基本概念自然语言处理（NaturalLanguageProcessing，简称NLP）是人工智能领域的一个重要分支&#
spring boot 注解@Component yu15050186065 spring boot annotation spirng spring ioc
@Component。Spring提供进一步典型的注解：@Component，@Service，和@Controller。@Component是任何Spring托管组件的通用注解。而@Repository，@Service和@Controller是@Component针对更特定用例的专业化（分别在持久性，服务和表示层）。因此可以用他们来注解你的组件类与@Component具有同样作用，通过与注解它
【WinSCP 安装与使用】岁月玲珑 linux windows linux windows
WinSCP是一款完全免费且开源的Windows图形化文件传输工具，基于SSH协议实现安全的SFTP和SCP文件传输，特别适合在Windows与Linux服务器间进行文件管理。以下从安装到使用的完整指南：✅一、WinSCP的核心特性（免费开源验证）开源协议采用GPL许可证，源码托管于GitHub。零费用无广告、无功能限制，所有版本均可免费使用。安全传输支持SFTP（SSH-2）、SCP协议，全程加
鸿蒙OpenHarmony【slot插槽】自定义组件我爱一条柴ya 鸿蒙开发日记 harmonyos 鸿蒙鸿蒙系统开发语言
默认插槽自定义组件中通过slot标签来承载父组件中定义的内容，使用slot标签可以更加灵活的控制自定义组件的内容元素，使用方式如下：下面使用父组件定义的内容引用该自定义组件方式如下：父组件中定义的内容具名插槽当自定义组件中需要使用多个插槽时，可通过对插槽命名的方式进行区分，当填充插槽内容时，通过声明插槽名称，将内容加到对应的插槽中。下面使用父组件定义的内容引用该自定义组件方式如下：插入第二个插槽中
C# Lambda表达式：从匿名方法到优雅简洁的代码革命钢铁男儿 C#图解教程 c#开发语言
本文将系统解析Lambda表达式的演变历程、核心语法和实战应用，帮助开发者彻底掌握这一革命性特性：一、演进背景：为什么需要Lambda表达式？C#2.0匿名方法的痛点MyDeldel=delegate(intx){returnx+1;};//原始匿名方法冗余的delegate关键字必须显式声明参数类型语法臃肿（平均比Lambda多70%字符）C#3.0的解决方案Lambda表达式通过类型推断和语法
Python 可迭代的对象、迭代器和生成器(标准库中的生成器函数) 钢铁男儿流程Python python java 前端
标准库中的生成器函数标准库提供了很多生成器，有用于逐行迭代纯文本文件的对象，还有出色的os.walk函数（https://docs.python.org/3/library/os.html#os.walk）。这个函数在遍历目录树的过程中产出文件名，因此递归搜索文件系统像for循环那样简单。os.walk生成器函数的作用令人赞叹，不过本节专注于通用的函数：参数为任意的可迭代对象，返回值是生成器，用于
Android Gantt View 安卓实现项目甘特图 netkiller-BG7NYT Android 手札 android 甘特图
需要做一个项目管理工具，其中使用到了甘特图。发现全网甘特图解决方案比较少，于是自动动手丰衣足食。前面我用Python和Node.js前端都做过，这次仅仅是移植到Android上面。其实甘特图非常简单，开发也不难，如果我专职去做，能做出一个非常棒产品。我写这个只是消遣，玩玩，闲的蛋痛，所以不怎么上心，就搞成下面这德行吧。仅仅供大家学习，参考。那天心情好了，完善一下。屏幕布局文件
腾讯云文件上传流程从未、淡定前端领域腾讯云 http https
文件上传流程actoruseras"用户"participantClientas"浏览器"participantServeras"服务端"participantCOSas"腾讯云"autonumberCOSClient:点击上传按钮user->Client:选择上传文件Client->Server:向服务端发起请求需要上传的文件名Server->COS:结合密钥，向COS请求生成__临时密钥__S
Authorization Basic认证笔记从未、淡定 javascript 前端
Basic认证Basic认证过程简单介绍浏览器请求一个需要认证的网页。服务器向浏览器返回“401Unauthorized（未认证）”状态码。浏览器收到此状态码后，询问用户名和密码。浏览器发送附带认证信息（Authorization头信息）的请求。本次请求得到了文档（用户名密码均正确的情况下）。方案1：header添加Authorization原理说明：stringcode=‘fozzie:fozz
MongoDB06 - MongoDB 地理空间是小崔啊 #mongoDB mongodb 网络数据库
MongoDB06-MongoDB地理空间文章目录MongoDB06-MongoDB地理空间一：地理空间数据基础1：地理数据表示方式1.1：GeoJSON格式1.2：传统坐标对2：地理空间索引2.1：2dsphere索引2.2：2d索引2.3：混合索引二：地理空间查询和聚合1：完全包含于几何图形2：与指定几何图形相交3：找附近点并按距离排序4：地理空间的聚合操作5：地理空间计算函数三：实际应用示例
[dhtmlx]group task 失效问题解决 oscar999 130-Web语言
1.问题描述使用了Gantt的Group功能，但是在进行系统调优，开启smart_rendering的设置后却出现如下状况：“Groupby时，总有部分task未group”问题细部描述与解决如下：2.Group功能与效果dhtmlxgantt提供了对task根据属性进行分组的功能。效果类似:实现方式的话，首先导入dhtmlxgantt_grouping.js；接下来在代码中处理如下：
pgsql14自动创建表分区健康马m pgsql 数据库
最近有pgsql的分区表功能需求，没想到都2025年了，pgsql和mysql还是没有自身支持自动创建分区表的功能现在pgsql数据库层面还是只能用老三样的办法来处理这个问题，每个方法各有优劣1.触发器这是最传统的方法，通过创建一个触发器来检查数据并创建新分区缺点是每次插入数据都会执行触发器，当数据量大时可能影响性能，现在基本很少用这个方案在生产环境上操作2.pg_partmanPostgreSQ
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb