Man9Oo

详述进程控制【Linux】

文章目录

1. 创建进程
- 1.1 认识fork
- - fork函数的返回值
- 1.2 写时拷贝
- - - 意义
- 1.3 fork的常规用法
- 1.4 fork调用失败的原因
2. 进程终止
- 2.1 进程退出的情况
- 2.2 进程退出的方法
- - return语句退出
  - exit函数退出
  - _exit函数退出
  - 三者的区别
  - 三者的联系
3. 进程等待
- 3.1 原因
- 3.2 子进程status参数
- 3.3 进程等待的方法
- - wait函数
  - waitpid函数
  - wait和waitpid的区别
  - 阻塞等待和非阻塞等待
  - 阻塞调用和非阻塞调用
4. 进程程序替换
- 4.1 替换原理
- 4.2 exec函数族
- 4.3 exec函数用例
- - execl
  - execv
  - execlp
  - execle
  - - 补充
  - execve
  - 小结
5. 自制简易shell
- 5.1 shell运行原理
- 5.2 模拟实现
- - 打印提示信息
  - 获取键入的信息
  - 解析命令
  - 创建子进程
  - 替换子进程（子进程）
  - 等待子进程退出（父进程）
- 5.3 测试及补充
- 5.4 小结

1. 创建进程

1.1 认识fork

在进程概念中已经说明fork函数的用法：在已有的进程中使用fork函数，会创建一个子进程，而父进程就是原进程。

fork函数的位置就是一个分界点，fork之前的代码由父进程执行，之后的代码分别由父子进程执行。

实际上，这里的父子进程共享所有代码，只是fork函数在语法上限制了子进程执行的语句范围，原因是OS会将fork的位置传给子进程，让子进程从这个位置开始执行。

进程调用fork函数，当控制转移到内核中的fork代码后，内核会做以下事情：

分配新的内存块和内核数据结构给子进程；

将父进程部分数据结构内容拷贝至子进程；

添加子进程到系统进程列表当中；

fork返回，开始调度器调度。

#include 
#include 
#include 
#include                                                                                          
int main()
{
  printf("fork before:PID:%d\n", getpid());
  pid_t id = fork();
  if(id == -1)//错误
  {
    printf("error\n");
  }
  printf("fork after:PID:%d, PPID:%d\n", getpid(), getppid());
  return 0;
}

运行以上代码，查看PID和PPID：

可以看到，fork之前的代码只执行了一次，fork之后的代码执行了两次。说明fork之后的代码父子进程都会执行。

fork函数的返回值

给子进程返回0；给父进程返回子进程的PID，子进程创建失败则返回-1。

为什么给子进程返回0，而对父进程返回子进程的PID呢？

首先要明确创建子进程的目的：指派任务给子进程执行。PID对于进程而言就是一个名字，标识。父进程可以有多个子进程，子进程只有一个父进程，所以父进程必须知道子进程的标识。

为什么fork有两个返回值？

fork之后的代码中，包括最后的return语句，由于fork之后的语句父子进程都要执行，return语句也不例外。

1.2 写时拷贝

在任意一方未进行写入数据的操作时，父子进程是共享代码和数据的。只要当任意一方写入数据，这时才会拷贝一份，然后修改部分代码和数据，得到属于各自的代码和数据。

为什么不在创建子进程的一开始就进行数据拷贝、修改等操作？

为了按需分配内存，高效地使用内存空间。子进程不一定会使用父进程的所有数据和代码，而且子进程在不写入数据的情况下，也没有必要对数据进行拷贝、修改。

意义

分离父子进程，保证其独立性。写时拷贝本质是一种延时申请的技术，提高内存使用率。

1.3 fork的常规用法

一个进程希望复制自己，使子进程同时执行不同的代码段。例如父进程等待客户端请求，生成子进程来处理请求；
一个进程要执行一个不同的程序。例如子进程从fork返回后，调用exec函数。

1.4 fork调用失败的原因

系统中有太多的进程，内存空间不足，子进程创建失败；
实际用户的进程数超过了限制，子进程创建失败。

2. 进程终止

进程终止，本质就是OS释放系统资源，释放进程之前申请的相关内核数据结构和对于的数据和代码。

2.1 进程退出的情况

进程退出有三种情况：

代码执行完，结果正确；
代码执行完，结果不正确；
代码未执行完，程序崩溃。

对于前两种代码执行完的情况，OS是怎么知道结果是正确还是错误？

在学习C语言的初期，我们就知道main函数是程序的入口，但是我们并没有理解它。实际上，每个程序都有一个main函数。那么main函数的返回值的意义就在于此，可以让OS知道程序运行后的情况如何，以便OS调度或提醒用户。

为什么main函数的return语句总是return 0？它有什么含义吗？return 1、2、3不行吗？

main函数的返回值是可以自己设置的，这个返回值叫做「退出码」，程序员或OS以退出码判断运行结果是否正确。return语句的意义就是返回给上一级进程，以批判该进程执行结果（可以忽略）。
非零值有无数个，不同的非零值就可以表示不同的错误原因。返回值（退出码）可以有不同的结果，方便定位错误原因。

使用指令echo $?查看上一个进程的退出码：

对于程序员，我们只看返回码是无法知道是什么错误的，所以每个返回码都有对应的错误表。就像ls指令打印出的错误一样（后面的选项是随便打的）。

实际上，退出码都是有映射到各种不同的字符串的，这些字符串就像上面ls的报错一样。

通过strerror函数可以获取错误码和错误信息字符串的映射关系：

#include 
#include 
int main()
{
  for(int i = 0; i < 150; i++)
  {
  printf("%d:%s\n", i, strerror(i));
  }
  return 0;                                                                 
}

可以看到，上面ls的错误就是退出码为2映射的字符串。

退出码映射的字符串都有不同的含义，帮助程序员定位执行失败的原因，这是C语言中的退出码和字符串的映射关系，映射关系是人为规定的，不同情况下会有不同的含义。

2.2 进程退出的方法

正常退出：

main函数中的return语句；
在任何地方调用exit函数；
在任何地方调用_exit函数。

return代表函数调用结束，exit是一个接口。

异常退出：

ctrl + c，信号终止。

return语句退出

上面演示过，return后可以自定义退出码，通过echo $?指令可以查看验证。

exit函数退出

#include 
#include 
void show()
{
  printf("hello world");
  exit(99);
}
int main()
{
  show();
  return 0;
}

在这段代码中，exit会在进程终止前将缓冲区中的数据刷新出来。

_exit函数退出

同样是上面的代码，将exit换成_exit，注意包含头文件：

#include 
#include 
#include 
void show()
{
  printf("hello world");
  _exit(100);
}
int main()
{
  show();
  return 0;
}

但是如果在打印语句中加上换行符呢：

结果却可以打印，为什么？

三者的区别

return：只有main函数中的return语句才能让进程退出，其他函数中的return语句不能；exit和_exit函数在任何地方都可以让进程退出。
exit函数在退出进程前，会执行用户定义的清理函数，冲刷缓冲，关闭流等操作，然后才终止进程；而_exit直接终止进程，不会做任何收尾操作。
exit是一个函数，而_exit是一个系统调用。

「系统调用」，是system calls的直译，可以简单地理解为OS提供给上层的接口，是系统级别的函数。

重新回看那个\n的问题，因为exit会冲刷缓冲，所以就算不加\n最后也会打印出来，而没有收尾操作的_exit，就没办法打印。这就说明「缓冲区」一定不在OS内部，而是C标准库为我们维护的。如果是OS维护，_exit也可以将缓冲区中的内容刷新出来。

三者的联系

事实上，main函数中的return语句会隐式地调用exit函数。

而exit函数在执行完毕收尾操作后，会调用_exit函数终止进程。

也就是说，_exit是最底层的函数，其他两个函数都是由封装而来的。

3. 进程等待

3.1 原因

进程等待是对于父进程而言的，也就是说等待的进程是子进程。

如果子进程退出，父进程不回收，那么子进程会变成僵尸进程；
僵尸进程是无法用kill -9指令杀死的；
父进程创建子进程，其目的是让子进程工作，如果父进程对子进程不管不顾，这就违背了创建子进程的初衷；
父进程需要通过进程等待，回收子进程的资源，获取子进程的退出信息。

3.2 子进程status参数

进程的status参数是一个int类型参数，但是它的不同范围的比特位储存着不同的信息（此处只研究低16位）。

在status的低16比特位当中，高8位表示进程的退出状态，即退出码。进程若是被信号所杀，则低7位表示终止信号，第8位比特位是core dump标志。

在头文件中，提供了一些宏简化位运算操作：

if (WIFEXITED(status)) {
	// 正常退出：((status) & 0x7f) == 0
	// 打印退出码：(status >> 8) & 0xff
	printf("child return: %d\n", WEXITSTATUS(status));
} else if (WIFSIGNALED(status)) {
	// 异常退出：((signed char) (((status) & 0x7f) + 1) >> 1) > 0
	// 打印异常信号值：(status) & 0x7f
	printf("child signal: %d\n", WTERMSIG(status));
}

其中，我们需要了解两个宏：

WIFEXITED(status)：如果进程正常退出，返回的值是非零值。作用是用值的真假判断进程是否正常退出；
WEXITSTATUS(status)：如果WIFEXITED非零，得到的是进程的退出码。

这里的status参数是针对进程正常退出而言的，如果进程因为崩溃（或其他不正常的方式）退出，这里的参数也是没有意义的。对于return语句，如果进程在它之前因为崩溃而退出，那么return的退出码也就没有意义了，因为根本没有执行return语句。

程序异常退出或崩溃，本质上是OS杀掉了进程，这和语言是无关的。OS如何杀掉进程？–发送信号。

3.3 进程等待的方法

wait函数

函数声明和头文件

#include
#include
pid_t wait(int* status);

参数

指向status参数的指针，如果不需要监视，设置为NULL。

返回值

成功：返回进程PID；
失败：返回-1。

作用

等待任意子进程。

下面用fork创建一个子进程，然后让子进程工作一段时间，在这段时间中，使用wait函数让父进程等待子进程结束。子进程结束以后父进程读取子进程的信息，然后打印子进程的status参数。

#include 
#include 
#include 
#include 
#include 
int main()
{
    pid_t id = fork();
    if(id == 0)//子进程创建成功
    {
        int count = 5;
        while(count--)
        {
            printf("子进程：PID：%d, PPID:%d\n", getpid(), getppid());
            sleep(1);
        }
        exit(99);
    }
    //父进程
    int status = 0;//定义一个status参数，等下传入wait中后再提取
    pid_t ret = wait(&status);
    if(ret > 0)//wait子进程退出成功，返回它的pid
    {
        printf("等待子进程退出成功\n");
        if(WIFEXITED(status))//如果是正常退出，条件为真
        {
            printf("子进程退出码：%d\n", WEXITSTATUS(status));
        }
    }
    sleep(3);
    return 0;
}

在进程运行时，在另一个终端用下面的脚本监控系统进程的情况：

while :; do ps axj | head -1 && ps axj | grep proc | grep -v grep;echo "#####################";sleep 1;done

从监控结果可以看到，子进程结束以后被父进程回收，不会变成僵尸进程。

waitpid函数

函数声明和头文件

#include
#include
pid_t waitpid(pid_t pid, int* status, int options);

参数

pid：待等待的子进程的PID。如果为-1，表示等待任意子进程；
status：同上；
options：
- WNOHANG，如果等待的子进程未结束，则waitpid函数的返回值为0，不再等待；如果正常结束，则返回子进程的PID；
- WUNTRACED，如果子进程进入暂停执行情况则马上返回，但结束状态不予以理会。

options的不同选项，实际上是C语言中的宏。为什么是C语言？原因：Linux内核是由C语言写的，而wait和waitpid是系统调用，也就是内核对外开放的接口，也就是C语言函数。

宏的作用是将抽象的数据赋予意义。

返回值

等待成功则返回等待进程的PID；
如果设置了选项WNOHANG，而调用中 waitpid函数如果判断没有已退出的子进程的信息，返回0；
如果出错，返回-1，errno会被设置成相应的值以指示错误所在。

作用

等待指定PID进程或任意进程。

wait和waitpid的区别

效果不同:

wait会令调用者阻塞，直至某个子进程终止。

waitpid可以设置一个选项（options）设置为非阻塞，另外waitpid并不是等待第一个进程结束而是等待PID指定的进程。

waitpid有wait没有的三个特性：

waitpid使我们可以等待指定的进程；
waitpid提供了一个无阻塞的wait；
waitpid支持工作控制。

wait和waitpid作为系统调用，它的执行者是OS，本质上就是OS帮我们拿到进程的信息（task_struct）。

父进程不等待子进程，会造成僵尸进程，这是系统层面上的内存泄漏，跟我们new或malloc出来的内存空间造成的内存泄漏是不一样的。

通过status参数，父进程可以知道子进程的状态。

阻塞等待和非阻塞等待

阻塞等待

使用wait会令调用者阻塞。被阻塞的进程对于系统而言，无非两种情况：一是等待被调度，也就是这个进程没有被CPU调度（CPU本来就很忙）；二是在阻塞队列中。

非阻塞等待

父进程通过waitpid等待子进程，如果子进程没有退出，waitpid直接返回。

阻塞和唤醒

一般进程阻塞，伴随着被切换的操作，也就是如果进程不运行了，OS将它的PCB放到排队队列中，在用户层面看来，就好像卡住了一样。将PCB放到运行队列中，就是进程运行起来了。

阻塞调用和非阻塞调用

调用的主体是父进程，被调用的是wait和waitpid函数。

阻塞调用：父进程一直等待子进程结束；
非阻塞调用：父进程会每隔一段时间后查询子进程是否结束，在这些间隔内，父进程可以做自己的事情。

示例

4. 进程程序替换

4.1 替换原理

fork之后，父子进程各自执行父进程代码的一部分，这一部分对于用户而言是重复的，而创建子进程的初衷就是让它去干父进程之外的事情（这一点在接触『进程』后已经提到过不止一次）。虽然可以通过写时拷贝让父子进程拥有属于它们各自的数据，但是代码依然是共享的，也就是说，它们虽然数据不同，但是执行的任务还是一样的。

**进程程序替换就是让子进程通过特定的接口（exec函数），加载磁盘上的一个全新的程序（代码和数据），加载到调用进程的进程地址空间中。**子进程执行不同的程序，叫做替换。

当执行进程替换操作后，子进程的代码和数据被新程序的代码和数据替换，并从新程序开始执行。

子进程进行进程替换，有没有创建一个新的子进程？

没有。进程=内核数据结构（PCB）+代码+数据，因为内核数据结构没有发生改变，所以没有创建新的进程。

子进程进行进程替换后，会影响父进程的代码和数据吗？

不会。进程替换，实质上是对子进程的数据进行写入操作。一旦父子进程的任何一方发生数据写入操作，写时拷贝技术就会发挥作用，为写入数据的一方另外创建一份代码和数据。所以父子进程的代码和数据是分离的。

子进程进行程序替换后，环境变量相关数据会被替换吗？

不会。因为每个进程都有自己的环境变量。环境变量以进程为单位，子进程继承父进程的环境变量。关于环境变量，可以参看这篇文章：环境变量的来源、原理与应用。

4.2 exec函数族

exec函数族提供了一个在进程中启动另一个程序执行的方法。它可以根据指定的文件名或目录名找到可执行文件，并用它来取代原调用进程的数据段、代码段和堆栈段，在执行完之后，原调用进程的内容除了进程号外，其他全部被新的进程替换了。

头文件

#include

函数原型

int execl(const char * path,const char * arg,…);
int execle(const char * path,const char * arg,char * const envp[]);
int execlp(const char * file,const char * arg,…);
int execv(const char * path,char * const argv[]);
int execve(const char * path,char * const argv[],char * const envp[]);
int execvp(const char * file,char * const argv[]);

参数说明

path：要执行的程序路径。可以是绝对路径或者是相对路径。在execv、execve、execl和execle这4个函数中，使用带路径名的文件名作为参数；
file：要执行的程序名称。如果该参数中包含“/”字符，则视为路径名直接执行；否则视为单独的文件名，系统将根据PATH环境变量指定的路径顺序搜索指定的文件；
argv：命令行参数的数组；
envp：带有该参数的exec函数可以在调用时指定一个环境变量数组。其他不带该参数的exec函数则使用调用进程的环境变量；
arg：程序的第0个参数，即程序名自身。相当于argv[O]。
…：命令行参数列表。调用相应程序时有多少命令行参数，就需要有多少个输入参数项。注意：在使用此类函数时，在所有命令行参数的最后应该增加一个空的参数项(NULL)，表明命令行参数结束。

这些参数类型都是字符指针类型，说明这些参数都是以字符串的形式传入的。

返回值

一1表明调用exec失败，无返回表明调用成功。即exec函数有返回值则表明调用程序失败。

4.3 exec函数用例

execl

int execl(const char * path,const char * arg,…);

execl中的l，可以看作list的缩写。

使用execl函数进行进程替换操作：

第一个参数是要替换的程序的路径，需要包括程序名。下面用常用的ls程序为例，所以先用which指令查看它所在的路径：

第二个参数实际上也是有顺序的：第一个参数是程序名，中间的是选项，以字符串形式传入，最后以NULL结尾。也就是在命令行是怎么写的，这里就怎么传，下面的示例也是一样的。

#include 
#include 
int main()
{
    printf("exec函数之前\n");
    execl("/usr/bin/ls", "ls", "-l", "-a", "-i", "-d", NULL);
    printf("exec函数之后\n");
    return 0;
}

可以看到execl函数确实成功在这个路径下调用成功了ls程序，但是execl后面的打印语句没有执行。

原因是：一旦exec函数调用成功，即进程替换成功后，所有的数据都被替换了，包括exec前面的语句、return语句等。之所以第一个打印语句能执行，是因为它在exec函数前面。

为什么execl成功没有返回值，只有失败了才返回呢？

替换成功了，所有数据都被替换了。即使return返回，也没有地方可以接收，因为替换以后新进程和原来的进程两者无关。

为什么创建子进程？或者说为什么让子进程去进行进程替换操作？

为了不影响父进程，保证父进程工作的付利息。父进程的主要任务是读取数据、解析数据、指派进程执行代码等工作，如果替换父进程，那么就没有进程可以管理数据了。

execv

int execv(const char * path,char * const argv[]);

execv中的v，可以认为是vector，和第二个参数argv对应，表示字符串参数是存在一个数组中，以数组的形式传入的。

它和execl功能上没有什么区别，只是传参方式不同。

下面把参数放到数组中，然后将数组作为参数传入execv：

#include 
#include 
#include 
#include 
#define NUM 16
int main()
{
	pid_t id = fork();
	if(id == 0)//子进程
	{
		printf("子进程：PID：%d，PPID：%d\n", getpid(),getppid());
		sleep(3);
		char* const _argv[NUM] = {
			(char*)"ls",
			(char*)"-a",
			(char*)"-l",
			NULL
		};
		execv("/usr/bin/ls", _argv);
		exit(1);
	}
	else//父进程
	{
		printf("父进程：PID：%d，PPID：%d\n", getpid(),getppid());
	}
	return 0;
}

把字符串强转为char*，只是为了取消警告（类型匹配）。

execlp

int execlp(const char * file,const char * arg,…);

结合环境变量部分，如果想要让程序直接执行而不指定它的路径，就需要将这个路径添加到环境变量PATH中。

execlp中的p和环境变量PATH对应。

第一个参数是要找的程序名；
后面的参数是命令行参数。

功能

从环境变量中查找程序，找到然后执行。

也就是说，execlp可以直接调用环境变量中的程序，而不用传入路径。

#include 
#include 
#include 
#include 
int main()
{
	pid_t id = fork();
	if(id == 0)//子进程
	{
		printf("子进程：PID：%d，PPID：%d\n", getpid(),getppid());
		sleep(3);
		execlp("ls", "ls", "-a", "-l", NULL);
		exit(1);
	}
	else//父进程
	{
		printf("父进程：PID：%d，PPID：%d\n", getpid(),getppid());
	}
	return 0;
}

效果同上。当然，如果要用它执行自己写的程序，就要将这个程序的路径添加到环境变量PATH中。

实际上，传入的命令行参数（字符串选项），是由被调用程序中的main函数的一个参数接收的。

main函数原型

int main(int argc, char* argv[], char* envp[])

execle

int execle(const char * path,const char * arg,char * const envp[]);

execle中的e和environment variables（环境变量）对应，所以不带p的接口就要带上路径。

上面的示例都是调用系统程序比如ls，如何调用自己写的C/C++程序呢？

其实就是设置命令行参数之间的对应关系。

下面写一个名为mycmd的程序，然后用proc2的子进程调用它：

//mycmd
#include 
#include 
#include 
int main(int argc, char* argv[])//命令行参数个数，命令行参数数组
{
	if(argc != 2)
	{
		printf("无法运行\n");
		exit(1);
	}
	if(strcmp(argv[1], "-a") == 0)
	{
		printf("hi -a\n");
	}
	else if(strcmp(argv[1], "-b") == 0)
	{
		printf("hi -b\n");
	}
	else
	{
		printf("运行失败\n");
	}
	return 0;
}

//proc2.c
#include 
#include 
#include 
#include 
#define NUM 16
//绝对路径或相对路径都可以
const char* myfile = "mycmd";

int main()
{
	pid_t id = fork();

	if(id == 0)//子进程
	{
		printf("子进程：PID：%d，PPID：%d\n", getpid(),getppid());
		sleep(3);
		char* const _argv[NUM] = {
			(char*)"-a",
			NULL
		};
		execle(myfile, "mycmd", "-a", NULL);
		exit(1);
	}
	else//父进程
	{
		printf("父进程：PID：%d，PPID：%d\n", getpid(),getppid());
	}
	return 0;
}

可以看到，proc2的子进程成功调用了自己写的mycmd程序。

【注意】

第一个参数是被调用的程序的路径，相对路径或绝对路径都可以，但是要保证使用相对路径时被调用程序要在当前进程的路径下。
后面的参数是命令行参数。

上面只用了两个参数，也可以传入环境变量envp[]，它是一个指针数组。

在proc2.c的main函数中定义一个指针数组作为要传入的环境变量：

#include 
#include 
#include 
#include 
#define NUM 16

const char* myfile = "mycmd";
int main()
{
    //新增
	char* const _env[NUM] = {
		(char*)"MY_CMD_VAL=1234567890",
		NULL
	};
	pid_t id = fork();

	if(id == 0)//子进程
	{
		printf("子进程：PID：%d，PPID：%d\n", getpid(),getppid());
		sleep(3);
		char* const _argv[NUM] = {
			(char*)"-a",
			NULL
		};
		execle(myfile, "mycmd", "-a", NULL, _env);
		exit(1);
	}
	else//父进程
	{
		printf("父进程：PID：%d，PPID：%d\n", getpid(),getppid());
	}
	return 0;
}

在mycmd.c中，增加查看环境变量的打印语句：

#include 
#include 
#include 
int main(int argc, char* argv[])//命令行参数个数，命令行参数数组
{
	if(argc != 2)
	{
		printf("无法运行\n");
		exit(1);
	}
	printf("环境变量：%s\n", getenv("MY_CMD_VAL"));//新增
	if(strcmp(argv[1], "-a") == 0)
	{
		printf("hi -a\n");
	}
	else if(strcmp(argv[1], "-b") == 0)
	{
		printf("hi -b\n");
	}
	else
	{
		printf("运行失败\n");
	}
	return 0;
}

编译运行proc2

结果表明，proc2的环境变量传给了mycmd。

补充

这就是环境变量具有全局属性，可以被子进程继承的原因。实际上，在子进程内部调用execle函数时，传入main函数接收的环境变量env就可以让子进程继承父进程的环境变量。

将mycmd.c的getenv函数的参数改成"PATH"：

编译运行proc2：

这就是main函数接收的系统环境变量PATH。

execve

int execve(const char * path,char * const argv[],char * const envp[]);

这是一个系统调用，是OS提供的接口。实际上exec函数族都是用它封装的函数。原因是封装不同功能的函数以满足上层不同的需要。

小结

命名

l(list)：表示参数采用列表的形式，一一列出。
v(vector)：表示参数采用数组的形式。
p(path)：表示能自动搜索环境变量PATH，进行程序查找。
e(env)：表示可以传入自己设置的环境变量。

函数名	参数格式	是否带路径	是否使用当前环境变量
execl	列表	否	是
execlp	列表	是	是
execle	列表	否	否，需自己组装环境变量
execv	数组	否	是
execvp	数组	是	是
execve	数组	否	否，需自己组装环境变量

5. 自制简易shell

通过了解进程程序替换的原理后，介绍shell的运行原理。

5.1 shell运行原理

通过子进程执行命令，父进程完成等待子进程、解析命令等管理操作即可完成命令行解释器（shell）的工作。

外壳程序（shell）就像银行的指导人员，OS相当于银行内部，命令行解释器（shell）对用户输入到终端的命令进行解析，调用对应的执行程序。（回忆我们使用命令行输入命令时，shell做的工作）

5.2 模拟实现

首先要明确，shell一定是一个常驻内存的进程（不主动退出），也就是死循环。
打印出提示信息；
获取用户从键盘键入的信息（指令和选项）；
解析命令行参数；
fork创建子进程；
TODO，内置命令；（在最后）
替换子进程；
等待子进程退出。

既然是常驻内存的进程，那么下面的操作都是在死循环内进行的。如果想退出这个自制shell，可以按ctrl+c；如果是死循环（打印），连续按几次就可以停下了。

打印提示信息

每次输入命令之前，都有这样的提示信息（具体视连接工具和平台而异）：

可以通过打印事先写好的字符串达到这种效果：

while(1)
{
    printf("[root@localhost myshell]# ");//随便写的
}

这样符号和字符串的组合就是打印给用户看的信息。除此之外，需要注意一些细节：

shell并没有在打印提示信息以后换行，但是不加\n的话，这个字符串会滞留在缓冲区中，所以打印提示信息需要搭配fflush使用，参数是stdout（标准输出），将字符串刷新到显示器上。
```
while(1)
{
    printf("[root@localhost myshell]# ");//随便写的
    fflush(stdout);
}
```
还增加需要下面的部件，否则这只是一个死循环打印。

获取键入的信息

自己写一个缓冲区

用一个全局的数组储存命令行参数。因为我们输入命令行参数的形式是一个字符串，就像这样："ls -a -l"，所以这个字符数组存储的是字符串。为了等下方便完整且刚好地截取输入的字符串，在初始化这个数组的时候就将所有元素置为\0。

#include //注意memset的头文件
#define NUM 1024    //定义缓冲区的长度

char cmd_line[NUM];  //定义缓冲区字符数组

int main()
{
	while(1)
	{
		//...
		memset(cmd_line, '\0', sizeof(cmd_line));
	}
	return 0;
}

写好缓冲区后，用gets函数获取输入的字符串，stdin表示从标准输入中读取数据：

if(fgets(cmd_line, sizeof(cmd_line), stdin) == NULL)
{
    continue;
}
printf("echo:%s\n", cmd_line);

测试一下，输入"ls -a -l"，回车：

但是回显指令后，会多空一行，原因是：

注意刚刚输入一个字符串后，又按下了「回车」，这就导致缓冲区cmd_line的内容变成这样了：ls -a -l \n\0\0\0...，这就导致刚刚按下的回车输入到了缓冲区，所以要把这个\n去掉。换句话说，我们删除一个尾端的数据，通常将这个元素移除“尾端”的范围内，而\0就是字符串尾端的标志。所以我们对缓冲区读取的字符串做修改，将最后的\n置成\0。

cmd_line[strlen(cmd_line) - 1] = '\0';//除去\n

测试一下：

现在有模有样的，就差解析命令和程序替换（就是让子进程调用命令的程序）了。

解析命令

还记得上面的exec函数族吗？给它们传入的命令参数是一个数组，这个数组的元素是命令或选项，就像这样：“ls”，“-a”，“-l”。但是我们知道，输入的命令行参数是一个字符串，为了使用这个接口，我们需要将这个字符串拆分成若干个命令和选项的小字符串，并且把它们存到一个数组里面，最后传入这个数组到exec函数（至于选哪个，等下再说）中。

#define SIZE 32
#define SEP " "     //定义" "为拆散字符串的分隔符
char cmd_line[NUM];  //定义缓冲区字符数组，保存输入的命令行字符串
char *g_argv[SIZE];  //保存拆散后的命令行字符串


int main()
{
	while(1)
	{
		//...
		//解析命令
		g_argv[0] = strtok(cmd_line, SEP);
		int index = 1;
        while(g_argv[index++] = strtok(NULL, SEP));
	}
	return 0;
}

strtok函数是用来分解字符串的，其原型是： char *strtok(char str[], const char *delim); 其中str是要分解的字符串，delim是字符串中用来分解的字符，该函数返回分解后的字符串的起始位置指针。

【测试】用一个循环检查一下字符串是否被拆成功了（等下要删掉）：

for(int i = 0; g_argv[i]; i++)
{
    printf("g_argv[%d]:%s\n", i, g_argv[i]);
}

删掉它，继续。解析命令行参数的操作完成了，下面就是创建子进程和用子进程调用指定程序了。

创建子进程

用fork创建子进程已经轻车熟路：

pit_t id = fork();
if(id == 0)//子进程
{
    printf("子进程开始运行：\n");
    //...
    exit(1);
}
else//父进程
{
    //...
}

替换子进程（子进程）

这部分的操作的主体是子进程。

个人觉得这个操作叫「进程替换」有点不准确，因为它本质上是让子进程去调用、运行其他程序，「替换」体现在当子进程调用其他程序时，子进程的所有数据都会被这个新的程序代替，实行这个操作以后，才是真正地称为进程替换。

那么使用哪个exec函数来进行进程替换？

根据需要选择。例如我等下要用ls示例，因为ls是系统程序，它是在环境变量PATH中的，那么可以选择execvp函数，因为第一个参数是file（看最开始的参数说明），默认在环境变量PATH中搜索名为file的程序。

if(id == 0)//子进程
{
    printf("子进程开始运行：\n");
    execvp(g_argv[0], g_argv);
    exit(1);
}

等待子进程退出（父进程）

这部分的操作的主体是父进程。

在前面「进程等待」部分提到，父进程传入一个status变量给子进程，通过这个status参数的低16比特位知晓子进程的状态。

成功：返回进程PID；
失败：返回-1或0。

else//父进程
{
    printf("子进程开始运行：\n");
    int status = 0;
    pid_t ret = waitpid(id, &status, 0);
    if(ret > 0)//退出成功，返回子进程pid
    {
        printf("退出码：%d\n", WEXITSTATUS(status));
    }
}

5.3 测试及补充

测试

编译运行以下代码：

#include 
#include 
#include 
#include 
#include 
#include //注意memset的头文件
#define NUM 1024    //定义缓冲区的长度
#define SIZE 32
#define SEP " "     //定义" "为拆散字符串的分隔符
char cmd_line[NUM];  //定义缓冲区字符数组，保存输入的命令行字符串
char *g_argv[SIZE];  //保存拆散后的命令行字符串


int main()
{
	//0. 用死循环让程序常驻内存
	while(1)
	{
		//1. 打印提示信息
		printf("[root@localhost myshell]# ");//随便写的
		fflush(stdout);//将上面的字符串刷新到屏幕
		memset(cmd_line, '\0', sizeof(cmd_line));
		//2. 获取键入信息
		//输入"ls -a -l"
		if(fgets(cmd_line, sizeof(cmd_line), stdin) == NULL)
		{
			continue;
		}
		cmd_line[strlen(cmd_line) - 1] = '\0';//除去\n
		printf("echo:%s\n", cmd_line);
		//3. 解析命令
		g_argv[0] = strtok(cmd_line, SEP);//strtok第一次要传入字符串地址
		int index = 1;
		while(g_argv[index++] = strtok(NULL, SEP));//传入NULL，表示继续分割
		// 测试是否解析成功
		// for(int i = 0; g_argv[i]; i++)
		// {
		// 	printf("g_argv[%d]:%s\n", i, g_argv[i]);
		// }
		//4. 创建子进程 
		pid_t id = fork();
		if(id == 0)//子进程
		{
			printf("子进程开始运行：\n");
			execvp(g_argv[0], g_argv);// 5. 程序替换
			exit(1);
		}
		else//父进程
		{
			int status = 0;
			pid_t ret = waitpid(id, &status, 0);//6. 等待子进程退出
			if(ret > 0)//退出成功，返回子进程pid
			{
				printf("退出码：%d\n", WEXITSTATUS(status));
			}
		}
	}

	return 0;
}

补充

但是如果试图使用cd指令回退到上级目录呢？

上面的程序对cd指令是无效的。

【原因】

首先我们要知道，可执行程序（就是编译后的文件）和进程所在的目录是不一样的，可以看这里了解。

其次我们还要知道，当该命令（cd）执行时，不会为前往另一个目录而创建一个新的进程，而是由外壳代为执行这条命令，ls等其他命令也是这种情况，这些命令叫做「内置指令」。这是因为，创建新的进程时，子进程会继承父进程创建时的目录。而如果cd命令继承了父进程的目录，则它永远也不能达到它的目标。

因为我们上面的操作对于命令行参数（我们输入的命令）而言，都是子进程执行的，子进程的几乎所有数据都会被替换，那么子进程调用cd程序，对于shell本身（父进程）是没有影响的。

【解决】

让父进程调用cd指令。

在真正的shell程序中，这些内置指令都是要由父进程执行的。

在fork后的父进程代码中，使用接口chdir，切换工作目录，切换成功就重新循环。添加下面的代码：

//4. TODO，内置指令
if(strcmp(g_argv[0], "cd") == 0) 
{
    if(g_argv[1] != NULL) chdir(g_argv[1]); //cd path, cd ..

    continue;
}

当然可以把“子进程开始运行”和“退出码”这两个语句删掉，让它更像shell。

【优化】

可以特殊招待以下ls指令，比如像真正的shell上个色？给ls -l起个别名ll？

if(strcmp(g_argv[0], "ls") == 0)
{
    g_argv[index++] = "--color=auto";
}
if(strcmp(g_argv[0], "ll") == 0)
{
    g_argv[0] = "ls";
    g_argv[index++] = "-l";
    g_argv[index++] = "--color=auto";
}

come on，有内味了。

有一个细节，我的代码中没有过滤fork失败的判断分支，因为篇幅有限且一般情况下不会失败。

5.4 小结

运用所学的知识，通过解决各种问题，能更深层次地理解我们平常使用的指令，又理解了一点点“一切皆文件”的Linux了。感觉黑乎乎的shell也不再那么神秘，只要抽丝剥茧，高楼大厦也是砂砾筑之。

模拟实现shell的源代码在这里。

你可能感兴趣的:(Linux,linux,unix,服务器)

Linux信号处理详解：从基本概念到高级应用 chian-ocean Linux linux 信号处理运维
个人主页：chian-ocean文章专栏-Linux前言：在Linux系统中，信号（Signal）是操作系统用来通知进程发生某些事件的一种机制。信号是一种软件中断机制，可以被进程用来响应特定的事件，如终止进程、暂停进程、重新加载配置等。信号机制是Unix及其衍生系统的核心功能之一什么是信号生活中的信号也可以理解为一种通过特定方式传递信息、指令或警告的方式。在日常生活中，信号无处不在，帮助我们理解周
Nginx + CertBot 配置HTTPS泛域名证书(Rocky Linux 9.4)
#安装nginx此步省略，以nginx安装在'/usr/local/nginx-1.23.3'目录为例#1.安装certbot#更新包列表sudodnfupdate#安装EPEL仓库：EPEL仓库提供了许多有用的软件包，包括certbotsudodnfinstall-yepel-release#安装Certbot和Nginx插件。dnfinstall-ycertbotpython3-certbot
初识HTTP 思考的橙子后端 http 网络协议网络
HTTP概念:HyperTextTransferProtocol，超文本传输协议，规定了浏览器和服务器之间数据传输的规则HTTP协议特点:1.基于TCP协议:面向连接，安全2.基于请求-响应模型的:一次请求对应一次响应3.HTTP协议是无状态的协议:对于事务处理没有记忆能力。每次请求-响应都是独立的。缺点:多次请求间不能共享数据。优点:速度快HTTP-请求数据格式请求数据分为3部分:1.请求行:请
【Windows下的PowerShell VS Linux下的Bash】中古传奇 Linux windows linux bash
Windows下的PowerShellVSLinux下的Bash1文件和目录操作1.1列出目录内容1.2进入其他目录1.3显示当前目录1.4创建目录1.5删除文件或目录1.6复制文件或目录1.7移动文件或目录1.8创建文件1.9查看文件内容1.20输出文本1.21重定向输出到文件2系统信息和管理2.1查看进程2.2终止进程2.3查看进程并按CPU排序2.4获取系统信息2.5查看磁盘使用情况2.6查
技术干货：如何选择最适合自己的RDMA网卡深圳联瑞电子LRLINK 网络
近些年来，RDMA网卡的技术应用在全球以太网通讯市场上刮起一股旋风，特别是阿里、腾讯、浪潮、超微、联想等一些互联网巨头企业在服务器上大量部署RDMA网卡。2019年，据官方数据报道，天猫双11当天成交额达到2684亿元，订单创新峰值达到54.4万笔/秒，单日数据处理量达到970PB，这个惊为天人的数值出现，再一次将RDMA网卡的应用推上话题的顶峰。但是很多用户表示，看着这数据很牛逼，但是RDMA网
Qt上位机编程命名规范-执行版有追求的菜鸟 qt 开发语言
主要规范原则参考Qt上位机编程命名规范。1.文件/文件夹大小写分析考虑跨平台性，全小写是一种约定俗成的风格，在许多大型开源项目中（如Linux内核、Python标准库）被广泛使用。1.1.配合文件扩展名通常文件名小写配合小写扩展名（如.h,.cpp,.json），使整体风格统一：main.cppconfig.jsonutils.h1.2.文件夹和pri文件命名通常小写、下划线分开：control_
达梦数据库学习笔记 lwq979991632 数据库
达梦数据库学习资料一、操作系统安装1、配置信息CPU：4核心内存：4G网络：NAT2.安装包选择选择带GUI的服务器，勾选Java平台、KDE二、安装前准备1.数据库远程访问：关闭防火墙systemctlstopfirewalld（禁用）systemctldisablefirewalld(停止，关闭开机自启动)systemctlstatusfirewalld（查看状态）2.安装gcc包rpm-qa
RK3568平台（音频篇）音频ALSA框架嵌入式_笔记瑞芯微音视频
一.ALSA框架简介ALSA表示先进linux声音架构（AdvancedLinuxSoundArchiecture），它由一系列的内核驱动、应用程序编程接口（API）以及支持linux下声音的应用程序组成、ALSA项目发起的原有是linux下的声卡驱动（OSS）没有获得积极的维护，而且落后于新的声卡技术。JaroslavKysela早先写了一个声卡驱动，并由此开始了ALSA项目，随后，更多的开发者
springboot 项目如何提高并发量 LCY133 spring后端 spring boot java 后端
提升基于SpringBoot的Web项目并发量需要从应用优化、数据库调优、缓存策略、异步处理、水平扩展等多方面综合改进。以下是具体方案和实践建议：一、应用层优化1.代码性能优化•避免阻塞操作：减少同步锁、长事务、大文件处理等耗时操作。•优化SQL查询：避免N+1查询，使用索引，减少全表扫描。•复用对象：避免频繁创建大对象（如JSON解析工具），使用线程安全对象池。2.线程池配置•调整Web服务器线
详细的HTML网页错误状态码丶大黄蜂网站服务 html
重点内容HTTP400-请求无效HTTP401.1-未授权：登录失败HTTP401.2-未授权：服务器配置问题导致登录失败HTTP401.3-ACL禁止访问资源HTTP401.4-未授权：授权被筛选器拒绝HTTP401.5-未授权：ISAPI或CGI授权失败HTTP403-禁止访问HTTP403-对Internet服务管理器的访问仅限于LocalhostHTTP403.1禁止访问：禁止可执行访问H
静态html 500错误,HTTP-500错误金门走狗静态html 500错误
http500内部服务器(HTTP-InternalServerError)错误说明IIS服务器无法解析ASP代码，访问一个静态页面试试是否也出现这个问题，如果访问静态页面没问题，那就要分以下几种情况来分析了：①你是否改变过计算机名称。②站点所在的文件目录是否自定义了安全属性。③安装了域控制器后是否调整了域策略。如果是其中的一种情况，请一一将改变的参数设置回来看是否解决问题。如果静态空间也无法访问
企业磁盘管理实战：常见问题与高效解决方案 Gold Steps. 技术博文分享 linux 运维服务器
案例1：开发环境内存不足，大量占用Swap场景还原测试服务器运行多个内存密集型应用时，物理内存耗尽，系统频繁触发Swap交换机制。由于Swap分区不足，测试任务卡顿甚至中断，但物理内存无法临时扩容，需快速缓解内存压力。优化方案为测试环境临时创建Swap分区，平衡内存负载。遵循“内存≤8G时Swap=1-1.5倍内存，内存>8G时Swap≤8G”原则，避免过度依赖Swap影响性能。解决措施#步骤1：
Windows和Linux系统上的Mamba_ssm环境配置清纯世纪笔记 python 深度学习人工智能
目录一、Linux系统安装二、Win系统安装1）、安装causal_conv1d1、第一种方法2、第二种方法（感觉可靠）3、第三种方法：直接下载大神编译好的文件进行安装2）、安装mamba-ssm1、第一种方法2、第二种方法：直接下载大神编译好的文件进行安装一、Linux系统安装如果自己的系统不是cuda11.8，那么需要先创建一个新环境来安装对应的cuda版本：condacreate-nyour
Vision mamba(mamba_ssm)安装踩坑指南 ggitjcg 深度学习 python
在这篇博客中，我将分享我在linux环境安装和使用VisionMamba（mamba_ssm）过程中遇到的一些问题和解决方法。前置检查：PyTorch和Python版本在安装mamba_ssm前，请确保你的PyTorch和Python环境版本正确。以下代码可用来检查环境信息：importtorchprint("PyTorchVersion:{}".format(torch.__version__)
内部服务器错误500是什么？该如何解决？ Asuna01 C#c#
500内部服务器错误是什么5XX错误是由服务器返回的状态代码，当服务器遇到这使它不能满足来自客户端的请求的意外情况。500内部服务器错误包含很多种情况，不能确切知道到底是哪个异常导致的。于是很难解决这个错误，因为它可以由许多不同的问题触发。如窗体不能正确处理缺失或不正确的值，此错误的一个常见原因是脚本问题。各种服务器故障也可能导致这个错误，如出现故障的磁盘或无功能的软件模块。简单地说，500内部服
怎样才能把网页数据保存到网络上？ 2301_79698214 html javascript java 前端 html5
要将网页数据存放到网络中，一般可以通过以下几种常见的方式：1.使用后端服务器自建服务器：你可以搭建自己的服务器，例如使用Node.js的Express框架或者Python的Flask、Django框架。以下是一个使用Flask框架存储数据到服务器的简单示例：pythonApplyfromflaskimportFlask,requestapp=Flask(__name__)@app.route('/
gamma软件在linux,GAMMA软件的InSAR处理流程森见灯笼 gamma软件在linux
《GAMMA软件的InSAR处理流程》由会员分享，可在线阅读，更多相关《GAMMA软件的InSAR处理流程(27页珍藏版)》请在人人文库网上搜索。1、基于GAMMA软件的InSAR处理流程,大纲,GAMMA简介InSAR干涉处理流程-步骤-示例差分干涉测量及地理编码流程-步骤-示例,GAMMA简介,Source:Swisscorporation(Aktiengesellschaft-AG)foun
【自学笔记】Linux基础知识点总览-持续更新 Long_poem 笔记 linux 运维
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Linux基础知识点总览目录Linux简介文件和目录结构常用命令文件操作目录操作权限管理文本处理Shell脚本基础进程管理用户和组管理网络配置总结Linux基础知识点总览目录Linux简介文件和目录结构常用命令文件操作目录操作权限管理文本处理Shell脚本基础进程管理用户和组管理网络配置Linux简介Linux是一个基于Uni
记录:(error) NOAUTH Authentication required...【解决方案】 bug菌¹ 全栈Bug调优(实战版)#CSDN问答解惑(全栈版)redis连接报错 Authentication
‍作者：bug菌✏️博客：CSDN、掘金等公众号：猿圈奇妙屋特别声明：原创不易，转载请附上原文出处链接和本文声明，谢谢配合。版权声明：文章里可能部分文字或者图片来源于互联网或者百度百科，如有侵权请联系bug菌处理。一、前言环境版本：centos7.6+redis6.2.6+xshell5二、排错通过xshell5远程连接阿里云服务器，内核是cent
5（五）Jmeter监控服务器性能夜晚打字声工具 jmeter 服务器运维
下载安装插件需要安装插件：ServerAgent-2.2.1（链接：https://pan.baidu.com/s/1Tr63aKbzLuldBoRB5IR7Dg提取码：nyfk）JMeterPlugins-Standard-1.4.0（链接：https://pan.baidu.com/s/13af9OS4JDagg4RFhqxVVbg提取码：51ev）JMeterPlugins-Extras-1
HBase安装 lianhedaxue Hadoop hbase
HBase安装本章将介绍如何安装HBase和初始配置。需要用Java和Hadoop来处理HBase，所以必须下载java和Hadoop并安装系统中。安装前设置安装Hadoop在Linux环境下之前，需要建立和使用LinuxSSH(安全Shell)。按照下面设立Linux环境提供的步骤。创建一个用户首先，建议从Unix创建一个单独的Hadoop用户，文件系统隔离Hadoop文件系统。按照下面给出创建
关于Go那些懒得看又不得不知道的东西 Hock2024 golang 开发语言后端
写在前面当开始学习go，亦或是cpp、还是java向go进行转职，这部分内容都是比较重要的。go的编译环境，模块管理以及一些基本的语法我认为还是很有必要去学习的，因此重新学习了这个部分并且写下下面的学习笔记！如果有写错或者不全面的地方，还希望大家及时纠正和指导。连接环境首先，作为一个后端er，能使用linux系统是必备的技能，这里我建议可以使用Xshell连接云服务器的方案来完成。云服务器建议使用
LINUX PCIe架构详解吕喜曦
LINUXPCIe架构详解【下载地址】LINUXPCIe架构详解分享LINUXPCIe架构详解欢迎阅读《LINUXPCIe架构详解》文档项目地址:https://gitcode.com/Open-source-documentation-tutorial/cb0cf欢迎阅读《LINUXPCIe架构详解》文档。本指南深入浅出地介绍了在Linux操作系统环境下，针对PCIExpress（PCIe）设备
Nginx负载均衡策略详解：从轮询到智能分发，打造高可用服务架构 egzosn nginx 负载均衡架构运维
Nginx负载均衡策略详解：从轮询到智能分发，打造高可用服务架构一、负载均衡的核心价值当单台服务器无法承载高并发流量时，负载均衡通过将请求分发到多台服务器，实现：横向扩展：突破单机性能瓶颈故障隔离：自动剔除异常节点动态调度：根据策略优化资源利用率二、Nginx原生负载均衡策略1.轮询(RoundRobin)配置示例：upstreambackend{server192.168.1.10:8080;s
openwrt路由器禁止某台设备上网操作失败问题解决无级程序员智能路由 openwrt rax3000m 智能路由
家有一台移动RAX3000M，改造成了多功能服务器，同时，还能限制小孩上网，但时间长了就发现移除可添加限制上网设备时无法操作。到处搜索也没找到它是怎么限制的，于是用mac地址在/etc目录下搜索，搜索命令：grep-r"62:19"/etc上面的“62:19”是被限制了上网的一个设备mac地址中的一部分。终于发现了是配置在/etc/config/security里面，内容如下：configfire
Linux下文件名中文乱码导致无法访问的问题解决方法无级程序员 linux 文件名乱码
一个基于openwrt路由器做文件服务器，硬盘里面有些文件的中文名乱码了，导致无法打开，也无法复制，想改名也无法操作，怎么办呢，网上搜了一大圈，都是说如何转换乱码，但文件都无法访问了，怎么转换？比如其中一个文件名是：“IVItripsummaryV1.0❁´◡`❁.xlsx"，我试着如下命令发现能唯一的找到它：ls"IVItripsummaryV1.0"*于是，试着改名：mv"IVItripsum
【概念】Node.js，Express.js MongoDB Mongoose Express-Validator Async Handler 一袋米扛几楼98 各类概念 node.js express javascript
1.Node.js定义：Node.js是一个基于ChromeV8引擎的JavaScript运行时环境，允许你在服务器端运行JavaScript代码。作用：它使得开发者可以使用JavaScript编写服务器端代码，从而实现前后端使用同一种语言。比喻：Node.js就像是“工厂的电力系统”，它为整个工厂（应用程序）提供动力（运行环境）。没有电力系统，工厂的机器（代码）就无法运转。特点：非阻塞I/O：N
linux渲染农场大连教程,Deadline 渲染农场搭建记录温柔彭于晏 linux渲染农场大连教程
渲染农场的工作模式：多台机器组建集群进行渲染，比如：集群中有2台渲染机器A和B，服务器会同时分配给A和B任务，A渲染第一帧,B渲染第二帧，当A完成那么服务器会继续分配第三帧，同样B服务器完成以后服务器分配第四帧，以此类推。渲染农场分服务端和节点，服务器端也可以加入集群中当做节点，当然节点也可以提交渲染任务建议：服务器端单独安装，主要插件及自定义修改内容可单独存放，当多节点接入或大批量渲染任务上传时
P2P下载器项目我的sun&shine 项目
1.项目介绍该项目完成一个在局域网中进行附近文件共享下载功能的工具；能够进行搜索匹配局域网中运行工具的主机；获取到局域网在线主机列表；能够获取指定主机所共享的文件信息列表（指定的共享目录下的文件信息）；能够对指定主机上的指定文件进行多进程分块下载来提高传输效率。2.项目使用的技术Socket套接字编程（了解最基本线程池版本任务处理的tcp服务端程序）HTTP协议格式（了解最基本的http服务器中数
Shell 脚本：自动化运维的利器 Waitccy linux 服务器运维
Shell脚本：自动化运维的利器一、引言在计算机的世界里，效率就是一切。当我们需要频繁执行一系列命令时，手动输入不仅繁琐，还容易出错。Shell脚本就是为解决这类问题而生的强大工具。它允许用户将一系列的命令组合在一起，形成一个可执行的脚本文件，从而实现自动化任务，提高工作效率。无论是系统管理员进行服务器维护，还是开发者进行项目部署，Shell脚本都发挥着重要的作用。本文将详细介绍Shell脚本的基
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开