shell是命令行解释器,作用是将命令交给bash去执行,而bash将任务交给子进程来完成,这样即使这个任务出现问题,bash也不会受到影响。
而子进程也不是直接去执行任务,而是通过程序替换来完成,所以shell的模拟最重要的两个部分就是创建子进程和程序替换。
创建子进程在 进程概念 中已经提到过,下面先重点介绍进程替换,再模拟实现shell。
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。
函数都以exec开头,后面的字母可以采用如下的理解来记忆
l(list) : 表示采用参数列表
v(vector) : 表示参数用数组
p(path) : 表示在环境变量中搜索程序的路径
e(env) : 表示参数中自定义环境变量
由上可以看出,这6个函数使用时差别不是很大,以execl为例详细讲解。
int execl(const char *path, const char *arg, …);
path是程序的路径,arg是如何执行,“…”是可变参数,必须以NULL结尾。下面举一个例子。
#include
#include
int main()
{
printf("I am a process!\n");
sleep(3);
// 路径 ls 命令行参数 以NULL结尾
execl("/usr/bin/ls", "ls", "-a", "-i", "-l", NULL);
return 0;
}
最后程序的结果显然与动图中上面运行ls -a -i -l的结果相同。
这样在我写的myproc进程内就可以调用其他的程序(比如ls)。
进程替换不会创建新的进程,直接用新的代码和数据替换原来的代码和数据,所以进程替换后的代码不会执行,直接被替换了。
#include
#include
int main()
{
printf("I am a process!\n");
sleep(3);
execl("/usr/bin/ls", "ls", "-a", "-i", "-l", NULL);
printf("you can't see me!\n");//看看这句代码是否被执行
return 0;
}
结果没有打印you can’t see me!,所以可验证上面的结论。
程序替换也是可能失败的,下面以路径错误为例看结果。
#include
#include
int main()
{
printf("I am a process!\n");
sleep(3);
//正确路径这里是usr/bin/ls
execl("/us/bin/ls", "ls", "-a", "-i", "-l", NULL);
printf("you can't see me!\n");//看看这句代码是否被执行
return 0;
}
因为进程替换失败,所以后面的代码和数据都不会被替换,继续跑下面的代码。
所以说,exec系列的函数从使用上来说不需要判断返回值,只要返回就是失败。
一般调用exec系列的函数,多是创建子进程,然后将子进程的代码和数据替换掉,执行其他的程序。与上面的代码功能相同,新的代码如下。
#include
#include
#include
#include
#include
int main()
{
pid_t id = fork();
if (id == 0)
{
printf("I am a process!\n");
sleep(3);
execl("/usr/bin/ls", "ls", "-a", "-i", "-l", NULL);
exit(10);
}
int status = 0;
pid_t ret = waitpid(id, &status, 0);
if (ret > 0 && WIFEXITED(status))
{
printf("signal:%d\n", WIFEXITED(status));
printf("exit code:%d\n", WEXITSTATUS(status));
}
return 0;
}
先以ls为例说明一下shell的大概流程。
用下图的时间轴来表示事件的发生次序。其中时间从左向右。shell由标识为sh的方块代表,它随着时间的流逝从左向右移动。
shell从用户读入字符"ls",然后建立一个新的子进程,接着在新创建的进程中运行ls程序并等待那个进程结束。
然后shell读取新的一行输入,建立一个新的进程,在这个进程中运行程序 并等待这个进程结束。
所以要写一个shell,需要循环以下过程:
首先命令行前有如下的提示符:
这些内容可以通过gethostname来获取。
用如下代码获取主机名:
#include
#include
#include
#include
#include
int main()
{
char name[100];
while (1)
{
gethostname(name, sizeof(name));
printf("%s\n", name);
}
return 0;
}
在下面的代码中,直接用我自己虚构的主机名带代表模拟的shell。
#include
#include
#include
#include
#include
#include
#define LEN 1024//读入的字符个数最多1024个
#define NUM 32//命令+命令行参数最多32个
int main()
{
char cmd[LEN];
while (1)
{
//打印提示符
printf("[yh@my_centos dir]& ");
//获得用户输入(其实就是一个字符串)
fgets(cmd, LEN, stdin);//从标准输入(一般是键盘)读入用户输入的字符串
cmd[strlen(cmd) - 1] = '\0';//最后一个位置本来是'\n'
//解析字符串
char* myArg[NUM];
//输入的字符串至少有第一个命令
myArg[0] = strtok(cmd, " ");//以空格为分割符先分割出命令
int i = 1;
//拿到之后的命令行参数
while (myArg[i] = strtok(NULL, " "))//默认从上一次的子串中提取,所以传NULL
{
i++;
}
//让子进程执行命令
pid_t id = fork();
if (id == 0)
{
//child
execvp(myArg[0], myArg);
exit(11);
}
int status = 0;
pid_t ret = waitpid(id, &status, 0);
if (ret > 0 && WIFEXITED(status))
{
printf("signal:%d,", WIFEXITED(status));
printf("exit code:%d\n", WEXITSTATUS(status));
}
}
return 0;
}
但也有一些命令不能实现,比如用’;‘隔开的两个命令、使用’|'管道时、cd等命令等等,有些是因为程序中处理字符串时没有考虑、有些是因为命令本身不是由fork完成的。
这里模拟实现shell只是为了将fork和进程替换用起来,所以难免会有缺陷。