今天老师讲解了 进程控制编程,其中说到了exec函数族,对这个函数族的函数不了解,现从网上找了一些资料,现整理如下,如有不妥之处还望谅解。
简介 :
说是exec系统调用,实际上在Linux中,并不存在一个exec()的函数形式,exec指的是一组函数,一共有6个,分别是:
NAME
execl, execlp, execle, execv, execvp ,execve- execute a file
RETURN VALUE
If any of the exec() functions returns, an error will have occurred.
The return value is -1, and errno will be set to indicate the error. --出错返回-1
#include <unistd.h>
int execl
(const char *path, const char *arg, ...);
int execl
p
(const char *file, const char *arg, ...);
int execl
e
(const char *path, const char *arg, ..., char *const envp[]);
int execv
(const char *path, char *const argv[]);
int execv
p
(const char *file, char *const argv[]);
int execv
e
(const char *path, char *const argv[], char *const envp[]);
其中只有execve 是真正意义上的系统调用,其它都是在此基础上经过包装的库函数。
后缀字母含义说明:
char *argv_execvp[] = {"echo" ,"executed by execvp" ,(char *)0};
execvp("echo" ,argv_execvp) ;
exec函数族的作用是根据指定的文件名找到可执行文件,并用它来取代调用进程的内容,换句话说,就是在调用进程内部执行一个可执行文件。这里的可执行文件既可以是二进制文件,也可以是任何Linux下可执行的脚本文件。
与一般情况不同,exec函数族的函数执行成功后不会返回,因为调用进程的实体,包括代码段,数据段和堆栈等都已经被新的内容取代,只 留下进程ID等一些表面上的信息仍保持原样,颇有些神似"三十六计"中的"金蝉脱壳"。看上去还是旧的躯壳,却已经注入了新的灵魂。只有调用失败了,它们 才会返回一个-1,从原程序的调用点接着往下执行。
现在我们应该明白了,Linux下是如何执行新程序的,每当有进程认为自己不能为系统和拥护做出任何贡献了,他就可以发挥最后一点余 热,调用任何一个exec,让自己以新的面貌重生 ;或者,更普遍的情况是,如果一个进程想执行另一个程序,它就可以fork出一个新进程,然后调用任何一 个exec,这样看起来就好像通过执行应用程序而产生了一个新进程一样 。
事实上第二种情况被应用得如此普遍 ,以至于Linux专门为其作了优化,我们已经知道,fork会将调用进程的所有内容原封不动的拷贝 到新产生的子进程中去,这些拷贝的动作很消耗时间,而如果fork完之后我们马上就调用exec,这些辛辛苦苦拷贝来的东西又会被立刻抹掉,这看起来非常 不划算,于是人们设计了一种"写时拷贝(copy-on-write)"技术,使得fork结束后并不立刻复制父进程的内容,而是到了真正实用的时候才复 制,这样如果下一条语句是exec,它就不会白白作无用功了,也就提高了效率。
稍稍深入:
上面6条函数看起来似乎很复杂,但实际上无论是作用还是用法都非常相似,只有很微小的差别。在学习它们之前,先来了解一下我们习以为常的main函数。
下面这个main函数的形式可能有些出乎我们的意料:
int main(int argc, char *argv[], char *envp[])
|
它可能与绝大多数教科书上描述的都不一样,但实际上,这才是main函数真正完整的形式。
参数argc指出了运行该程序时命令行参数的个数 ,数组argv存放了所有的命令行参数 ,数组envp存放了所有的环境变量 。环境变量 指的是一组值,从用户登录后就一直存在,很多应用程序需要依靠它来确定系统的一些细节,我们最常见的环境变量是PATH,它指出了应到哪里去搜索应用程 序,如/bin;HOME也是比较常见的环境变量,它指出了我们在系统中的个人目录。环境变量一般以字符串"XXX=xxx"的形式存在,XXX表示变量 名,xxx表示变量的值。
值得一提的是,argv数组和envp数组存放的都是指向字符串的指针,这两个数组都以一个NULL元素表示数组的结尾。
我们可以通过以下这个程序来观看传到argc、argv和envp里的都是什么东西:
/* main.c */
int main(int argc, char *argv[], char *envp[])
{
printf("/n### ARGC ###/n%d/n", argc);
printf("/n### ARGV ###/n");
while(*argv)
printf("%s/n", *(argv++));
printf("/n### ENVP ###/n");
while(*envp)
printf("%s/n", *(envp++));
return 0;
}
|
编译它:
$ gcc main.c -o main
|
运行时,我们故意加几个没有任何作用的命令行参数:
$ ./main -xx 000
### ARGC ###
3
### ARGV ###
./main
-xx
000
### ENVP ###
PWD=/home/lei
REMOTEHOST=dt.laser.com
HOSTNAME=localhost.localdomain
QTDIR=/usr/lib/qt-2.3.1
LESSOPEN=|/usr/bin/lesspipe.sh %s
KDEDIR=/usr
USER=lei
LS_COLORS=
MACHTYPE=i386-redhat-linux-gnu
MAIL=/var/spool/mail/lei
INPUTRC=/etc/inputrc
LANG=en_US
LOGNAME=lei
SHLVL=1
SHELL=/bin/bash
HOSTTYPE=i386
OSTYPE=linux-gnu
HISTSIZE=1000
TERM=ansi
HOME=/home/lei
PATH=/usr/local/bin:/bin:/usr/bin:/usr/X11R6/bin:/home/lei/bin
_=./main
|
我们看到,程序将"./main"作为第1个命令行参数,所以我们一共有3个命令行参数。这可能与大家平时习惯的说法有些不同,小心不要搞错了。
现在回过头来看一下exec函数族,先把注意力集中在execve上:
int execve(const char *path, char *const argv[], char *const envp[]);
|
对比一下main函数的完整形式,看出问题了吗?是的,这两个函数里的argv和envp是完全一一对应的关系。execve第1个参 数path是被执行应用程序的完整路径,第2个参数argv就是传给被执行应用程序的命令行参数,第3个参数envp是传给被执行应用程序的环境变量。
实例
1 #include<unistd.h>
2
3 int main()
4 {
5
6 if(execl("/bin/echo" ,"echo" ,"executed by execl" ,(char *)0) < 0)
7 {
8 perror("Err on execl");
9 }
10 return 0;
11 }
1 #include<unistd.h>
2 int main()
3 {
4 if(execlp("echo" ,"echo" ,"executed by execlp" ,(char *)0) < 0)
5 {
6 perror("Err on execlp");
7 }
8
9 return 0;
10 }
1 #include<unistd.h>
2 int main()
3 {
4 char *argv_execv[] = {"echo" ,"excuted by execv" ,(char *)0};
5 if(execv("/bin/echo" ,argv_execv) < 0)
6 {
7 perror("Error on execv");
8 }
9
10 return 0;
11 }
1 #include<unistd.h>
2 int main()
3 {
4 char *envp[] = {"PATH = /tmp" ,"USER = magic" ,"STATUS = testing" ,( char *)0};
5
6 char *argv_execve[] = {"env" ,(char *)0};
7
8 if(execve("/usr/bin/env" ,argv_execve ,envp) < 0)
9 {
10 perror("Err on execve");
11 }
12
13 return 0;
14 }
程序二 /* e.c */--http://blog.csdn.net/ztz0223/archive/2008/04/14/2291785.aspx
程序里调用了 2 个 Linux 常用的系统命令, echo 和 env , echo 会把后面跟的命令行参数原封不动的打印出来, env 用来列出所有环境变量。
由于各个子进程执行的顺序无法控制,所以有可能出现一个比较混乱的输出 -- 各子进程打印的结果交杂在一起,而不是严格按照程序中列出的次序。
编译并运行:
execle 输出的结果跑到了 execlp 前面。
如果用到了 exec 函数族,一定记得要加错误判断语句。因为与其他系统调用比起来, exec 很容易受伤,被执行文件的位置,权限等很多因素都能导致该调用的失败。最常见的错误是:
1. 找不到文件或路径,此时 errno 被设置为 ENOENT ;
2. 数组 argv 和 envp 忘记用 NULL 结束,此时 errno 被设置为 EFAULT ;
3. 没有对要执行文件的运行权限,此时 errno 被设置为 EACCES 。
参考资料:
http://www.ibm.com/developerworks/cn/linux/kernel/syscall/part3/index.html
http://blog.csdn.net/ztz0223/archive/2008/04/14/2291785.aspx
http://blog.chinaunix.net/u2/72255/showart_2142465.html
http://www.cublog.cn/u2/64851/showart_1905305.html
http://oract.itpub.net/post/19116/407436