环境变量我们早已听说过,比如在学习 JAVA 或者 Python 的时候,会在 windows 上配置环境变量:
可环境变量到底是什么呢?
环境变量 (environment variables) 一般是指在操作系统中用来指定操作系统运行环境的一些参数。
这些参数通常有特殊的用途。
比如:我们在编写 C/C++ 代码的时候,在链接的时候,我们从来不知道我们所链接的动态静态库在哪里,但是照样可以链接成功,生成可执行程序,原因就是有相关环境变量帮助编译器进行查找。
环境变量通常具有某些特殊用途,环境变量在系统当中通常具有全局特性。
常见环境变量:
PATH:(当前用户)指定命令的搜索路径。
HOME:指定当前用户的主工作目录(即用户登陆到 Linux 系统中时,默认的目录)。
SHELL:当前 shell,即当前用户使用的命令行解释器的版本,它的值通常是 /bin/bash。
HISTSIZE:命令历史记录保存数量。(centos 6.7 默认是 3000 条)
命令 history 可以查看所有命令历史记录。搭配管道
history | wc -l
可以查看命令历史记录的行数。
思考:
其实我们听过的:程序、命令、指令、可执行程序等等,其实都是一个概念,是同一个东西。(⭐)
思考:
分析:
环境变量 PATH 中保存的是指定命令的搜索路径。
因为 ls
等命令是在系统的特定路径下保存起来的。
而我们的 proc
命令没有保存在 PATH 指定的这些路径中,而系统执行命令只会在 PATH 指定的这些路径中搜索,所以系统找不到我们的 proc
命令,就报错了。
思考:
那有没有什么办法,可以让可执行程序 proc
不用带 ./
当前路径就可以直接运行呢?
方法1:把 proc
拷贝到环境变量 PATH 指定的任一路径下。
方法2:把 proc
所在路径添加到环境变量 PATH 中。(注意:我们自己添加的环境变量,系统重启后不会被保存)
$ PATH=$PATH:/home/ll/xxx/10
# :冒号是分隔符
# 注意:PATH=/home/ll/xxx/10,不能这样写,必须加上$符号,否则会把PATH中所有内容覆盖掉
运行效果图:
注意:
如果我们不幸把环境变量给覆盖掉了,不用担心,环境变量既然是变量,说明它是可以被赋值的,即在用户登录的时候,通过用户目录下的配置文件赋值的,所以只需要重新登录下就好了。
比如:家目录下的 .bash_profile 文件,这些文件不建议自己去随意修改:
分别在 root 和普通用户下执行 cd ~ 和 pwd 查看家目录,分别是 /root
和 /home/ll
,为什么不一样呢?
是因为不同用户的家目录中的配置文件不一样,所以不同用户下的环境变量 HOME 也是不一样的:
[ll@VM-0-12-centos ~]$ echo $HOME # 指定用户的主工作目录
/home/ll
[root@VM-0-12-centos ~]$ echo $HOME
/root
getenv 和 setenv 函数介绍:
#include
/*
* name: 环境变量的名称
* 返回值: 环境变量的内容
*/
char *getenv(const char *name); // 获取环境变量
int setenv(const char *name, const char *value, int overwrite); // 更改或添加环境变量
getenv 使用举例:
/* proc.c */
#include
#include // getenv
int main()
{
printf("%s\n", getenv("PATH"));
printf("%s\n", getenv("HOME"));
printf("%s\n", getenv("SHELL"));
return 0;
}
运行结果:在 bash 创建的子进程 proc
中成功获取到了环境变量。
⭐ 结论:
在命令行中,我们通常可以定义两种变量:
环境变量(环境变量通常具有全局属性 ⭐:可以被子进程继承下去 ⭐)
环境变量实际上是在当前 bash 的上下文中定义的。
所以在当前命令行解释器 bash 内可以被访问到,在 bash 创建的子进程内也可以被访问到。
本地变量(只能在当前 shell 命令行解释器内被访问,不可以被子进程继承)
[ll@VM-0-12-centos 10]$ MY_VAL="hello world" # 定义本地变量(在bash内定义的)
如何查看本地变量呢?和查看环境变量方式一样:
[ll@VM-0-12-centos 10]$ echo $MY_VAL # 在当前命令行解释器bash内访问本地变量
hello world
思考:如何证明本地变量不能被子进程继承
/* proc.c */
#include
#include // getenv
int main()
{
printf("%s\n", getenv("MY_VAL"));
return 0;
}
运行结果:段错误。
分析:
当我们输入
./proc
后,bash 会创建子进程 来执行proc
程序,但因为本地变量MY_VAL
只能在当前 bash 内被访问,不能被其子进程继承,所以子进程中的getenv("MY_VAL")
函数获取不到本地变量MY_VAL
,导致程序报错。
那该怎么办呢?—— 我们可以将本地变量 MY_VAL
设置成环境变量。
[ll@VM-0-12-centos 10]$ exprot MY_VAL # 把本地变量MY_VAL导出成环境变量
再次运行程序:成功访问到了环境变量 MY_VAL
。
思考:
上面说到,我们在命令行上运行的大部分命令,都是 bash 创建子进程来执行的,而本地变量不能被子进程继承,那为什么使用 echo
命令,却可以访问本地变量呢?
思考:main 函数可以带参数吗?能带几个参数呢?—— 可以带参,但大部分都是缺省。
举个例子:
/*
* argc: 命令行参数的个数
* argv: 字符指针数组(指向各个命令行参数的字符指针所构成的数组)
*/
int main(int argc, char* argv[]) // 接收命令行参数
{
for (int i = 0; i < argc; i++) {
printf("argv[%d]: %s\n", i, argv[i]); // 遍历字符指针数组argv
}
return 0;
}
运行结果:字符数组中只有一个元素,就是我们输入的命令
[ll@VM-0-12-centos 10]$ ./proc
argv[0]: ./proc
如果再多输入几个参数,就能观察到如下运行结果:
[ll@VM-0-12-centos 10]$ ./proc agr1 arg2 arg3
argv[0]: ./proc
argv[1]: agr1
argv[2]: arg2
argv[3]: arg3
总结:
实际上我们输入的命令行参数,就是一个个的 C 字符串: ”./proc”、“arg1”、“arg2”、“arg3”,传给了 main 函数:
思考:
举个小例子,比如我想要实现这样一个计算器:
如果输入 ./cal
,则会提示该程序的正确用法:Usage: ./cal -[a|s] x y
;
输入 ./cal -a 1 2
,cal 程序可以输出 1 + 2 的结果;
输入 ./cal -s 4 2
,cal 程序可以输出 4 - 2 的结果。
#include
#include // atoi -- 函数原型:int atoi(const char *nptr); // 将C字符串转换成整数
#include // strcmp
// cal命令的用法手册
void Usage(const char* cal) {
printf("Usage: %s -[a|s] x y\n", cal);
}
int main(int argc, char* argv[]) // 接收命令行参数
{
// 输入的参数个数不为4
if (argc != 4) {
Usage(argv[0]);
return 1; // 退出程序
}
// 保存第3个和第4个参数
int x = atoi(argv[2]);
int y = atoi(argv[3]);
// 根据不同参数,执行不同功能,然后输出结果
if (strcmp(argv[1], "-a") == 0) {
printf("%d + %d = %d\n", x, y, x + y);
}
else if (strcmp(argv[1], "-s") == 0) {
printf("%d - %d = %d\n", x, y, x - y);
}
else {
Usage(argv[0]);
return 1; // 退出程序
}
return 0;
}
运行结果:
[ll@VM-0-12-centos 10]$ ./cal # 命令使用手册
Usage: ./cal -[a|s] x y
[ll@VM-0-12-centos 10]$ ./cal -a 1 2 # 实现加法
1 + 2 = 3
[ll@VM-0-12-centos 10]$ ./cal -s 4 2 # 实现减法
4 - 2 = 2
命令行参数可以让同一个命令,通过带上不同的选项,表现出不同的功能和作用。比如:ls -l
、ls -l -a
、ls -l -a -i
。这就是命令行参数的意义。
我们平常在 VS 中写代码,都知道程序是从 main 函数开始执行,那是谁调用的 main 函数呢?
编程者写的 main 函数被 void mainCRTStartup(void)
函数调用的,这个函数定义在 VS 安装目录的某个 .c 文件中(VS 的版本不同,存放的位置也不同),它会执行一些初始化操作,如从内核中获取命令行参数和环境变量值、初始化全局变量、初始化 IO 等等所需各项准备之后,为调用 main(argc, argv, env)
函数做好了准备。(⭐)
我们可以通过 main 函数的参数,可以传递命令行参数和环境变量。(⭐)
main 函数除了可以传递两个和命令行参数相关的参数 argc 和 argv 以外,还可以传递第三个参数 env:
int main(int argc, char* argv[], char* env[]);
这也是 main 函数获取环境变量的方式。(⭐)
通过给 main 函数第三个参数传参,把一个个环境变量传递给当前程序,当前程序运行起来变成进程,就意味着当前这个进程获取到了这些环境变量。
每个被 bash 创建的子进程都会接收到一张环境表,环境表是一个字符指针数组,每个指针指向一个以 ’\0’
结尾的字符串(环境变量)。
/* proc.c */
#include
#include
int main(int argc, char* argv[], char* env[]) // 通过第三个参数接收环境变量
{
for (int i = 0; env[i]; i++) { // 循环结束条件为env[i],遍历到NULL停止
printf("env[%d]: %s\n", i, env[i]); // 遍历字符指针数组env
}
return 0;
}
运行结果:获取到了当前 bash 内的所有环境变量。(因为环境变量被 bash 创建的子进程 proc
继承下去了)
所以现在大家应该知道 C 库函数 getenv
的实现原理了,比如 printf("%s\n", getenv("PATH"));
,其实就是通过在字符指针数组 env 中进行字符匹配,找到 "PATH"
后面的内容并返回。
C/C++ 提供了一个全局二级指针变量 char** environ
,指向存放环境变量地址的字符指针数组 char* env[]
。
#include
int main()
{
extern char **environ;
for (int i = 0; environ[i]; i++) {
printf("%s\n", environ[i]); // 等价于 *(environ + i)
}
return 0;
}
// 注意:libc中定义的全局变量 environ 指向环境变量表,environ 没有包含在任何头文件中,所以在使用时要用extern声明
拓展:下面程序运行会报错吗?—— 不会。
#include
void show() {
printf("hello show\n");
}
int main()
{
show(10, 20);
return 0;
}
分析:10 和 20 这两个参数是传给了 show 函数,它们被压入了 show 函数栈帧中,实际上在 show 函数中是可以通过某些指针操作来获取到 10 和 20 的,只是比较复杂。上述程序中的二级指针 environ 一样的可以通过某种方式在 main 的压栈结构中指向传入的命令行参数 char* env[]
(环境变量表),来获取到环境变量。