为什么80%的码农都做不了架构师?>>>
问题
ansible调用playbook远程mvn执行打包时发现执行出错,找不到JAVA_HOME
。
我们的exporter JAVA_HOME=/usr/java/jdk1.8.0
写在/etc/profile
中,登录时可以正常执行打包并打印JAVA_HOME
。
排查过程
- 在playbook中执行
echo $JAVA_HOME > /tmp/test.log
,为空 - 在playbook中添加
echo $PATH > /tmp/test.log
,同时在远端服务器登录执行echo $PATH > /tmp/test.log
,结果不同,ansible执行的要少很多路径 - 在
~/.bash_profile
中添加环境变量,与/etc/profile
结果一致 - 考虑ansible执行的环境变量与登录时使用的环境变量不同,所以将
JAVA_HOME
写在/etc/bashrc
中,再次测试echo $JAVA_HOME > /tmp/test.log
,正常打印 - 至此,确定ansible执行过程中并未调用
/etc/profile和~/.bash_profile
原因
login shell 和 non-login shell
查阅相关文档,以及咨询大佬后,得出如下结果。
* 我们登录执行的是login shell,会加载/etc/profile,~/.bash_profile
* ansible这类ssh远程执行是non-login shell,不会加载etc/profile,~/.bash_profile,而是加载etc/bashrc和~/.bashrc
首先了解一下login shell 与 non-login shell
《鸟哥的Linux私房菜基础学习篇》里这样描述/etc/profile及/etc/bashrc的区别:
* login shell:取得bash时需要完整的登入流程的,就称为login shell。举例来说,你要由tty1~tty6登入,需要输入用户的账号和密码,此时取得的bash就称为『login shell』啰;
* non-login shell:取得bash接口的方法不需要重复登入的举动,举例来说,(1)你以Xwindow登入Linux后,再以X的图形化接口启动终端机,此时那个终端接口并没有需要再次的输入账号和密码,那个bash的环境就称为non-login shell了。(2)你在原本的bash环境下再次下达bash这个命令,同样的也没有输入账号密码,那第二个bash (子程序)也是non-login shell 。
我们查看~/.bash_profile,发现里面有这样一段内容:
if [ -f ~/.bashrc ]; then
. ~/.bashrc
fi
- 1
- 2
- 3
当~/.bashrc存在时,login shell 会引入~/.bashrc的环境变量
我们再看~/.bashrc,发现一段类似的内容:
if [ -f /etc/bashrc ]; then
. /etc/bashrc
fi
- 1
- 2
- 3
当/etc/bashrc存在时,login shell会引入/etc/bashrc内的环境变量
也就是说:
* login shell加载环境变量的顺序是:① /etc/profile ② ~/.bash_profile ③ ~/.bashrc ④ /etc/bashrc
* 而non-login shell加载环境变量的顺序是: ① ~/.bashrc ② /etc/bashrc
验证
我们通过在~/.bash_profile和~/.bashrc中引用不同的变量计算来验证上述问题
* 在~/.bash_profile中引入变量AAA=$((AAA+1))
注意:引入的变量一定要置于引入~/.bashrc之前,否则会出现运算时AAA还未赋值的情况!!!
export AAA=$((AAA+1))
- 1
- 在~/.bashrc中引入变量AAA=$((AAA+10))
export AAA=$((AAA+10))
- 1
login shell
按照环境变量的加载顺序:
- ~/.bash_profile
AAA=$((AAA+1)),AAA为空,AAA=$((AAA+1))=1
- ~/.bashrc
AAA=$((AAA+10)),AAA=1,AAA=$((AAA+10))=11
运行结果
[root@ ~]# echo $AAA
11
- 1
- 2
验证通过
non-login shell
采用ssh远程执行来验证
按照环境变量的加载顺序:
- ~/.bashrc
AAA=$((AAA+10)),AAA为空,AAA=$((AAA+10))=10
运行结果
[root@ ~]# ssh [email protected] 'echo $AAA'
[email protected]'s password:
10
- 1
- 2
- 3
验证通过
login shell下启动bash子进程
bash子进程是一个non-login shell,但是它会继承父进程中的环境变量
按照环境变量的加载顺序:
- 父进程,引入~/.bash_profile
AAA=$((AAA+1)),AAA为空,AAA=$((AAA+1))=1
- 父进程,引入~/.bashrc
AAA=$((AAA+10)),AAA=1,AAA=$((AAA+10))=11
- 子进程,继承父进程环境变量,引入~/.bashrc
AAA=$((AAA+10)),AAA=11,AAA=$((AAA+10))=21
运行结果
# 父进程
[root@ ~]# echo $AAA
11
# bash子进程,继承AAA=11
[root@ ~]# bash
[root@ ~]# echo $AAA
21
# 子进程的子进程,继承AAA=21
[root@ ~]# bash
[root@ ~]# echo $AAA
31
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
验证通过
结论
- ansible这类远程执行的non-login shell 并不会加载/etc/profile和~/.bash_profile下的环境变量,只是加载~/.bashrc和/etc/bashrc
- 如果需要在ansible中执行需要特定环境变量的命令,可以在执行前source一下~/.bash_profile, 或者将环境变量写在~/.bashrc 。