理解 Bash 的 if 语句

最近在看《鸟哥的Linux私房菜》学习shell script,写if语句怎么写也有错,所以从网上找了一篇文章供自己还有大家参考:

写 bash 脚本的日子也不短了,但是每次用到 if 语句时大脑还是会卡壳一下,要翻教程和看以前的代码,因为条件部分语法神出鬼没,捉摸不定,于是我还是花点时间狠狠研究了一下,写了这篇文章做总结。

诡异的语法

一般 bash 教程给出的语法示例基本就是:

if condition; then
    echo yes
else
    echo no
fi

看起来很简单,除了 condition 外(也就是条件部分),其余关键字都没什么难懂了,顶多注意一下写在同一行要加分号。

但条件部分代码说得不明不白,只是列出一堆实际例子,例如判断文件存在可以用 [ -f file ],判断目录用[ -d dir ] 等等。这些例子也不算复杂,但是真写起来,想构造复杂点条件都能让你调试到欲仙欲死。

所以这篇文章说理解 if 语句,就是指理解 if 语句的条件部分。

大概有如下问题:

  • 为毛是用方括号,不是小括号?

  • 为毛见到有的代码用两个方括号,有的还是两个小括号?

  • 为毛有时比较字符串相等可以用 -eq,但又可以用等号?

  • 为毛有时还能直接用命令,命令到底要不要加反单引号呢?

  • 写了句复合条件,结果一堆看不懂的语法错误?

  • 测试好麻烦啊,每次都要 if/then/else 整句写全,有没有简单点测试方法?

五花八门的语法一直让我无比纠结,一般编程语言的 if 语句说明都不过半页,但是 bash 的 if 语句,我看了好几本书和教程,都没搞清楚,不能一口气就能写出来,而是要翻教程和看以前的代码,反复调试。

最后是靠 Advanced Bash-Scripting Guide 这本书搞清楚的。

条件部分的意义

很多教程都这么说:condition 的代码执行后,如果结果为 true,就继续执行 then 部分,否则继续执行else 部分。跟其它语言的一样的,没区别,例如 [ -f file ] 判断文件是否存在,文件存在就是 true 了,不存在就是 false 了。

说 true 和 false,也就是执行结果是个布尔值,这么说就是造成条件部分难写的原因,被这个说法误导了,所以要换一个角度看。

应该说 condition 的代码正常执行

什么叫「正常执行」呢?这里要搞懂一个叫「退出状态码」(exit status)概念,有时候也叫「返回状态码」(return code)。也就是子进程退出时向调用它的父进程返回的一个整数值,一般编程语言都有个 exit() 函数来直接退出,这个函数的参数就是返回给父进程的状态码,不传默认就是 0。

对于 bash 来说,调用过的子进程的返回状态码保存在 $? 环境变量中,每执行过一个命令后都会被更新,可以用 echo 来查看。

$ ls; echo $?
0

按 unix 的规范,返回状态码为 0 就是表示正常执行,其它值都表示不正常。

非要当成布尔值看待的话,可以这样想:为 0 就是正常,正常就是 true,不为 0 就是不正常,不正常就是 false。这跟其它语言 0 当 false 不同,所以特容易搞反。

但是返回什么值是程序自己决定的,一般常见 unix 程序都会仔细定义状态码。

对于 ls 来说,列得到文件表示正常:

$ ls exists.txt; echo $?;
exists.txt
0
$ ls not_exists.txt; echo $?;
ls: cannot access not_exists.txt: No such file or directory
2

对于 grep 来说,有匹配表示正常:

$ echo 'abc' | grep 'a'; echo $?
abc
0
$ echo 'abc' | grep 'd'; echo $?
1

或者具体点说,condition 的代码执行后,这时候环境变量 $? 的值是否为 0

先定义一下用语,ls、grep 这些这里称为「程序」,而「命令」是指在提示符(即交互 shell)里打的整条字符串,「程序」名称加上参数或管道就是一条「命令」了。

下面来逐步解释一下。

test 程序

如果要检查文件是否存在,只要找到一个程序,存在文件返回状态码 0,不存在就返回非 0 就行了,上面的 ls 就这样了。

然后构造一个 ls 命令来判断,不需要反单引号包围,套到 if 语句里:

$ if ls exists.txt; then echo yes; else echo no; fi
exists.txt
yes
$ if ls not_exists.txt; then echo yes; else echo no; fi
ls: cannot access not_exists.txt: No such file or directory
no

可以把 if 关键词的作用当成:判断后面跟着的命令的 $? 是否为 0。

这里 ls 也输出我们不需要的信息,因为我们只让它更新 $? 就够了,要屏蔽掉这些输出:

$ if ls exists.txt &> /dev/null; then echo yes; else echo no; fi
yes
$ if ls not_exists.txt &> /dev/null; then echo yes; else echo no; fi
no

加上了 &> /dev/null 略显丑陋,那有没有其它程序仅仅更新 $? 但没有任何输出呢?

这就是 test 程序了,用 -f 参数表示判断是否存在文件,先检查下:

$ test -f exists.txt; echo $?
0
$ test -f not_exists.txt; echo $?
1

确实无误,套上 if 语句:

$ if test -f exists.txt; then echo yes; else echo no; fi
yes
$ if test -f not_exists.txt; then echo yes; else echo no; fi
no

这里的「文件」指普通文件,如果我要判断其它类型的文件,例如目录、软链接或管道呢?test 也提供判断这些文件类型的参数,可以通过 man test 查看手册。

单方括号语法糖

如果你打开了 test 的 man 后,发现几个眼熟的东西:

SYNOPSIS
    test EXPRESSION
    test

    [ EXPRESSION ]
    [ ]
    [ OPTION

bash 给 test 程序特殊优待,可以用另一种语法来编写,也就是把 test 的参数包围在单个方括号里。

即 test args 也可以写成 [ args ],注意方括号和里面的参数要留个空格,不然提示语法错误,我曾经就被这样折腾了半天。

也可以在直接在提示符里执行,效果跟用普通方法没差别:

$ [ -f exists.txt ]; echo $?
0
$ [ -f not_exists.txt ]; echo $?
1

套上 if 语句:

$ if [ -f exists.txt ]; then echo yes; else echo no; fi
yes
$ if [ -f not_exists.txt ]; then echo yes; else echo no; fi
no

这就是为什么 if 条件部分用的是单个方括号,bash 会把这个写法转换回一般写法,所以说是语法糖。

为什么要提供这个语法糖呢?估计 bash 觉得这样写更好看吧,也让你打少两个字符。但是这个语法糖,迷惑了我好多年,那么小括号有什么用?

单个小括号的作用

单个小括号在 bash 中不像其它语言那样表示分隔符和优先级调整,而是启动一个 subshell 来执行里面的代码,也就是再启动一个 bash 来运行,好处是 subshell 有独立的环境变量。

例如,你在 home 目录,cd 到 /tmp 目录,sleep 5 秒,最后 cd 回 home,但是你会在 sleep 的过程中按Ctrl + c 中断。

如果你使用这个命令:

~$ cd /tmp/; sleep 5; cd ~
^C
/tmp$

你会留在 /tmp 目录中,因为最后的 cd ~ 根本没执行。所以如果你希望临时切换别的目录执行某些命令,但又希望中断后回到原来的目录,这个方法就不凑效了。

但是如果你加上小括号:

~$ ( cd /tmp/; sleep 5; )
^C
~$

这里没有最后的 cd ~,因为多此一举,subshell 有自己的工作目录,相当于你另外开一个终端而已,这样避免一些环境变量被某些代码弄乱。

取反操作

你会想当然认为就是加 ! 符号:

$ [ ! -f exists.txt ]; echo $?
1

确实对了,但是这只是 test 命令里的内部取反,而不是 bash 的,换回一般写法就是:

$ test ! -f exists.txt; echo $?
1

对于 bash 的取反,也就是不正常运行 $? 应该为 0,也是在命令开头加 !:

$ ! test -f exists.txt; echo $?
1
$ ! test -f not_exists.txt; echo $?
0

注意 ! 后要有一空格,不然在提示符中会被当成「调用历史命令」解析了,但以脚本执行时不会,反正都加上最好。

于是这样就是蛋疼的双重否定了:

$ ! test ! -f exists.txt; echo $?
0

数字和字符串比较

如果你想比较数字是否相等,想当然写成:

$ [ 3 == 1 ]; echo $?
1
$ [ 3 != 1 ]; echo $?
0

相等也可以用单个等号,用两个比较符合习惯。但是等号左右一定要有空格,否则结果不如你想,因为没空格就是变量赋值!

如果你想比较两个数字,于是这样写:

$ [ 3 > 1 ]; echo $?
0

看起来也如你想的一样,但是如果:

$ [ 3 > 6 ]; echo $?
0

这是搞毛啊?赶紧 ls 一下看看当前目录是不是多了两个名字为 1 和 6 的空文件。

那是因为 > 不是表示大于,而是标准输出重定向,因为标准输出为空,所以只建立了空文件,相当于 touch 命令了。

所以要对 > 符号转义,这样就 OK 了:

$ [ 3 \> 1 ]; echo $?
0
$ [ 3 \> 6 ]; echo $?
1

别高兴得太早,这里还有坑:

$ [ 3 \> 10 ]; echo $?
0

因为这不是按数字比较,而是按字符串,这里 3 和 10 在 bash 眼中就是字符串,传给 test 后,test 默认也是当成字符串。

如果显式加上单引号,就清楚了:

$ [ '3' \> '10' ]; echo $?
0

字符串比较就是按 ASCII 编码比较,因为先比较第一个字符,3 比 1 的 ASCII 编码大。

所以上面的几个比较其实全部都是字符串比较,只不过长度一样的话,看起来就是按数字比较。

如果想按数字大小怎么办?可以用 -gt 参数,这样 test 就会把两边当成一个数字看待:

$ [ 3 -gt 1 ]; echo $?
0
$ [ 3 -gt 6 ]; echo $?
1
$ [ 3 -gt 10 ]; echo $?
1

同样,-eq 也是按数字比较:

$ [ 1 == 01 ]; echo $?;
1
$ [ 1 -eq 01 ]; echo $?;
0

复合条件

假如你要再判断某个目录是否存在,又想当然写成:

$ [ -f exists.txt && -d exists_folder ]; echo $?
bash: [: missing `]'
2

结果提示漏了右括号,那是因为 && 被 bash 预先解析了,而不是当成 test 的参数传递。

  • && 表示如果左边的命令正常执行了,那么继续执行右边的命令,相当于没有 else 部分的 if 语句简化版。

  • 而 || 表示如果左边的命令不是正常执行了,那么继续执行右边的命令,相当于没有 then 部分的 if 语句(或者 if not)。

从效果看也可以分别当成逻辑与和逻辑或的。

所以上面那条命令以 && 分开看,左边的 [ -f exists.txt 明显是个不完整命令,漏了个 ],当然右边的也漏了 [。

修正如下:

$ [ -f exists.txt ] && [ -d exists_folder ]; echo $?
0

换回一般写法也应该是:

$ test -f exists.txt && test -d exists_folder; echo $?
0

使用 || 则是:

$ [ -f not_exists.txt ] || [ -d exists_folder ]; echo $?
0

如果你想先把 && 和 || 转义,但 test 不支持这个参数,表示逻辑与和逻辑或的参数分别是 -a 和 -o,所以这样就 OK 了:

$ [ -f exists.txt -a -d exists_folder ]; echo $?
0
$ test -f exists.txt -a -d exists_folder; echo $?
0

这样好处就是只调用了一次 test 程序而不是两次。

双方括号关键词

上面我们用 [ -f exists.txt && -d exists_folder ] 来表示复合条件,结果发现这是一个坑,于是 bash 后来从 ksh 抄来一个特性来填这个坑,结果挖了更大的一个坑。

把单括号换成双括号就 OK 了:

$ [[ -f exists.txt && -d exists_folder ]]; echo $?
0

震惊之情溢于言表,&& 不是隔开两个命令么,怎么用两个方括号又合法了?

前面说说单方括号是语法糖,因为只是 test 命令的另一种写法,bash 最后会调用程序 test,一般就是 /usr/bin/test。

用 type 程序看下类型:

$ type [
[ is a shell builtin
$ type test
test is a shell builtin

又说这是叫 builtin,坑爹,不过常用命令如 cd、echo 都是这样的。

但是说双方括号是「关键词」,关键词就是 bash 自己内建的语法分析:

$ type [[
[[ is a shell keyword

就因为这是关键词,所以被双方括号包围的代码都有另外一种意义,&&、||、> 和 < 这些符号的意义都被改变了,就和其它编程语言的用法一样了。

例如上面的比较大小,对 > 不再需要转义了:

$ [[ 3 > 1 ]]; echo $?
0

但依然是表示按字符串比较,不是按数字:

$ [[ 3 > 10 ]]; echo $?
0

可以看作增强版的 test,因为逻辑与和逻辑或已经可以直接用 && 和 ||,所以 -a,-o 就不能用了,其余的参数和 test 基本一样,-f 和 -d 也可以用。

还可以用 =~ 来检查是否匹配正则,简单的就不用劳烦 grep 了:

$ [[ abc =~ a ]]; echo $?
0

因为对 && 那几个符号自动转义了,比较直观,不容易搞错,相对安全,所以推荐优先使用 [[ 而不是 [。

双小括号的作用

双小括号的作用就是把里面的代码作为算术表达式来执行,像双方括号一样,里面的代码有另外的意义。

例如给变量赋值:

$ a=1+1; echo $a
1+1
$ (( b = 1 + 1 )); echo $b
2

a 的 1+1 只是一个字符串,而 b 就是一个算术表达式结果。

正是因为是算术表达式,所以比较也是按数字本身而不是字符串:

$ (( 3 > 1 )); echo $?
0
$ (( 3 > 6 )); echo $?
1
$ (( 3 > 10 )); echo $?
1

所以也可以套上 if 语句来用:

$ if (( 3 > 1 )); then echo yes; else echo no; fi
yes

真令人抓狂。

一些技巧

可以组合多个命令:

$ if echo abc; echo def; then echo yes; else echo no; fi
abc
def
yes

也可以用管道:

$ if echo abc | grep -q a; then echo yes; else echo no; fi
yes

太长或太复杂的话可以用函数封装:

$ function echo_abc() { echo abc | grep -q a; }
$ if echo_abc; then echo yes; else echo no; fi
yes

如果需要保留命令的标准输出到变量以便再使用,可以直接比较 $? 的值,单纯赋值不改变 $? 的:

$ text=`echo abc | grep a`;
$ if [[ $? == 0 ]]; then echo 'text:' $text; else echo no; fi
text: abc
$ text=`echo abc | grep d`;
$ if [[ $? == 0 ]]; then echo 'text:' $text; else echo no; fi
no

总结

亲自动手测试了这么多个例子,总算搞把各种堆在一起的概念一一分解开来理解,至少写起来都知道该看参考手册的那一部分了。

感觉依然是:到处都是坑啊!

你可能感兴趣的:(bash,if)