在 bash 中,通常使用 ${parameter}
表达式来获取 parameter 变量的值,这是一种参数扩展 (parameter expansion)。
Bash 还提供了其他形式的参数扩展,可以对变量值做一些处理,起到操作字符串的效果。例如:
-
${parameter^^pattern}
把 parameter 变量值中匹配 pattern 模式字符的小写字母转成大写。 -
${parameter,,pattern}
把 parameter 变量值中匹配 pattern 模式字符的大写字母转成小写。 -
${parameter/pattern/string}
把 parameter 变量值中匹配 pattern 模式的部分替换为 string 字符串。
注意:这些表达式都不会修改 parameter 自身的变量值,它们只是基于 parameter 变量值扩展得到新的值。
如果要保存这些值,需要赋值给具体的变量。
查看 man bash 的 Parameter Expansion 小节,就能看到相关说明。具体举例说明如下。
${parameter^^pattern} 和 ${parameter,,pattern}
查看 man bash 对 ${parameter^pattern}, ${parameter^^pattern}, ${parameter,pattern}, ${parameter,,pattern}
的说明如下:
Case modification.
This expansion modifies the case of alphabetic characters in parameter. The pattern is expanded to produce a pattern just as in pathname expansion.The ^ operator converts lowercase letters matching pattern to uppercase; the , operator converts matching uppercase letters to lowercase.
The ^^ and ,, expansions convert each matched character in the expanded value; the ^ and , expansions match and convert only the first character in the expanded value.If pattern is omitted, it is treated like a ?, which matches every character.
If parameter is @ or *, the case modification operation is applied to each positional parameter in turn, and the expansion is the resultant list.
If parameter is an array variable subscripted with @ or *, the case modification operation is applied to each member of the array in turn, and the expansion is the resultant list.
即,这四个表达式会在 parameter 变量值中匹配 pattern 模式,并对匹配的字符进行大小写转换:
-
^
操作符把小写字母转换为大写,且只转换开头的第一个字符 -
,
操作符把大写字母转换为小写,且只转换开头的第一个字符 -
^^
操作符把小写字母转换为大写,会转换每一个匹配的字符 -
,,
操作符把大写字母转换为小写,会转换每一个匹配的字符
这里的 pattern 模式可以使用通配符进行扩展,注意不是用正则表达式。
注意:^
和 ,
不是转换第一个匹配到的字符,而是只转换 parameter 变量值的首字符。
所给的 pattern 模式必须和 parameter 变量值的首字符匹配才会转换,不会转换字符串中间的字符。
具体举例说明如下:
$ value="This Is a Test String."
$ echo ${value^t}
This Is a Test String.
$ echo ${value^^t}
This Is a TesT STring.
$ echo ${value,T}
this Is a Test String.
$ echo ${value,,T}
this Is a test String.
可以看到,使用 ${value^t}
不会把 value 变量值中间小写的 t
字符换行为大写。
因为这个表达式只匹配和转换 value 变量值的首字符,value 变量值并不是以小写字母 t
开头,不做转换。
而 ${value^^t}
表达式会匹配 value 变量值中的每一个小写字母 t
,并转换为大写。
所以输出结果里面不再有小写的 t
字符。
类似的,${value,T}
表示把 value 变量值开头的大写 T
转换为小写的 t
。 ${value,,T}
表示把 value 变量值所有的大写 T
转换为小写的 t
。
如果省略 pattern 模式,则表示匹配任意字符,但并不表示会转换所有字符,^
和 ,
操作符还是只转换首字符。
以上面的 value 变量值举例如下:
$ echo ${value^}
This Is a Test String.
$ echo ${value^^}
THIS IS A TEST STRING.
$ echo ${value,}
this Is a Test String.
$ echo ${value,,}
this is a test string.
可以看到,${value^}
只会把 value 变量值首字符变成大写,由于原本就是大写,所以输出结果跟 value 值一样。 ${value^^}
把所有字符都转换为大写。 ${value,}
把 value 变量值首字符变成小写。 ${value,,}
把所有字符都转换为小写。
注意:如果要匹配多个字符,要用方括号 []
把字符串括起来,进行 pathname expansion,才会得到多个可匹配的字符。
直接把 pattern 模式写成字符串并不能匹配该字符串中的每一个字符。
以上面的 value 变量值举例如下:
$ echo ${value,TI}
This Is a Test String.
$ echo ${value,,TI}
This Is a Test String.
$ echo ${value,,[TI]}
this is a test String.
$ echo ${value,[TI]}
this Is a Test String.
可以看到,当所给模式写为 TI
时,无论是使用 ,
还是 ,,
,都不能把大写的 T
和 I
转换为小写。 ${value,TI}
甚至都不能转换开头的 T
字符。
而写为 ${value,,[TI]}
就会把所有大写的 T
和 I
都转换为小写。 [TI]
就是 pathname expansion 的一种写法,表示匹配方括号 []
里面的每一个字符。
基于字符匹配,不是基于字符串匹配。
写为 ${value,[TI]}
表示把首字符 T
或者首字符 I
转换为小写,只匹配首字符。
关于 pathname expansion 的具体写法可以查看 man bash 的 Pathname Expansion 部分。
最常见的就是用 *
通配符匹配零个或多个任意字符,用 ?
匹配任意单个字符。
上面说明中提到,如果省略 pattern 模式,就相当于写为 ?
。
即 ${parameter^^}
等价于 ${parameter^^?}
。
${parameter/pattern/string}
查看 man bash 对 ${parameter/pattern/string}
的说明如下:
Pattern substitution.
The pattern is expanded to produce a pattern just as in pathname expansion. Parameter is expanded and the longest match of pattern against its value is replaced with string.If pattern begins with /, all matches of pattern are replaced with string. Normally only the first match is replaced. If pattern begins with #, it must match at the beginning of the expanded value of parameter.
If pattern begins with %, it must match at the end of the expanded value of parameter.If string is null, matches of pattern are deleted and the / following pattern may be omitted.
If parameter is @ or *, the substitution operation is applied to each positional parameter in turn, and the expansion is the resultant list.
If parameter is an array variable subscripted with @ or *, the substitution operation is applied to each member of the array in turn, and the expansion is the resultant list.
即,${parameter/pattern/string}
表达式可以替换 parameter 变量值的字符串。
所给的 pattern 模式会按照文件名扩展 (pathname expansion) 的方式来扩展,然后对 parameter 变量值进行扩展。
其值中最长匹配 pattern 的部分会被替换成 string 指定的字符串。
如果 pattern 模式开始于 /
,所有匹配 pattern 模式的地方都被替换成 string 字符串。
通常仅仅替换第一个匹配的地方。
如果 pattern 模式开始于 #
,它必须从头开始匹配 parameter 变量值。
如果 pattern 模式开始于 %
,它必须从后往前匹配 parameter 变量值。
如果 string 字符串是空,匹配 pattern 模式的地方会被删除,且跟在 pattern 模式之后的 /
字符可以省略。
具体举例说明如下:
$ value="This is a test string. This is a new test"
$ echo ${value/test/TEST}
This is a TEST string. This is a new test
$ echo ${value//test/TEST}
This is a TEST string. This is a new TEST
$ echo ${value/#test/TEST}
This is a test string. This is a new test
$ echo ${value/#This/THIS}
THIS is a test string. This is a new test
$ echo ${value/%test/TEST}
This is a test string. This is a new TEST
$ echo ${value/test}
This is a string. This is a new test
$ echo ${value//test}
This is a string. This is a new
可以看到,在 ${value/test/TEST}
表达式中,value 变量值是要被替换的原始字符串。
中间的 test 是要被替换的模式,且只替换第一个出现的 "test" 字符串,不会替换所有的 "test" 字符串。
后面的 TEST 是替换之后的内容。
最终输出的结果是把 value 变量值中的第一个 "test" 字符串替换成了 "TEST",第二个 "test" 字符串没有被替换。
${value//test/TEST}
表达式的 "/test" 模式以 /
开头,表示替换所有出现的 "test" 字符串。
输出结果所有的 "test" 字符串都替换成了 "TEST"。
${value/#test/TEST}
表达式的 "#test" 模式以 #
开头,表示要从 value 变量值的第一个字符开始匹配。
由于 value 变量值不是以 "test" 开头,所以匹配不到,并没有做替换。
要使用 ${value/#This/THIS}
来把 value 变量值开头的 "This" 替换成 "THIS"。 ${value/%test/TEST}
表达式的情况类似,要求从 value 变量值的末尾往前匹配 "test" 字符串。
这两者都是从最后一个字符往前开始匹配。
${value/test}
表达式没有提供替换后的 string 参数,表示从 value 变量值中删除第一个出现的 "test" 字符串。 ${value//test}
表达式的 "/test" 模式以 /
开头,表示从 value 变量值中删除所有出现的 "test" 字符串。
上面提到 "最长匹配" 部分会被替换。
所谓的 "最长匹配" 是指被 pattern 模式括起来的最长部分。
常见于用通配符匹配多个字符形成嵌套的情况。
具体举例如下:
$ value="This is a |test string|new test|, check it"
$ echo ${value/|*|/NEW STRING}
This is a NEW STRING, check it
$ echo ${value/|*|}
This is a , check it
可以看到,所给的匹配模式是 |*|
。使用 *
通配符来匹配在两个 |
之间的任意字符串。
在所给的 value 变量值里面,"|test string|"、"|test string|new test|" 这两种形式都匹配这个模式。
实际被替换的是最后一种,也就是最长匹配。
由于该模式没有以 /
开头,只处理第一个匹配的地方,所以 "|new test|" 不会被匹配到。
即,当 pattern 模式的扩展结果是不定长的字符串时,它会有一个前缀部分、中间变长部分、后缀部分。
那么最长匹配是从前缀部分开始匹配,一直到最后一个匹配的后缀部分为止,而不是遇到第一个匹配的后缀部分就停止。
中间变长部分可以包含多个前缀部分和后缀部分。
下面再举例说明如下:
$ value="This is a test string, first check it"
$ echo ${value/t*st}
This is a check it
可以看到,在所给的 value 变量值里面,t*st
模式的后缀部分 "st" 匹配到了 "first" 字符串后面的 "st"。
而不是匹配到 "test" 字符串的 "st"。
最终结果取最长匹配的部分。