bash 脚本字符串截取表达式详细说明

在编写linux脚本时,有时需要操作字符串,从一个字符串中截取一段字符串,linux系统的bash脚本截取字符串的功能比较强,表达式丰富,时间长了容易忘记,因此作此笔记。

截取字符串通常有两种方式

从指定位置开始截取从指定字符(子字符串)开始截取。

一、从指定位置开始截取

这种方式需要两个参数:除了指定起始位置,还需要截取长度,才能最终确定要截取的字符串。
既然需要指定起始位置,那么就涉及到计数方向的问题,到底是从字符串左边开始计数,还是从字符串右边开始计数。答案是 Shell 同时支持两种计数方式

1.1、从字符串左边开始计数

如果想从字符串的左边开始计数,那么截取字符串的表达式如下:

${string: start :length}

其中,string 是要截取的字符串,start 是起始位置(从左边开始,从 0 开始计数),length 是要截取的长度(省略的话表示直到字符串的末尾)。

示例1:指定长度

url="c.huayisoft.net"
echo ${url: 2: 9}

结果为 : huayisoft

示例2:省略长度

url="c.huayisoft.net"
echo ${url: 2}  #省略 length,截取到字符串末尾

结果为:huayisoft.net

1.2 、从右边开始计数

如果想从字符串的右边开始计数,那么截取字符串的表达式如下:

${string: 0-start :length}

同第 1) 种格式相比,第 2) 种格式仅仅多了0-,这是固定的写法,专门用来表示从字符串右边开始计数。
这里需要强调两点:
1) 从左边开始计数时,起始数字是 0(这符合程序员思维);从右边开始计数时,起始数字是 1(这符合常人思维)。计数方向不同,起始数字也不同。
2) 不管从哪边开始计数,截取方向都是从左到右。

示例1:

url="c.huayisoft.net"
echo ${url: 0-13: 9}

结果为:huayisoft。从右边数,b是第 13 个字符。

示例2:省略长度

url="c.huayisoft.net"
echo ${url: 0-13}  #省略 length,直接截取到字符串末尾

结果为:huayisoft.net

二、从指定字符(子字符串)开始截取

这种截取方式无法指定字符串长度,只能从指定字符(子字符串)截取到字符串末尾。Shell 可以截取指定字符(子字符串)右边的所有字符,也可以截取左边的所有字符。

2.1、使用 # 号截取右边字符

使用#号可以截取指定字符(或者子字符串)右边的所有字符,表达式如下:

${string#*chars}

其中,string 表示要截取的字符,chars 是指定的字符(或者子字符串),*是通配符的一种,表示任意长度的字符串。*chars连起来使用的意思是:忽略左边的所有字符,直到遇见 chars(chars 不会被截取)。

示例1:

url="http://www.huayisoft.com/index.html"
echo ${url#*:}

#以下写法也可以得到同样的结果:
echo ${url#*p:}
echo ${url#*ttp:}

结果为: //www.huayisoft.net/index.html

如果不需要忽略 chars 左边的字符,那么也可以不写*,例如:

url="http://www.huayisoft.net/index.html"
echo ${url#http://} # www.huayisoft.net/index.html

url="Please goto:http://www.huayisoft.net/index.html"
echo ${url#http://} # Please goto:www.huayisoft.net/index.html

结果分别为:
www.huayisoft.net/index.html
Please goto:www.huayisoft.net/index.html

注意,以上写法遇到第一个匹配的字符(子字符串)就结束了。例如:

url="http://www.huayisoft.net/index.html"
echo ${url#*/}

结果为:/www.huayisoft.net/index.html。url 字符串中有三个/,输出结果表明,Shell 遇到第一个/就匹配结束了。

从最后往前定位,两个 ##
 

如果希望直到最后一个指定字符(子字符串)再匹配结束,那么可以使用##具体表达式为:

${string##*chars}

示例:

#!/bin/bash
url="http://www.huayisoft.net/index.html"
echo ${url#*/}    #结果为 /www.huayisoft.net/index.html
echo ${url##*/}   #结果为 index.html
str="---aa+++aa@@@"
echo ${str#*aa}   #结果为 +++aa@@@
echo ${str##*aa}  #结果为 @@@

2.2、使用 % 截取左边字符

使用%号可以截取指定字符(或者子字符串)左边的所有字符,表达式如下:

${string%chars*}

请注意*的位置,因为要截取 chars 左边的字符,而忽略 chars 右边的字符,所以*应该位于 chars 的右侧。其他方面%#的用法相同,这里不再赘述,仅举例说明:

#!/bin/bash
url="http://www.huayisoft.net/index.html"
echo ${url%/*}  #结果为 http://www.huayisoft.net
echo ${url%%/*}  #结果为 http:
str="---aa+++aa@@@"
echo ${str%aa*}  #结果为 ---aa+++
echo ${str%%aa*}  #结果为 ---

注意:从后往前定位:两个  %%

字符串截取表达式速查表

        以下为字符串截取的表达式表,方便时查阅:

bash字符串表达式速查表
表达式 意义
${string: start :length} 从 string 字符串的左边第 start 个字符开始,向右截取 length 个字符。
${string: start} 从 string 字符串的左边第 start 个字符开始截取,直到最后。
${string: 0-start :length} 从 string 字符串的右边第 start 个字符开始,向右截取 length 个字符。
${string: 0-start} 从 string 字符串的右边第 start 个字符开始截取,直到最后。
${string#*chars} 从 string 字符串第一次出现 *chars 的位置开始,截取 *chars 右边的所有字符。
${string##*chars} 从 string 字符串最后一次出现 *chars 的位置开始,截取 *chars 右边的所有字符。
${string%*chars} 从 string 字符串第一次出现 *chars 的位置开始,截取 *chars 左边的所有字符。
${string%%*chars} 从 string 字符串最后一次出现 *chars 的位置开始,截取 *chars 左边的所有字符。

你可能感兴趣的:(Linux,Shell,bash,开发语言)