正则表达式在每种语言中都会有,功能就是匹配符合你预期要求的字符串。

Shell正则表达式有两种:

基础正则表达式:BRE(basic regular express)

扩展正则表达式:ERE(extend regular express),扩展的表达式有+、?、|和()

下面是一些常用的正则表达式符号,我们先拿grep工具举例说明。

符号

描述

示例

. 匹配除换行符(\n)之外的任意单个字符

匹配123:

echo -e "123\n456" |grep -E '1.3'

^ 匹配前面字符串开头

匹配以abc开头的行:

echo -e "abc\nxyz" |grep -E ^abc

$ 匹配前面字符串结尾

匹配以xyz结尾的行:

echo -e "abc\nxyz" |grep -E xyz$

* 匹配前一个字符零个或多个

匹配x、xo和xoo:

echo -e "x\nxo\nxoo\no\noo" |grep "xo*"

x是必须的,批量了0零个或多个

+ 匹配前面字符1个或多个

匹配abc和abcc:

echo -e "abc\nabcc\nadd" |grep -E 'ab+'

这样是匹配单个数字:echo "113" |grep -E -o '[0-9]'

连续匹配多个数字:echo "113" |grep -E -o '[0-9]+'

匹配前面字符0个或1个

匹配ac或abc:

echo -e "ac\nabc\nadd" |grep -E 'a?c'

[ ] 匹配中括号之中的任意一个字符

匹配a或c:

echo -e "a\nb\nc" |grep -E '[ac]'

[ .-.] 匹配中括号中范围内的任意一个字符

匹配所有字母:

echo -e "a\nb\nc" |grep -E '[a-z]'

[^] 匹配[^字符]之外的任意一个字符

匹配a或b:

echo -e "a\nb\nc" |grep -E '[^c-z]'

匹配末尾数字:echo "abc:cde;123" |grep -E '[^;]+$'

{n}或{n,} 匹配花括号前面字符至少n个字符

匹配abc字符串(至少三个字符以上字符串):

echo -e "a\nabc\nc" |grep -E '[a-z]{3}' 

{n,m} 匹配花括号前面字符至少n个字符,最多m个字符

匹配12和123(不加边界符会匹配单个字符):

echo -e "1\n12\n123\n1234" |grep -E -w -o '[0-9]{2,3}'

\< 边界符,匹配字符串开始

匹配开始是123和1234:

echo -e "1\n12\n123\n1234" |grep -E -w '\<123'

\> 边界符,匹配字符串结束

匹配结束是1234:

echo -e "1\n12\n123\n1234" |grep -E '4\>'

( )

单元或组合:将小括号里面作为一个组合

分组:匹配小括号中正则表达式或字符。\n反向引用,n是数字,从1开始编号,表示引用第n个分组匹配的内容

单元:匹配123a字符串

echo "123abc" |grep -E -o '([0-9a-z]){4}'

分组:匹配11

echo "113abc" |grep -E -o '(1)\1'

匹配出现xo出现零次或多次:

echo -e "x\nxo\nxoo\no\noo" |egrep "(xo)*"

| 匹配竖杠两边的任意一个

匹配12和123:

echo -e "1\n12\n123\n1234" |grep -E '12\>|123\>'

\ 转义符,将特殊符号转成原有意义 1.2,匹配1.2:1\.2,否则112也会匹配到


Posix字符

描述

[:alnum:] 等效[a-zA-Z0-9]
[:alpha:] 等效[a-zA-Z]
[:lower:] 等效[a-z]
[:upper:] 等效[A-Z]
[:digit:] 等效[0-9]
[:space:] 匹配任意空白字符,等效[\t\n\r\f\v]
[:graph:] 非空白字符
[:blank:] 空格与定位字符
[:cntrl:] 控制字符
[:print:] 可显示的字符
[:punct:] 标点符号字符
[:xdigit:] 十六进制


示例:

echo -e "1\n12\n123\n1234a" |grep '[[:digit:]]'


博客地址:http://lizhenliang.blog.51cto.com

QQ群:Shell/Python运维开发群 323779636


在Shell下使用这些正则表达式处理文本最多的命令有下面几个工具:


命令

描述

grep 默认不支持扩展表达式,加-E选项开启ERE。如果不加-E使用花括号要加转义符\{\}
egrep 支持基础和扩展表达式
awk 支持egrep所有的正则表达式
sed 默认不支持扩展表达式,加-r选项开启ERE。如果不加-r使用花括号要加转义符\{\}


支持的特殊字符

描述

\w 匹配任意数字和字母,等效[a-zA-Z0-9_]
\W 与\w相反,等效[^a-zA-Z0-9_]
\b 匹配字符串开始或结束,等效\<和\>
\s 匹配任意的空白字符
\S 匹配非空白字符


空白符

描述

\n 换行符
\r 回车符
\t 水平制表符
\v 垂直制表符
\0 空值符
\b 退后一格


下一章节具体讲解grep、sed和awk用法,想要提升三剑客功底的可以看看!