正则表达式

正则表达式用于多种编程语言，这里使用Linux中的grep程序示例。

下面这三个表用作参考：

表 1 正则表达式中的元字符

表 2 正则表达式中的重复运算符

表 3 正则表达式中的预定义字符类(Linux)

匹配字符

在正则表达式中，.匹配除换行符外的任意单个字符，下面的命令从文件water.txt中匹配一个字符串，这个字符串以wa开头，之后是两个任意字符（除换行符），最后是r：

$ cat water.txt | grep 'wa..r'

它可能匹配到water、waXEr、waslr等等这样的字符串。

[list]表示匹配list中的任意单个字符，比如[wW]ater匹配water和Water字符串：

$ cat water.txt | grep '[wW]ater'

也可以使用表 3中的预定义字符类表示一个范围，比如[[:lower:]]at匹配以任意小写字母开头的，之后是at的字符串：

$ cat water.txt | grep '[[:lower:]]at'

[4-6]这样的字符类表示匹配数字4至数字6之间的任意单个字符。

now可以匹配单词now、know和其他包含now的字符串。

如果想要匹配单词know，那么需要使用\<表示单词的开头，\>表示单词的结尾，就像下面这样：

$ cat water.txt | grep '\<[kK]now\>'

这条命令匹配单词know和Know。

使用^表示行的开头，$表示行的结尾，下面的命令匹配以Water开头的行：

$ cat water.txt | grep '^Water'

最后，介绍一下重复运算符。

如果想要匹配这样一个字符串，它以w开头，之后是任意的字符（除换行符）重复任意多次，这怎么表示呢？这时就需要使用重复运算符*了，它表示匹配0次或者任意多次，其他的重复运算符请查看表 2.

匹配这样的字符串需使用下面的命令：

$ cat water.txt | grep 'w.*'