字符类 (Character Class):如上例的x 和y,它们在模式中表示一个字符 ,但是取值范围是 一类字
符中的任意一个。
数量限定符 (Quantifier): 邮件地址的每一部分可以有一个或多个 x字符 ,IP地址的每一部 分
可以有 1-3个y 字符
位置限定符 (Anchor):描述各种字符类以及普通字符之间的位置关系,例如邮件地址分三
部分,用普通字符 @和 .隔 开 ,IP地址分四部分 ,用 .隔开 ,每一部分都可以用字符类和数量限定符
描述。为了表示位置关系 ,需要位置限定符的概念 ,将在下面介绍。
规定一些特殊语法表示字符类、数量限定符和位置关系 ,然后用这些特殊语法和普通字符
一起表示 一个模式 ,这就是正则表达式(Regular Expression)。
注意正则表达式参数用单引号括起来了 ,因为正则表达式中用到的很多特殊字符在 Shell中
也有特殊 含义 (例如 \),只有用单引号括起来才能保证这些字符原封不动地传给grep命令 ,而不
会被Shell解释掉。
以上介绍的是 grep正则表达式的Extended规范,Basic规范也有这些语法,只是字符 ?+{}|()应
解释 为普通字符 ,要表示上述特殊含义则需要加 \转义。如果用grep而不是 egrep,并且不加-E
参数,则 应该遵照 Basic 规范来写正则表达式。 (一定要注意!!!!!)
方便下面是用 这里重命名一下命令
alias grep='grep -E --colour'
例子:
[bozi@localhost grep]$ echo '@@abc'|grep '[@asd].ab'
@@abc
[bozi@localhost grep]$ echo '@@abc'|grep '[.asd].ab'
[bozi@localhost grep]$ echo '.@abc'|grep '[.asd].ab'
.@abc
这里[]里面的所有的字符都没有特殊含义 如. 但在外面是匹配任意一个的意思
匹配电子邮箱:
原文:
[bozi@localhost grep]$ cat file
dksaljdkl-sdasdas.com
[email protected]@454654
dsdsad@asdsa#@.com
[bozi@localhost grep]$ grep -E '[a-zA-Z0-9_.-]+@[a-zA-Z0-9_.-]+\.[a-zA-Z0-9_.-]+' file [email protected] [email protected] [email protected]@454654
更精确 加^$ 限定 行首行尾
[bozi@localhost grep]$ grep -E '^[a-zA-Z0-9_.-]+@[a-zA-Z0-9_.-]+\.[a-zA-Z0-9_.-]+$' file [email protected] [email protected]
egrep相当于grep -E, 表示采用Extended正则表达式语法。 grep的正则表达式 有Basic和
Extended两种规范, 它们之间的区别下一节再解释。另外还有 fgrep命令 ,相当于 grep - F,表示只
搜索固定字符串而不搜索正则表达式模式 ,不会按正则表达式的语法解释后面的参数。
匹配IP
file 内容
192.168.11.2
192.168.1SAs1.2
19as2.121.11.2
192.1SA28.11.2
192.16AS1.11.2
192.111.1S1.2
192.1.1.8.12.2
192.168.2SA1.2
192.1.68.12.1
[bozi@localhost grep]$ grep '[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}' file 192.168.11.2 19as2.121.11.2 192.1.1.8.12.2 #grep 找的是 包含模式的行 因为包含模式192.1.1.8 所以这一行也找出来了 192.1.68.12.1
另一种方法:
[bozi@localhost grep]$ grep '([0-9]{1,3}\.){3}[0-9]{1,3}' file 192.168.11.2 19as2.121.11.2 192.1.1.8.12.2 192.1.68.12.1
更精确的方法:
[bozi@localhost grep]$ grep '^([0-9]{1,3}\.){3}[0-9]{1,3}$' file 192.168.11.2