linux正则表达式及扩展正则表达式

正则表达式(REGular EXPression, REGEXP)
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
给定一个正则表达式和另一个字符串,我们可以达到如下的目的:
1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);
2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。
————来自百度百科

使用格式:
grep [option] PATTERN [FILE...]
grep: 根据模式搜索文本,并将符合模式的文本行显示出来。
Pattern: 文本字符和正则表达式的元字符组合而成匹配条件
支持的常用选项
-i:忽略大小写
--color:被匹配的字符串显示颜色
-n:显示行号
-v:显示没有被模式匹配的行
-o:只显示被模式匹配的字符串
-E:使用扩展正则表达式
-A:表示显示指定位置的前两行;例:cat /proc/cpuinfo #grep -A 2 '^core id' /proc/cpuinfo
-B:表示显示指定位置的后两行;
-C:表示显示指定位置的前后各两行;
A、基本正则表达式支持的元字符(工作在贪婪模式,尽可能多的匹配符合条件的字符串)
\:逃逸字符,用来逃逸后面字符的真是意义
.:匹配任意单个字符
*:匹配前面字符任意次(包括0次)
.*:匹配任意长度任意字符
[abc]:匹配指定范围内的任意单个字符
[^]:匹配指定范围外的任意单个字符
常用字符集:
[:digit:]:数字符号
[:lower:]:小写字母符号
[:upper:]:大写字母符号
[:punct:]:标点符号
[:space:]:空白字符
[:alpha:]:大小写字符
[:alnum:]:数字和大小写字母
^:锚定行首,此字符后面的任意内容必须出现在行首 例:grep '^r..t' /etc/passwd
$:锚定行尾,此字符后面的任意内容必须出现在行尾 例:grep 'w$' /etc/inittab
^$:锚定空白行 例:grep '^$' /etc/inittab
\<或\b:锚定词首,其后面的任意字符必须作为单词首部出现 例:grep "\<root" test.txt
\>或\b:锚定词尾,其前面的任意字符必须作为单词尾部出现
\?:匹配其前面的字符1次或0次
\{n\}:匹配前面字符n次
\{n,\}:匹配前面字符至少n次
\{n,m\}:匹配前面字符n到m次
\(\):分组可以进行后向引用 例:\(ab\)* 表示ab出现0次或者多次 例:grep '\(\..e\).*\1' test3.txt
B、扩展正则表达式支持的元字符
?:匹配其前面的字符1次或0次
+:匹配其前面的字符至少1次 例:grep -E '^[[:space:]]+' /boot/prub/grub.conf
a|b:匹配a或者b 例:egrep 'C|cat' /test.txt
{n}:匹配前面字符n次
{n,}:匹配前面字符至少n次
{n,m}:匹配前面字符n到m次
():分组可以进行后向引用 例:(ab)* 表示ab出现任意次 例:grep '\(\..e\).*\1' test3.txt
P.S:在扩展正则表达式中括号前不需要加“\”,对于前面的分组可以使用\N引用,N表示第N个左括号括起来的内容



练习:
1、显示/proc/meminfo文件中以不区分大小的s开头的行;
#grep -i '^s' /proc/meminfo
#grep '^sS' /proc/meminfo
2、显示/etc/passwd中以nologin结尾的行;
#grep 'nologin$' /etc/passwd
取出默认shell为/sbin/nologin的用户列表
#grep '/sbin/nologin' /etc/passwd | cut -d: -f1
取出默认shell为bash ,且其用户ID号最小的用户的用户名
#grep 'bash$' /etc/passwd |sort -n -t:-k3 |head -1 |cut -d: -f1
3、显示/etc/inittab中以#开头,且后面跟一个或多个空白字符,而后又跟了任意非空白字符的行;
#grep '^#[[:space:]]\{1,\}[^[:space:]]' /etc/inittab
4、显示/etc/inittab中包含了:一个数字:(即两个冒号中间一个数字)的行;
#grep ':[0-9]:' /etc/inittab
5、显示/boot/grub/grub.conf文件中以一个或多个空白字符开头的行;
#grep '^[[:space:]]\{1,\}.*' /boot/grub/grub.conf
6、显示/etc/inittab文件中以一个数字开头并以一个与开头数字相同的数字结尾的行;
#grep '^\([0-9]\).*\1$' /etc/inittab
7、找出某文件中的,1位数,或2位数;
#grep '\b[0-9]\{1,2\}\b' /etc/passwd
#grep '\<[0-9]\{1,2\}>b' /proc/cpuinfo
8、找出ifconfig命令结果中的1-255之间的整数;
#ifconfig | egrep '\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>
9、查找当前系统上名字为student(必须出现在行首)的用户的账号的相关信息,文件为/etc/passwd
#grep '^student\>' /etc/passwd

#grep '^student:' /etc/passwd
显示用户student的id号
#grep '^student\>' /etc/passwd | cut -d: -f3

#id -u student
10、分析/etc/inittab文件中如下文本中前两行的特征(每一行中出现在数字必须相同),请写出可以精确找到类似两行的模式:
11:1:wait:/etc/rc.d/rc 1
13:3:wait:/etc/rc.d/rc 3
#grep 'l\([0-9]\):\1:wait:/etc/rc.d/rc \1' /etc/inittab

#grep '^l\([0-9]\):\1.*\1$' /etc/inittab 

本文出自 “我是打不死的小强” 博客,谢绝转载!

你可能感兴趣的:(linux,正则表达式,扩展正则表达式)