Linux grep基本用法与正则表达式

本文只是对于常用的grep配合正则表达式基本用法进行简单小结,如果想仔细的学习正则表达式,请访问鸟哥Linux私房菜,台湾同胞的网站是繁体中文的,需要点儿耐心。

1、grep命令

功能:输入文件的每一行中查找字符串。

基本用法:

grep [-acinv] [--color=auto] [-A n] [-B n] '搜寻字符串' 文件名
参数说明:
-a:将二进制文档以文本方式处理
-c:显示匹配次数
-i:忽略大小写差异
-n:在行首显示行号
-AAfter的意思,显示匹配字符串后n行的数据
-B:before的意思,显示匹配字符串前n行的数据
-v:显示没有匹配行-AAfter的意思,显示匹配部分之后n行-B:before的意思,显示匹配部分之前n行
--color:以特定颜色高亮显示匹配关键字
 –color选项是个非常好的选项,可以让你清楚的明白匹配了那些字符。最好在自己的.bashrc或者.bash_profile文件中加入:
alias grep=grep --color=auto

每次grep搜索之后,自动高亮匹配效果了。‘搜寻字符串’是正则表达式,注意为了避免shell的元字符对正则表达式的影响,请用单引号(’’)括起来,千万不要用双引号括起来(””)或者不括起来。

2、grep 与正则表达式

正则表达式分为基本正则表达式和扩展正则表达式。下面分别简单总结一下。

元数据 意义和范例
^word 搜寻以word开头的行。 例如:搜寻以#开头的脚本注释行 grep –n ‘^#’ regular.txt
word$ 搜寻以word结束的行
. 匹配任意一个字符。 例如:grep –n ‘e.e’ regular.txt 匹配e和e之间有任意一个字符,可以匹配eee,eae,eve,但是不匹配ee。
\ 转义字符。 例如:搜寻’,’是一个特殊字符,在正则表达式中有特殊含义。必须要先转义。grep –n ‘\,” regular.txt
* 前面的字符重复0到多次。 例如匹配gle,gogle,google,gooogle等等 grep –n ‘go*gle’ regular.txt
[list] 匹配一系列字符中的一个。 例如:匹配gl,gf。grep –n ‘g[lf]’ regular.txt
[n1-n2] 匹配一个字符范围中的一个字符。 例如:匹配数字字符 grep –n ‘[0-9]’ regular.txt
[^list] 匹配字符集以外的字符 例如:grep –n ‘[^o]‘ regular.txt 匹配非o字符
\ 单词是的开头。 例如:匹配以g开头的单词 grep –n ‘\
word\> 前面的字符重复n1,n2次 例如:匹配google,gooogle。grep –n ‘go\{2,3\}gle’ regular.txt
\ 匹配单词结尾 例如:匹配以tion结尾的单词 grep –n ‘tion\>’ regular.txt
word\{n1\} 前面的字符重复n1 例如:匹配google。 grep –n ‘go\{2\}gle’ regular.txt
word\{n1,\} 前面的字符至少重复n1 例如:匹配google,gooogle。 grep –n ‘go\{2\}gle’ regular.txt
word\{n1,n2\} 前面的字符重复n1,n2次 例如:匹配google,gooogle。 grep –n ‘go\{2,3\}gle’ regular.txt

扩展正则表达式

?     #匹配0个或1个在其之前的那个普通字符。
      例如,匹配gd,god   grep –nE ‘go?d’ regular.txt

+    #匹配1个或多个在其之前的那个普通字符,重复前面字符1到多次。 
     例如:匹配god,good,goood等等字符串。
     grep –nE go+d’ regular.txt

()   #表示一个字符集合或用在expr中,匹配整个括号内的字符串,
     原来都是匹配单个字符。 例如:搜寻good或者glad
     grep –nE ‘g(oo|la)’ regular.txt

|    #表示“或”,匹配一组可选的字符,或(or)的方式匹配多个字串。
     例如:grep –nE ‘god|good’ regular.txt 匹配god或者good。

常用的集合表示方法有:

纯数字:[[:digit:]]或[0-9]

小写字母:[[:lower:]]或[a-z]

大写字母:[[:upper:]]或[A-Z]

大小写字母:[[:alpha:]]或[a-zA-Z]

数字加字母:[[:alnum:]]或[0-9a-zA-Z]

空白字符:[[:space:]]

标点符号:[[:punct:]]

3、关于匹配的实例

grep -c "48" test.txt #统计所有以“48”字符的行有多少
grep -i "May" test.txt #不区分大小写查找“May”所有的行)
grep -n "48" test.txt #显示行号;显示匹配字符“48”的行及行号,相同于 nl test.txt |grep 48)
grep -v "48" test.txt #显示输出没有字符“48”所有的行)
grep "471" test.txt #显示输出字符“471”所在的行)
grep "48;" test.txt #显示输出以字符“48”开头,并在字符“48”后是一个tab键所在的行
grep "48[34]" test.txt #显示输出以字符“48”开头,第三个字符是“3”或是“4”的所有的行)
grep "^[^48]" test.txt #显示输出行首不是字符“48”的行)
grep "[Mm]ay" test.txt #设置大小写查找:显示输出第一个字符以“M”或“m”开头,以字符“ay”结束的行)
grep "K…D" test.txt #显示输出第一个字符是“K”,第二、三、四是任意字符,第五个字符是“D”所在的行)
grep "[A-Z][9]D" test.txt #显示输出第一个字符的范围是“A-D”,第二个字符是“9”,第三个字符的是“D”的所有的行
grep "[35]..1998" test.txt #显示第一个字符是3或5,第二三个字符是任意,以1998结尾的所有行
grep "4/{2,/}" test.txt #模式出现几率查找:显示输出字符“4”至少重复出现两次的所有行
grep "9/{3,/}" test.txt #模式出现几率查找:显示输出字符“9”至少重复出现三次的所有行
grep "9/{2,3/}" test.txt #模式出现几率查找:显示输出字符“9”重复出现的次数在一定范围内,重复出现2次或3次所有行
grep -n "^$" test.txt #显示输出空行的行号
ls -l |grep "^d" #如果要查询目录列表中的目录 同:ls -d *
ls -l |grep "^d[d]" #在一个目录中查询不包含目录的所有文件
ls -l |grpe "^d…..x..x" #查询其他用户和用户组成员有可执行权限的目录集合

4、grep练习题

(1).显示/proc/meminfo文件中以大写或小写s开头的行;

# grep -i '^[Ss]' /proc/meminfo

(2).显示/etc/passwd文件中其默认shell为非/sbin/nologin的用户;

# grep -v '/sbin/nologin$' /etc/passwd | cut -d: -f1

(3).显示/etc/passwd文件中其默认shell为/bin/bash的用户

进一步:仅显示上述结果中其ID号最大的用户

# grep '/bin/bash$' /etc/passwd | cut -d: -f1 | sort -n -r | head -1

(4).找出/etc/passwd文件中的一位数或两位数;

# grep '\<[[:digit:]]\{1,2\}\>' /etc/passwd

(5).显示/boot/grub/grub.conf中至少一个空白字符开头的行

# grep '^[[:space:]]\+.*' /boot/grub/grub.conf

(6).显示/etc/rc.d/rc.sysinit文件中,以#开头,后面跟至少一个空白字符,而后又有至少一个非空白字符的行;

# grep '^#[[:space:]]\+[^[:space:]]\+' /etc/rc.d/rc.sysinit

(7).找出netstat -tan命令执行结果中包含’LISTEN’的行;

# netstat -tan | grep 'LISTEN[[:space:]]*$

(8).添加用户bash,testbash,basher,nologin(SHELL为/sbin/nologin),而找出当前系统上其用户名和默认SHELL相同的用户;

# grep '\(\<[[:alnum:]]\+\>\).*\1$' /etc/passwd

(9).扩展题:新建一个文本文件,假设有如下内容:

He like his lover.

He love his lover.

He like his liker.

He love his liker.

找出其中最后一个单词是由此前某单词加r构成的行;

# grep '\(\<[[:alpha:]]\+\>\).*\1r' grep.txt

(10).显示当前系统上root、centos或user1用户的默认shell及用户名;

# grep -E '^(root|centos|user1\>)' /etc/passwd

(11).找出/etc/rc.d/init.d/functions文件中某单词后面跟一对小括号’()”的行;

# grep -o '\<[[:alpha:]]\+\>()' /etc/rc.d/init.d/functions

(12).使用echo输出一个路径,而使用egrep取出其基名;

# echo /etc/rc.d/ | grep -o '[^/]\+/\?$' | grep -o '[^/]\+'

你可能感兴趣的:(Shell,Linux)