grep 命令详解

1. 简介

grep: Gloabal Search Regular Expression and Print out the line,意为全局搜索正则表达式并打印文本行。所以

  • grep是一个强大的文本搜索工具
  • grep与正则表达式联系紧密

之后也会从这两个大的方面来详细介绍。grep命令的基本语法如下:

grep [options] pattern [file...]

[options]表示选项,具体的命令选项见下表。pattern表示要匹配的模式(包括目标字符串、变量或者正则表达式),file表示要查询的文件名,可以是一个或者多个。pattern后面所有的字符串参数都会被理解为文件名。

选项 说明
-c       只打印匹配的文本行的行数,不显示匹配的内容
-i 匹配时忽略字母的大小写
-h 当搜索多个文件时,不显示匹配文件名前缀
-n 列出所有的匹配的文本行,并显示行号
-l 只列出含有匹配的文本行的文件的文件名,而不显示具体的匹配内容
-s 不显示关于不存在或者无法读取文件的错误信息
-v 只显示不匹配的文本行
-w 匹配整个单词
-x 匹配整个文本行
-r 递归搜索,搜索当前目录和子目录
-q 禁止输出任何匹配结果,而是以退出码的形式表示搜索是否成功,其中0表示找到了匹配的文本行
-b 打印匹配的文本行到文件头的偏移量,以字节为单位
-E 支持扩展正则表达式
-P 支持Perl正则表达式
-F 不支持正则表达式,将模式按照字面意思匹配

二、grep简单应用场景

首先介绍一下我的实验环境,在/home/tyrone下建立3个简单的txt文件:

#----------------------/home/tyrone/text1.txt---------------------
hello world
mailx
uuen
letitia
#----------------------/home/tyrone/text2.txt---------------------
hello world,this is for grep test 
#----------------------/home/tyrone/text3.txt---------------------
hello world
tyrone

(1)多文件查询,file之间用空格隔开

grep -i "hello world" test1.txt test2.txt

#输出结果
test1.txt:hello world
test2.txt:hello world,this is for grep test 

(2)多模式匹配,模式之间为“逻辑或”的关系,匹配任意一个

#方法1:使用-e选项
grep -e "hello world" -e "mailx" -r /home/tyrone

#方法2:使用正则表达式,-E
grep -E "hello world|mailx" -r /home/tyrone

#方法3:使用正则表达式,egrep,同grep -E等效
egrep "hello world|mailx" -r /home/tyrone
#输出结果均相同:
/home/tyrone/test1.txt:hello world
/home/tyrone/test1.txt:mailx
/home/tyrone/test2.txt:hello world,this is for grep test
/home/tyrone/test3.txt:hello world

(3)多模式匹配,模式之间为“逻辑与”的关系,匹配所有模式。

这个问题我查阅了很多方法,并逐一试验了一下。基本思想大致相同:先匹配一个模式,然后grep下面一个模式,将前一次grep的结果作为要查询文件路径依次向后传递。

注意:前一次grep的结果必须加上-l选项,否则会把匹配成功的文件内容作为要查询的文件名向后传递

我希望做到的是能够显示出同时包含模式的文件,并且跟随显示匹配每个模式的内容。可惜我现在找到的方法都仅仅能够显示匹配最后一个模式的内容。

#方法1:比较笨,将其按一次的结果重定向到一个文件,然后xargs grep来依次读取。
grep -i "hello world" -rl /home/tyrone >> reslut.txt
cat result.txt | xargs grep -i "mailx" 

#输出结果
/home/tyrone/test1.txt:mailx
#方法2:直接利用管道
grep -i "hello world" -rl /home/tyrone | xargs grep -i "mailx"

#输出结果
/home/tyrone/test1.txt:mailx
#方法3:使用find,适合于需要灵活判断条件的场景。例如查找指定路径下,同时匹配多个模式的txt文件。
#注意:本例中“mailx”后面的命令必须加上反引号 ` ,否则会被当作要查询的文件名。
grep -i "mailx" `find /home/tyrone -type f -name "*.txt" -exec grep -l "hello world"  {} \;`

#输出结果
/home/tyrone/test1.txt:mailx
#方法4:同3
find /home/tyrone -name "*.txt" -exec grep -l "hello world" {} \; | xargs grep -i "mailx"

#输出结果
/home/tyrone/test1.txt:mailx

最后不得不感慨一下linux命令的组合方式,能像积木一样堆积出无穷的组合,是时候展现真正的想象力了。。。

(4)查找指定用户的进程
ps是查看当前进程的指令,e表示所有进程,f表示全格式。

ps -ef | grep "tyrone"

#输出结果
root      27200  1827  0 Jun15 ?        00:00:00 sshd: tyrone [priv]
tyrone    27434 27433  0 Jun15 pts/50   00:00:00 -bash
tyrone    43316 27434  2 02:14 pts/50   00:00:00 ps -ef
tyrone    43317 27434  0 02:14 pts/50   00:00:00 grep tyrone

三、团结就是力量

现在要搞一个脚本把前面总结的命令一锅炖了。先搜索同时匹配多个模式的文件,把它们先备份之后,替换目标字符串:

#----------------------/home/tyrone/myshell.ksh---------------------
#! /bin/ksh

grep "hello world" -rl /home/tyrone | xargs grep -l "mailx" > /home/tyrone/result5.txt
cat result5.txt | while read line
do
    cp ${line} ${line}.bak20150616
    sed -i "s/hello world/letitia/g" `grep "hello world" -rl ${line}`
done
#输出结果:只有test1.txt满足条件,将"hello world"替换成了"letitia"
#哦对了。。还有我的shell文件也同时包含了这两个模式,可以通过find限定文件后缀,不表
#----------------------/home/tyrone/text1.txt---------------------
letitia
mailx
uuen
letitia
#----------------------/home/tyrone/text2.txt---------------------
hello world,this is for grep test 
#----------------------/home/tyrone/text3.txt---------------------
hello world
tyrone
#----------------/home/tyrone/text1.txt.bak20150616---------------
hello world
mailx
uuen
letitia

四、下回分解

grep与正则表达式的故事

你可能感兴趣的:(grep 命令详解)