Linux grep 命令用于查找文件里符合条件的字符串。
grep 指令用于查找内容包含指定的范本样式的文件,如果发现某文件的内容符合所指定的范本样式,预设 grep 指令会把含有范本样式的那一列显示出来。若不指定任何文件名称,或是所给予的文件名为 -,则 grep 指令会从标准输入设备读取数据。
语法
grep [-abcEFGhHilLnqrsvVwxy]
[-A<显示列数>]
[-B<显示列数>]
[-C<显示列数>]
[-d<进行动作>]
[-e<范本样式>]
[-f<范本文件>]
[--help][范本样式][文件或目录...]
参数:
- -a 或 --text : 不要忽略二进制的数据。
- -A<显示行数> 或 --after-context=<显示行数> : 除了显示符合范本样式的那一列之外,并显示该行之后的内容。
- -b 或 --byte-offset : 在显示符合样式的那一行之前,标示出该行第一个字符的编号。
- -B<显示行数> 或 --before-context=<显示行数> : 除了显示符合样式的那一行之外,并显示该行之前的内容。
- -c 或 --count : 计算符合样式的列数。
- -C<显示行数> 或 --context=<显示行数>或-<显示行数> : 除了显示符合样式的那一行之外,并显示该行之前后的内容。
- -d <动作> 或 --directories=<动作> : 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。
- -e<范本样式> 或 --regexp=<范本样式> : 指定字符串做为查找文件内容的样式。
- -E 或 --extended-regexp : 将样式为延伸的正则表达式来使用。
- -f<规则文件> 或 --file=<规则文件> : 指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。
- -F 或 --fixed-regexp : 将样式视为固定字符串的列表。
- -G 或 --basic-regexp : 将样式视为普通的表示法来使用。
- -h 或 --no-filename : 在显示符合样式的那一行之前,不标示该行所属的文件名称。
- -H 或 --with-filename : 在显示符合样式的那一行之前,表示该行所属的文件名称。
- -i 或 --ignore-case : 忽略字符大小写的差别。
- -l 或 --file-with-matches : 列出文件内容符合指定的样式的文件名称。
- -L 或 --files-without-match : 列出文件内容不符合指定的样式的文件名称。
- -n 或 --line-number : 在显示符合样式的那一行之前,标示出该行的列数编号。
- -o 或 --only-matching : 只显示匹配PATTERN 部分。
- -q 或 --quiet或--silent : 不显示任何信息。
- -r 或 --recursive : 此参数的效果和指定"-d recurse"参数相同。
- -s 或 --no-messages : 不显示错误信息。
- -v 或 --revert-match : 显示不包含匹配文本的所有行。
- -V 或 --version : 显示版本信息。
- -w 或 --word-regexp : 只显示全字符合的列。
- -x --line-regexp : 只显示全列符合的列。
- -y: 此参数的效果和指定"-i"参数相同。
实例
1、在当前目录中,查找后缀有 file 字样的文件中包含 test 字符串的文件,并打印出该字符串的行。此时,可以使用如下命令:
grep test *file
结果如下所示:
$ grep test test* # 查找前缀有“test”的文件包含“test”字符串的文件
testfile1:This a Linux testfile! # 列出testfile1 文件中包含test字符的行
testfile_2:This is a linux testfile! # 列出testfile_2 文件中包含test字符的行
testfile_2:Linux test # 列出testfile_2 文件中包含test字符的行
grep "yes" ../diff_out-10-S/gene_exp.diff > diff.gene10S.txt
从文件内容查找与正则表达式匹配的行:
$ grep –e "正则表达式" 文件名
2、以递归的方式查找符合条件的文件。例如,查找指定目录/etc/acpi 及其子目录(如果存在子目录的话)下所有文件中包含字符串"update"的文件,并打印出该字符串所在行的内容,使用的命令为:
grep -r update /etc/acpi
输出结果如下:
$ grep -r update /etc/acpi #以递归的方式查找“etc/acpi” 下包含“update”的文件
/etc/acpi/ac.d/85-anacron.sh: # (Things like the slocate updatedb cause a lot of IO.)Rather than
/etc/acpi/resume.d/85-anacron.sh: # (Things like the slocate updatedb cause a lot ofIO.) Rather than
/etc/acpi/events/thinkpad-cmos:action=/usr/sbin/thinkpad-keys--update
3、反向查找。前面各个例子是查找并打印出符合条件的行,通过"-v"参数可以打印出不符合条件行的内容。例如:查找文件名中包含 test 的文件中不包含test 的行,此时,使用的命令为:
grep -v test *test*
结果如下所示:
$ grep -v *test* #查找文件名中包含test 的文件中不包含test 的行
testfile1:helLinux!
testfile1:Linis a free Unix-type operating system.
testfile1:Lin
testfile_1:HELLO LINUX!
testfile_1:LINUX IS A FREE UNIX-TYPE OPTERATING SYSTEM.
testfile_1:THIS IS A LINUX TESTFILE!
testfile_2:HELLO LINUX!
testfile_2:Linux is a free unix-type opterating system.
4、查找时不区分大小写:
$ grep –i "被查找的字符串" 文件名
5、查找匹配的行数:
$ grep -c "被查找的字符串" 文件名
从根目录开始查找所有扩展名为 .log 的文本文件,并找出包含 "ERROR" 的行:
$ find / -type f -name "*.log" | xargs grep "ERROR"
6、打印所有匹配的行,要全部匹配,而不是包含关系 -x
grep -x phenoix *
这里,只打印 phenoix的行,aphenoix是不打印的,因为不是完全匹配
7、仅显示匹配的文件名称,而不是所在的行 -l
grep -l phenoix *
8、显示匹配所在的行号,类似cat -n
grep -n phenoix *
9、将匹配模式放到文件中 -f
(根据文件查找匹配的行)
简单地说就是,就可以打印出文件2中与文件1中的相同行。
grep -f 1.txt 2.txt
如果采用-f参数输出文件的相同行的时候,-f参数后面作为标准的文件一定不能有空行才行。
以a.txt中每一行为关键字,查找b.txt中匹配的行
cat a.txt
e
k
cat b.txt
e r t
d f 3 s g k
i e x
d f g
grep -f a.txt b.txt
e r t
s g k
i e x
(1)grep -F YOURSTRING -R path
功能:用grep搜索文档中的字符串
grep -F 0576 -R /root/zy/hahah
/root/zy/hahah/b:05766798607
/root/zy/hahah/b:05766798608
/root/zy/hahah/b:05766798609
/root/zy/hahah/a:05766798608
(2.)grep -v -f file1 file2
功能:输出文件2中的内容,但是剔除包含在文件1中的内容
下面我们来看一个应用:
cat file1
1
4
05766798608
05766798608
6
7
cat file2
05766798607
05766798608
05766798609
(3.)grep -F -f file1 file2
功能:可以把文件2中存在文件1的行输出
但是我做了一个试验:
- 如果文件1中没有重复的行,结果是对的!
- 如果有重复的行,结果和没有重复的行是一样的!
我想达到的目的是 文件1放的是手机号的前7位,文件2放的是手机号前7位 和 所代表的省份,输出结果然后统计文件1每个省有多少个手机号码??
[root@SOR_SYS hahah]# cat file1
11111
22222
11111
22222
33333
44444
55555
[root@SOR_SYS hahah]# cat file2
11111 bj
22222 hb
33333 hn
44444 nm
55555 xm
66666 mk
[root@SOR_SYS hahah]# grep -F -f file1 file2
11111 bj
22222 hb
33333 hn
44444 nm
55555 xm
[root@SOR_SYS hahah]#
看来这个是无法实现了,file1中有2个11111和2个22222,即如果file1有重复的行,还重复输出。
[root@SOR_SYS hahah]# join -1 2 -2 1 <(sort file1|uniq -c) <(sort file2)
11111 2 bj
22222 2 hb
33333 1 hn
44444 1 nm
55555 1 xm
例子:
- 从当前目录开始查找所有扩展名为 .in 的文本文件,并找出包含 "thermcontact" 的行:
find . -name "*.in" | xargs grep "thermcontact"
grep Aug /var/log/messages # 在文件 '/var/log/messages'中查找关键词"Aug"
grep ^Aug /var/log/messages # 在文件 '/var/log/messages'中查找以"Aug"开始的词汇
grep [0-9] /var/log/messages # 选择 '/var/log/messages' 文件中所有包含数字的行
grep Aug -R /var/log/* # 在目录 '/var/log' 及随后的目录中搜索字符串"Aug"
LINUX 在 指定目录下,包括子目录
grep -inr cusermanage *
//以上表示在当前目录下查找”cusermanage“ 匹配
awk、sed、grep更适合的方向:
- grep 更适合单纯的查找或匹配文本;
- sed 更适合编辑匹配到的文本;
- awk 更适合格式化文本,对文本进行较复杂格式处理;