Linux常用命令详解 | grep

Linux grep 命令用于查找文件里符合条件的字符串

grep 指令用于查找内容包含指定的范本样式的文件,如果发现某文件的内容符合所指定的范本样式,预设 grep 指令会把含有范本样式的那一列显示出来。若不指定任何文件名称,或是所给予的文件名为 -,则 grep 指令会从标准输入设备读取数据。

语法

grep [-abcEFGhHilLnqrsvVwxy]
  [-A<显示列数>]
  [-B<显示列数>]
  [-C<显示列数>]
  [-d<进行动作>]
  [-e<范本样式>]
  [-f<范本文件>]
  [--help][范本样式][文件或目录...]

参数

  • -a 或 --text : 不要忽略二进制的数据。
  • -A<显示行数> 或 --after-context=<显示行数> : 除了显示符合范本样式的那一列之外,并显示该行之后的内容。
  • -b 或 --byte-offset : 在显示符合样式的那一行之前,标示出该行第一个字符的编号。
  • -B<显示行数> 或 --before-context=<显示行数> : 除了显示符合样式的那一行之外,并显示该行之前的内容。
  • -c 或 --count : 计算符合样式的列数。
  • -C<显示行数> 或 --context=<显示行数>或-<显示行数> : 除了显示符合样式的那一行之外,并显示该行之前后的内容。
  • -d <动作> 或 --directories=<动作> : 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。
  • -e<范本样式> 或 --regexp=<范本样式> : 指定字符串做为查找文件内容的样式。
  • -E 或 --extended-regexp : 将样式为延伸的正则表达式来使用。
  • -f<规则文件> 或 --file=<规则文件> : 指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。
  • -F 或 --fixed-regexp : 将样式视为固定字符串的列表。
  • -G 或 --basic-regexp : 将样式视为普通的表示法来使用。
  • -h 或 --no-filename : 在显示符合样式的那一行之前,不标示该行所属的文件名称。
  • -H 或 --with-filename : 在显示符合样式的那一行之前,表示该行所属的文件名称。
  • -i 或 --ignore-case : 忽略字符大小写的差别。
  • -l 或 --file-with-matches : 列出文件内容符合指定的样式的文件名称。
  • -L 或 --files-without-match : 列出文件内容不符合指定的样式的文件名称。
  • -n 或 --line-number : 在显示符合样式的那一行之前,标示出该行的列数编号。
  • -o 或 --only-matching : 只显示匹配PATTERN 部分。
  • -q 或 --quiet或--silent : 不显示任何信息。
  • -r 或 --recursive : 此参数的效果和指定"-d recurse"参数相同。
  • -s 或 --no-messages : 不显示错误信息。
  • -v 或 --revert-match : 显示不包含匹配文本的所有行。
  • -V 或 --version : 显示版本信息。
  • -w 或 --word-regexp : 只显示全字符合的列。
  • -x --line-regexp : 只显示全列符合的列。
  • -y: 此参数的效果和指定"-i"参数相同。

实例

1、在当前目录中,查找后缀有 file 字样的文件中包含 test 字符串的文件,并打印出该字符串的行。此时,可以使用如下命令:

grep test *file

结果如下所示:

$ grep test test*                       # 查找前缀有“test”的文件包含“test”字符串的文件  
testfile1:This a Linux testfile!        # 列出testfile1 文件中包含test字符的行  
testfile_2:This is a linux testfile!    # 列出testfile_2 文件中包含test字符的行  
testfile_2:Linux test                   # 列出testfile_2 文件中包含test字符的行 
grep "yes" ../diff_out-10-S/gene_exp.diff > diff.gene10S.txt

从文件内容查找与正则表达式匹配的行:

$ grep –e "正则表达式" 文件名

2、以递归的方式查找符合条件的文件。例如,查找指定目录/etc/acpi 及其子目录(如果存在子目录的话)下所有文件中包含字符串"update"的文件,并打印出该字符串所在行的内容,使用的命令为:

grep -r update /etc/acpi 

输出结果如下:

$ grep -r update /etc/acpi          #以递归的方式查找“etc/acpi”  下包含“update”的文件
/etc/acpi/ac.d/85-anacron.sh:       # (Things like the slocate updatedb cause a lot of IO.)Rather than
/etc/acpi/resume.d/85-anacron.sh:   # (Things like the slocate updatedb cause a lot ofIO.) Rather than
/etc/acpi/events/thinkpad-cmos:action=/usr/sbin/thinkpad-keys--update

3、反向查找。前面各个例子是查找并打印出符合条件的行,通过"-v"参数可以打印出不符合条件行的内容。例如:查找文件名中包含 test 的文件中不包含test 的行,此时,使用的命令为:

grep -v test *test*

结果如下所示:

$ grep -v *test*     #查找文件名中包含test 的文件中不包含test 的行  
testfile1:helLinux!  
testfile1:Linis a free Unix-type operating system.  
testfile1:Lin  
testfile_1:HELLO LINUX!  
testfile_1:LINUX IS A FREE UNIX-TYPE OPTERATING SYSTEM.  
testfile_1:THIS IS A LINUX TESTFILE!  
testfile_2:HELLO LINUX!  
testfile_2:Linux is a free unix-type opterating system.

4、查找时不区分大小写

$ grep –i "被查找的字符串" 文件名

5、查找匹配的行数

$ grep -c "被查找的字符串" 文件名

从根目录开始查找所有扩展名为 .log 的文本文件,并找出包含 "ERROR" 的行:

$ find / -type f -name "*.log" | xargs grep "ERROR"

6、打印所有匹配的行,要全部匹配,而不是包含关系 -x

grep -x phenoix *

这里,只打印 phenoix的行,aphenoix是不打印的,因为不是完全匹配

7、仅显示匹配的文件名称,而不是所在的行 -l

grep -l phenoix *

8、显示匹配所在的行号,类似cat -n

grep -n phenoix *

9、将匹配模式放到文件中 -f (根据文件查找匹配的行)
简单地说就是,就可以打印出文件2中与文件1中的相同行。

grep -f 1.txt 2.txt

如果采用-f参数输出文件的相同行的时候,-f参数后面作为标准的文件一定不能有空行才行。

以a.txt中每一行为关键字,查找b.txt中匹配的行

cat a.txt
e
k

cat b.txt
e r t
d f 3 s g k
i e x
d f g

grep -f a.txt b.txt
e r t
s g k
i e x

(1)grep -F YOURSTRING -R path
功能:用grep搜索文档中的字符串

grep -F 0576 -R /root/zy/hahah
/root/zy/hahah/b:05766798607
/root/zy/hahah/b:05766798608
/root/zy/hahah/b:05766798609
/root/zy/hahah/a:05766798608

(2.)grep -v -f file1 file2

功能:输出文件2中的内容,但是剔除包含在文件1中的内容

下面我们来看一个应用:

cat file1
1
4
05766798608
05766798608
6
7 

cat file2
05766798607
05766798608
05766798609

(3.)grep -F -f file1 file2

功能:可以把文件2中存在文件1的行输出

但是我做了一个试验:

  • 如果文件1中没有重复的行,结果是对的!
  • 如果有重复的行,结果和没有重复的行是一样的!

我想达到的目的是 文件1放的是手机号的前7位,文件2放的是手机号前7位 和 所代表的省份,输出结果然后统计文件1每个省有多少个手机号码??

[root@SOR_SYS hahah]# cat file1 
11111
22222
11111
22222
33333
44444
55555
[root@SOR_SYS hahah]# cat file2
11111 bj
22222 hb
33333 hn
44444 nm
55555 xm
66666 mk

[root@SOR_SYS hahah]# grep -F -f file1 file2
11111 bj
22222 hb
33333 hn
44444 nm
55555 xm
[root@SOR_SYS hahah]# 

看来这个是无法实现了,file1中有2个11111和2个22222,即如果file1有重复的行,还重复输出。

[root@SOR_SYS hahah]# join -1 2 -2 1 <(sort file1|uniq -c) <(sort file2)
11111 2 bj
22222 2 hb
33333 1 hn
44444 1 nm
55555 1 xm

例子:

  1. 从当前目录开始查找所有扩展名为 .in 的文本文件,并找出包含 "thermcontact" 的行:
find . -name "*.in" | xargs grep "thermcontact"
grep Aug /var/log/messages          # 在文件 '/var/log/messages'中查找关键词"Aug" 
grep ^Aug /var/log/messages         # 在文件 '/var/log/messages'中查找以"Aug"开始的词汇 
grep [0-9] /var/log/messages        # 选择 '/var/log/messages' 文件中所有包含数字的行 
grep Aug -R /var/log/*              # 在目录 '/var/log' 及随后的目录中搜索字符串"Aug" 

LINUX 在 指定目录下,包括子目录

grep -inr cusermanage *

//以上表示在当前目录下查找”cusermanage“ 匹配
awk、sed、grep更适合的方向:

  • grep 更适合单纯的查找或匹配文本;
  • sed 更适合编辑匹配到的文本;
  • awk 更适合格式化文本,对文本进行较复杂格式处理;

你可能感兴趣的:(Linux常用命令详解 | grep)