Linux常用命令—grep

简介

grep命令(Global Regular Expression Print)是 Linux系统中一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来 。

grep 是linux中最为常用的三大文本(awk,sed,grep)处理工具之一,所以有必要掌握其用法。

grep家族总共有三个成员构成:grep、egrep、fgrep。

使用格式

grep [选项] 字符串/正则表达式 [文件]

参数[选项]

  -a  或  --text        不要忽略二进制的数据。
  -A  <显示列数>  或--after-context=<显示列数>   除了显示符合范本样式的那一列之外,并显示该列之后的内容。
  -b  或  --byte-offset     在显示符合范本样式的那一列之前,标示出该列第一个字符的位编号。
  -B  <显示列数>  或  --before-context=<显示列数>   除了显示符合范本样式的那一列之外,并显示该列之前的内容。
  -c  或--count   计算符合范本样式的列数。
  -C <显示列数>  或--context=<显示列数>或 -<显示列数>   除了显示符合范本样式的那一列之外,并显示该列之前后的内容。
  -d  <进行动作> 或  --directories=<进行动作>   当指定要查找的是文件夹而非文件时。必须使用这项參数,否则grep指令将回报信息并停止动作。
  -e  <范本样式> 或 --regexp=<范本样式>   指定字符串做为查找文件内容的范本样式。
  -E 或 --extended-regexp   将范本样式为延伸的普通表示法来使用。
  -f <范本文件> 或 --file= <范本文件>   指定范本文件,其内容含有一个或多个范本样式,让grep查找符合范本条件的文件内容,格式为每列一个范本样式。
  -F 或  --fixed-regexp   将范本样式视为固定字符串的列表。
  -G 或  --basic-regexp   将范本样式视为普通的表示法来使用。
  -h 或  --no-filename   在显示符合范本样式的那一列之前,不标示该列所属的文件名。
  -H 或  --with-filename   在显示符合范本样式的那一列之前,表示该列所属的文件名。
  -i  或  --ignore-case   忽略字符大写和小写的区别。
  -l 或  --file-with-matches   列出文件内容符合指定的范本样式的文件名。
  -L 或  --files-without-match   列出文件内容不符合指定的范本样式的文件名。
  -n 或  --line-number   在显示符合范本样式的那一列之前,标示出该列的列数编号。
  -q 或 --quiet或--silent   不显示不论什么信息。
  -r 或 --recursive   此參数的效果和指定“-d recurse”參数同样。
  -s 或 --no-messages   不显示错误信息。
  -v 或 --revert-match   反转查找。
  -V或 --version   显示版本号信息。
  -w 或 --word-regexp   仅仅显示全字符合的列。
  -x 或 --line-regexp   仅仅显示全列符合的列。
  -y   此參数的效果和指定“-i”參数同样。
  --help   在线帮助。

常用参数[选项]

-c 只输出匹配行的数量
-i 不区分大小写(只适用于单字符)
-h 查询多文件时不显示文件名
-l 查询多文件时只输出包含匹配字符的文件名
-n 显示匹配行及行号
-s 不显示不存在或无匹配文本的错误信息
-v 显示不包含匹配文本的所有行。

单引号还是双引号

在grep 命令中输入 字符串参数时,用双引号括起来。
例如:grep “error code” ./log.txt
这样做有两个原因:
一是以防字符串参数被误解为shell命令;
二是可以用来查找多个单词组成的字符串。如果不用双引号将其括起来,那么单词 “code” 将被误认为是一个文件,查询结果将返回”文件不存在”的错误信息。

在使用变量时,也应该使用双引号,例如:grep “$ERROR” ./log.txt,如果不这样,将没有返回结果。

在调用模式匹配[正则表达式]时,应使用单引号:grep ‘error.*’ ./log.txt

注意

(1)搜索当前目录
默认情况下,grep 只搜索当前目录,如果此目录下有许多子目录,
grep 会以如下形式列出:

grep "test" ./*
grep: ./TEST: Is a directory
grep: ./oss: Is a directory
grep: ./行业热文UID: Is a directory

这可能会使‘grep’的输出难于阅读。这里有两种解决的办法:
明确要求搜索子目录:grep -r
忽略子目录:grep -d skip

(2)特殊符号
\< 和 \> 分别标注单词的开始与结尾。
例如:
grep man ./* 会匹配 “Batman”、“manic”、“man"等,
grep ‘\ grep ‘\’ 只匹配"man",而不是 “Batman”、"manic"等其他的字符串。

‘^’:指匹配的字符串在行首;
‘$’:指匹配的字符串在行尾。

实例

# 在当前目录下所有 .doc 文件中查找字符串"test"
$ grep  "test"  *.doc   
# 查询 log.txt 中 含有 "test" 的行数   
$ grep  -c  "test"  ./log.txt
# 输出含有"test" 的行以及行号
$ grep  -n  "test"  ./log.txt
# 查询特殊字符时,诸如 $  .  ‘  ”  *  [ ]  ^  |  \  +  ?   时,未避免转义,需要在前面加 '\' 
#查询含有文件名 test.conf 的行 
$grep  "test\.conf"    ./log.txt  
#查询目录列表中的 所有目录[文件夹]
$ls  -l  |grep  "^d"   
#查询目录列表中的 所有文件
$ls -l |grep  -v  "^d"

你可能感兴趣的:(Linux)