grep
作用:通过一个指定的模式匹配指定的行
常用选项:
-E 扩展正则表达式匹配 相当于egrep命令
-o 只获取匹配到的内容
-v 匹配正则表达式相反的内容
--color=auto 将搜索到的内容高亮
-A num 匹配到搜索到的行以及该行下面的num行
-B num 匹配到搜索到的行以及该行上面的num行
-C num 匹配到搜索到的行以及上下各num行
-n 显示文件的行数
-r 递归目录搜索指定内容的文件
-i 正则表达式内容不区分大小写
基本正则表达式说明:
字符匹配:
.: 匹配任意单个字符;
[]:匹配指定范围内的任意单个字符;
[^]:匹配指定范围内的任意单个字符;
[:lower:] 匹配小写字母
[:upper:] 匹配大写字母
[:alpha] 匹配所有字母
[:digit:] 匹配所有数字
[:alnum:] 匹配所有数字字母 [:alpha:]和[:alpha:]和二为一
[:space] 代表空格字符 例如:tab,换行,空格之类的
[:punct:] 代表标点符号 例如:'! " # $ % & ' ( ) * + , - . / : ; < = > ? @ [ ] ^ _ ' { | }
次数匹配:用于要指定其次数的字符的后面;
*: 任意次;
\?:0或1次;
\+:1或多次;
\{m\}:精确限制为m次;
\{m,n\}: 至少m次,至多n次,[m,n]
\{0,n\}:至多n次;
\{m,\}:至少m次;
.*: 匹配任意长度的任意字符;
位置锚定:
^: 行首锚定;用于模式的最左侧;
$: 行尾锚定;用于模式的最右侧;
\<, \b: 词首锚定;用于表示单词的模式的左侧;
\>, \b:词尾锚定;用于表示单词的模式的右侧;
^$: 空白行;
分组:\(\)
分组的小括号中的模式匹配到的内容,会在执行过程中被正则表达式引擎记录下来,并保存内置的变量中;这些变量分别是\1, \2, ...
\1: 从左侧起,第一个左括号,以及与之配对的右括号中间的模式所匹配到的内容; \2以此类推。
扩展正则表达式的元字符:
字符匹配:
同基本正则表达式
次数匹配
*: 0次或多次
?: 0次或1次;
+: 1次以上;
{m}: 精确匹配m次;
{m,n}: 至少m次,至多n次;
锚定:
^: 锚定行首
$: 锚定行尾
\<, \b: 词首锚定;用于表示单词的模式的左侧;
\>, \b:词尾锚定;用于表示单词的模式的右侧;
分组:
同基本正则表达式
支持或的概念
a|b:匹配a或者b
练习:
1 显示/etc/passwd文件中以bash结尾的行
解答: grep --color=auto 'bash$' /etc/passwd
2 显示/etc/passwd文件中的两位数或三位数
解答: a.基本正则表达式:grep --color=auto '\b[[:digit:]]\{2,3\}\b' /etc/passwd
b.扩展正则表达式:grep --color=auto -E '\b[[:digit:]]{2,3}\b' /etc/passwd
由于基本正则表达式方式和扩展方式差不多,以下解答都采取扩展正则表达式的方式
3 显示'netstat -tan'命令结果中以‘LISTEN’后跟0个、1个或多个空白字符结尾的行;
解答: netstat -tan | grep --color=auto -E 'LISTEN[[:space:]]*$'
4 添加用户bash,testbash, basher以及nologin用户(nologin用户的shell为/sbin/nologin);而后找出/etc/passwd文件中用户名同shell名的行;
解答: 1.useradd bash
2.useradd testbash
3.useradd basher
4.useradd -s /sbin/nologin nologin
5.grep --color=auto -E '^([[:alnum:]]+).*\1$' /etc/passwd
5 显示当前系统上root、centos或user1用户的默认的shell和UID;
解答: egrep '^\<root|centos|user1\>' /etc/passwd | cut -d: -f3,7
6 找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行;
解答: grep -E --color=auto '\<[0-9a-zA-Z_]+\>\(\)' /etc/rc.d/init.d/functions
7 使用echo输出一个路径,而后egrep找出其路径基名;进一步地:使用egrep取出其目录名;
解答:
路径基名命令:echo /opt/app/nginx/conf/nginx.conf | sed 's/\/$//g' | egrep -o '[^/]+$'
路径目录名命令:echo /opt/app/nginx/conf/nginx.conf/ | sed 's/\/$//g' | egrep -o '.*/' | sed 's/\/$//g'
这里如果有更好的办法欢迎来讨论
8 找出ifconfig命令执行结果中1-255之间的数字;
解答: ifconfig | egrep --color=auto '\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>'