基本正则表达式元字符:


    字符匹配:

        .: 匹配任意单个字符;

        []: 匹配指定范围内的任意单个字符

        [^]:匹配指定范围外的任意单个字符

        [:digit:]: 数字字符

        [:lower:]: 小写字母字符

        [:upper:]: 大写字母,等价于[A-Z]

        [:alpha:]: 小写及大写字母,等价于[a-zA-Z]

        [:alnum:]: 小写和大写字母及数字,等价于[a-zA-Z0-9]

        [:punct:]: 标点符号,包括问号、句号、逗号、冒号、分号、单引号、英文的重音符或中文的间隔号(`)、!、@、#、%、^、&、*、左右括 号、左右中括号、左右大括号、正斜杠(/)、-、_

        [:space:]: 空白字符,包括空格、水平制表符、垂直制表符、换行、换页、回车


    匹配次数:用在要指定次数的字符后面,用于指定前面的字符要出现的次数;

        *:匹配前面的字符任意次;

            例如: grep "x*y"

                abxy

                xay

                xxxxxxy

        贪婪模式

        .*:任意长度的任意字符;

        \?:匹配其前面的字符0或1次;即前面的可有可无;

        \+:匹配其前面的字符至少1次;

        \{m\}:匹配前面的字符m次;

        \{m,n\}:匹配前面的字符至少m次,至多n次;

            \{0,n\}:匹配前面的字符至多n次;

            \{m,\}:匹配前面的字符至少m次;


    位置锚定:

        ^:行首锚定;用于模式的最左侧;

        $:行尾锚定;用于模式的最右侧;

        ^PATTERN$: 用于模式匹配整行;

            ^$:空行;

            ^[[:space:]]*$

        \< 或 \b:词首锚定;用于单词模式的左侧;

        \> 或 \b:词尾锚定;用于单词模式的右侧;

        \:匹配整个单词;


    分组:

        \(\):将一个或多个字符捆绑在一起,当作一个整体进行处理;

             \(xy\)*ab

        Note: 分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命名方式为: \1, \2, \3, ...

        \1: 从左侧起,第一个左括号以及与之匹配右括号之间的模式所匹配到的字符;

             \(ab\+\(xy\)*\):

                \1: ab\+\(xy\)*

                \2: xy

        后向引用:引用前面的分组括号中的模式所匹配字符,(而非模式本身)




扩展正则表达式的元字符:


    字符匹配:

        .

        []

        [^]


    次数匹配:

        *

        ?: 0或1次;

        +:1次或多次;

        {m}:匹配m次;

        {m,n}:至少m,至多n次;


    锚定:

        ^

        $

        \<, \b

        \>, \b


    分组:

        ()

        后向引用:\1, \2, ...


    或者:

        a|b

        C|cat: C或cat




练习:

    1、显示/proc/meminfo文件中以大小s开头的行;(要求:使用两种方式)

# grep -i ^s /proc/meminfo

        or

# grep ^[sS] /proc/meminfo

    2、显示/etc/passwd文件中不以/bin/bash结尾的行;

# grep -v '/bin/bash$' /etc/passwd

    3、显示/etc/passwd文件中ID号最大的用户的用户名;

# sort -t: -k3 -n /etc/passwd | tail -1 | cut -d: -f1

    4、如果用户root存在,显示其默认的shell程序;

# finger root | grep -i shell | cut -d: -f3

        or

# id root &> /dev/null && grep "^root\>" /etc/passwd | cut -d: -f7

        or

# grep "^root\>" /etc/passwd | cut -d: -f7

    5、找出/etc/passwd中的两位或三位数;

# grep -o "\<[0-9]\{2,3\}\>" /etc/passwd

    6、显示/etc/rc.d/rc.sysinit文件中,至少以一个空白字符开头的且后面存非空白字符的行;

# grep "^[[:space:]]\+[^[:space:]]" /etc/grub2.cfg

    7、找出"netstat -tan"命令的结果中以'LISTEN'后跟0、1或多个空白字符结尾的行;

# netstat -tan | grep "LISTEN[[:space:]]*$"

    8、添加用户bash、testbash、basher以及nologin(其shell为/sbin/nologin);而后找出/etc/passwd文件中用户名同shell名的行;

# grep "^\([[:alnum:]]\+\>\).*\1$" /etc/passwd

    9、显示当前系统root、centos或user1用户的默认shell和UID;

# grep -E '^(root|centos|user1)\>' /etc/passwd | cut -d: -f1,3,7

    10、找出/etc/rc.d/init.d/functions文件(centos6)中某单词后面跟一个小括号的行;

# grep -E -o "^[_[:alpha:]]+\(\)" /etc/rc.d/init.d/functions

    11、使用echo输出一绝对路径,使用egrep取出其基名(类似basename命令);

# echo "/mnt/sdc" | grep -E -o "[^/]+/?$" | cut -d"/" -f1

        or

# echo "/etc/sysconfig/network/" | egrep -o "\<[[:alpha:]]+\>/?$" | cut -d'/' -f1