Linux学习之路3-grep和正则表达式的应用



grep和正则表达式的应用


Linux文本处理三剑客:

       grep:文本过滤工具;

       sed:文本编辑器(行);stream editor

       awk:文本报告生成器;Linux上awk的实现为gawk

 

grep: Global search REgular expression and Print out theline.

        作用:文本搜索工具,根据用户指定的“模式(pattern)”逐行去搜索目标文本,打印匹配到的行;

        模式:由正则表达式的元字符及文本字符所编写的过滤条件;

 

grep [OPTIONS] PATTERN [FILE...]:

        选项

            --color=auto:对匹配到的串做高亮显示;

            -v:显示模式匹配不到的行;

            -i:忽略字符大小写;

            -o:仅显示能够被模式匹配到的串本行,而且每匹配到的一个就分一行,可以方便统计次数;

            -q: 静默模式;

            -E:使用扩展的正则表达式;

基本正则表达式分2类:

    基本正则表达式:BRE

    扩展正则表达式:ERE

    基本正则表达式的元字符:(字符不表示其字面意义,而用于表示通配或控制功能)

        字符匹配

            .:匹配任意单个字符;

            []:匹配指定范围内的任意单个字符;

            [^]:匹配指定范围内的任意单个字符;

            [:lower:],[:upper:], ...

 

        次数匹配:用于要指定其次数的字符的后面,只能用于前一个字符;

            *:任意次;

            abxy

            xay

            xxxxxxxy

   wKiom1XhHy_QjaKBAAA3eXD90ws825.jpg

 

             \?:0或1次;

        wKioL1XhIWbAM5ckAABBoPHQZp0137.jpg      

 

             \+:1或多次;

             \{m\}:精确限制为m次;

             \{m,n\}:至少m次,至多n次,[m,n]

             \{0,n\}:至多n次;

             \{m,\}:至少m次;

        wKioL1XhIYGypVNyAAA8_mI3OXE559.jpg   

              .*:匹配任意长度的任意字符;

        wKioL1XhIZWyBzPBAABIaVFzbdY445.jpg   

        

        位置锚定:

            ^:行首锚定;用于模式的最左侧;

            $:行尾锚定;用于模式的最右侧;

            \<,\b: 词首锚定;用于表示单词的模式的左侧;

            \>,\b:词尾锚定;用于表示单词的模式的右侧;

            ^$:空白行;

 

        分组:\(\)

 

            分组的小括号中的模式匹配到的内容,会在执行过程中被正则表达式引擎记录下来,并保存内置的变量中;这些变量分别是\1, \2, ...

            \1:从左侧起,第一个左括号,以及与之配对的右括号中间的模式所匹配到的内容;

            \2:

            ...

           后向引用:使用变量引用前面的分组括号中的模式所匹配到的字符;

    练习

    3、显示/etc/passwd文件中以bash结尾的行
       grep "\bbash$" /etc/passwd


    4、显示/etc/passwd文件中的两位数或三位数
       grep "\b[0-9]\{2,3\}\b" /etc/passwd
       grep -E "\b[0-9]{2,3}\b" /etc/passwd


    5、显示`netstat -tan`命令结果中以‘LISTEN’后跟0个、1个或者多个空白字符结尾的行
       netstat -tan | grep "LISTEN[[:space:]]*"


    6、添加用户bash、testbash、basher以及nologin用户(nologin用户的shell为/sbin/nologin); 而后找出/etc/passwd文件中用户名与其shell名相同的行
     grep  "^\([[:alnum:]]\+\>\).*\1$" /etc/passwd


    7、显示当前系统上root、centos或者user1用户的默认shell和UID (请事先创建这些用户,若不存在)
       grep -E "centos|user1|root" /etc/passwd | awk -F: '{print $3 "\t" $7}'
 
    8、找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行
       grep "\<[0-9a-zA-Z_]\+\>()" /etc/rc.d/init.d/functions


    9、使用echo输出一个路径,而后egrep找出其路径基名;进一步的使用egrep取出其目录名
       取路径基名(方法二这种去尾部特定字符的方法很好用哦):

       方法一 echo "/etc/aa/bb/cc/aa5555t.fs/" |grep -Eo "[^/]+/?$" | grep -o ".*[^/]"
       方法二 echo "/etc/aa/bb/cc/aa5555t.fs/" |grep -Eo ".*[^/]" |grep -Eo "[^/]+$" 
       取目录名(其中有利用贪婪模式原理):

echo "/etc/aa/bb/cc/aa5555t.fs" |grep -Eo "/.*[^/]" |grep -Eo "/.*/" | grep -Eo ".*[^/]" |grep -Eo "[^/]+$"    


    10、找出ifconfig命令执行结果中1-255之间的数字
        ifconfig |grep -E '\b(([1-9])|([1-9][0-9])|(1[0-9][0-9])|2[0-5][0-5])\b'


你可能感兴趣的:(正则表达式,grep)