Linux正则表达式及扩展表达式、egrep命令的说明(8月27日作业练习)

1、总结本此课程中所涉及命令的使用方法及相关示例展示;

权限管理:
        权限管理: chmod
        所属关系管理: chown, chgrp
        文件遮罩码:umask

    修改文件权限:chmod
       chmod [OPTION]... MODE[,MODE]... FILE...
       chmod [OPTION]... OCTAL-MODE FILE...
       chmod [OPTION]... --reference=RFILE FILE..

       三类:
           u: owner
           g: group
           o: other
           a: all

           两种用法:
               =mode
                   =rx, =r, =
                   ug=rx, go=
               [+|-]mode
                   u+r,
                        +w
                       +x

               -R: recursive

    修改文件属主:chown
        chown [OPTION]... [OWNER][:[GROUP]] FILE...
           chown [OPTION]... --reference=RFILE FILE...
               -R: recursive

    修改文件属组:chgrp

    umask:遮罩码
        目录:777-umask
        文件:666-umask
            如果某一类用户的权限减得的结果有执行权限,此时会自动让其权限位加1;

        umask UMASK
            设定:仅对当前shell进程有效;

 

2、总结基本正则表达式及扩展正则表达式

grep:
    Linux文本处理三剑客:
        grep: 文本过滤工具;
        sed:文本编辑器(行);stream editor
        awk:文本报告生成器;Linux上awk的实现为gawk

    grep: Global search REgular expression and Print out the line.
        作用:文本搜索工具,根据用户指定的“模式(pattern)”逐行去搜索目标文本,打印匹配到的行;
        模式:由正则表达式的元字符及文本字符所编写的过滤条件;

            元字符:字符不表示其字面意义,而用于表示通配或控制功能;

        分两类:
            基本正则表达式:BRE
            扩展正则表达式:ERE

            正则表达式引擎;

    grep [OPTIONS] PATTERN [FILE...]:
        选项:
            --color=auto:对匹配到的串做高亮显示;
            -v:显示模式匹配不到行;
            -i: 忽略字符大小写;
            -o: 仅显示能够被模式匹配到的串本行;
            -q: 静默模式;
            -E:使用扩展的正则表达式;

        基本正则表达式的元字符:
            字符匹配:
                .   : 匹配任意单个字符;
                []:匹配指定范围内的任意单个字符;
                [^]:匹配指定范围外的任意单个字符;

    

      字符集合:

 

POSIX 字符集合

说明

[:alnum:]

任何一个字母或数字(A - Z, a - z, 0 - 9)

[:alpha:]

任何一个字母(A - Z, a - z)

[:ascii:]

任何一个 ASCII 范围内字符(\x00 �C \x7F)

[:cntrl:]

任何一个控制字符(\x00 �C \x1F, \x7F)

[:digit:]

任何一个数字(0 �C 9)

[:print:]

任何一个可显示的 ASCII 字符(\x20 �C \x7E)

[:space:]

任何一个空白字符(\x09 �C \x0D, \x20)

[:graph:]

任何一个可显示的 ASCII 字符,不包含空格(\x21 �C \x7E)

[:lower:]

任何一个小写字母(a �C z)

[:upper:]

任何一个大写字母(A �C Z)

[:punct:]

可显示字符 [:print:] 中除去字母数字 [:alnum:]

[:xdigit:]

任何一个十六进制数字(0 - 9, A - F, a - f)

[:blank:]

空格或者制表符(\x20, \x09)

说明 [: 之后为 ^ 时,表示相应字符集合之外的字符。
 

 

           

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

次数匹配:用于要指定其次数的字符的后面;
                *: 任意次;
                    abxy
                    xay
                    xxxxxxxy

                    grep "x*y"

                \?:0或1次;
                    grep "x\?y"

                \+:1或多次;
                \{m\}:精确限制为m次;
                \{m,n\}: 至少m次,至多n次,[m,n]
                    \{0,n\}:至多n次;
                    \{m,\}:至少m次;

                .*: 匹配任意长度的任意字符;

            位置锚定:
                ^: 行首锚定;用于模式的最左侧;
                $: 行尾锚定;用于模式的最右侧;
                \<, \b: 词首锚定;用于表示单词的模式的左侧;
                \>, \b:词尾锚定;用于表示单词的模式的右侧;
                ^$: 空白行;

            分组:\(\)

                分组的小括号中的模式匹配到的内容,会在执行过程中被正则表达式引擎记录下来,并保存内置的变量中;这些变量分别是\1, \2, ...
                    \1: 从左侧起,第一个左括号,以及与之配对的右括号中间的模式所匹配到的内容;
                    \2:
                    ...

                后向引用:使用变量引用前面的分组括号中的模式所匹配到的字符;

   

    扩展的正则表达式:
        grep家庭有三个命令:
            grep:基本正则表达式
                -E: 扩展正则表达式
                -F:不支持正则表达式
            egrep:扩展正则表达式
            fgrep:不支持正则表达式

        扩展正则表达式的元字符: 
    

          和基本正则表达式的不同之处:

            次数匹配:
                *
                ?: 0次或1次;
                +: 1次以上;
                {m}: 精确匹配m次;
                {m,n}: 至少m次,至多n次;

            分组:()
                后向引用:\1, \2, ...

            或者:
                a|b
                    C|cat: 不表示Cat或cat,而表示C或cat;
                        要写成(C|c)at

 

3、显示/etc/passwd文件中以bash结尾的行

[root@srv01 ~]# grep '\(bash\)$' /etc/passwd

效果:

image

 

4、显示/etc/passwd文件中的两位数或三位数

[root@srv01 ~]# grep  '\b[0-9]\{2,3\}\b' /etc/passwd

或者

[root@srv01 ~]# grep  -E '\b[0-9]{2,3}\b' /etc/passwd

效果:

image

注意:

//[root@srv01 ~]# grep '[0-9]\{2,3\}' /etc/passwd    错误写法

 

5、显示`netstat -tan`命令结果中以‘LISTEN’后跟0个、1个或者多个空白字符结尾的行

[root@localhost ~]# netstat -tan | grep 'LISTEN[[:space:]] *$'

效果:

image

 

 

6、添加用户bash、testbash、basher以及nologin用户(nologin用户的shell为/sbin/nologin);而后找出/etc/passwd文件中用户名与其shell名相同的行

[root@localhost ~]# egrep    '(\b[a-z]+[a-z]\b).*\1$' /etc/passwd

说明:*   前面的匹配0次或N次,  \1  引用前面第一个\(\) 的   $以什么结束

效果:

image

 

 

7、显示当前系统上root、centos或者user1用户的默认shell和UID (请事先创建这些用户,若不存在)

[root@srv01 ~]#  egrep '(root|centos|user1)'  /etc/passwd | cut -d : -f3,7

效果:

image

 

8、找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行

[root@localhost ~]# egrep  '^(\w+)\(.*\)' /etc/rc.d/init.d/functions   //此效果为单词后面紧跟()

[root@localhost ~]# egrep   '^\w+.*\(.*\)' /etc/rc.d/init.d/functions   //此效果为单词后面不紧跟(),但后面会有(),也不以()结尾

 

效果:

image

 

9、使用echo输出一个路径,而后egrep找出其路径基名;进一步的使用egrep取出其目录名

路径基名
[root@localhost ~]#  echo  "/etc/sysconfig/modules/" | egrep  '[^/]+/$' | cut -d / -f4

效果:

image

目录名
[root@localhost ~]#  echo  "/etc/sysconfig/modules" | egrep --color=auto '(^[/].*[/]\b)'   

效果:

image

说明:

[root@srv01 ~]# basename  /etc/sysconfig/modules/
modules
[root@srv01 ~]# dirname  /etc/sysconfig/modules/    
/etc/sysconfig
[root@srv01 ~]#

 

10、找出ifconfig命令执行结果中1-255之间的数字

[root@srv01 ~]# ifconfig | egrep -n '\b[1-9]\b|\b[1-9][0-9]\b|\b[1-2][0-9][0-5]\b|\b[1][0-9][0-9]\b'

效果:

image

你可能感兴趣的:(border,blank)