Linux基本操作 10----- 正则表达式与文件格式化处理


一 正则表达式

    1 简单的说正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表达式通过一些特殊符号的辅助,可以让用户轻易的达到查找,删除,替换某特定字符串的处理程序

    2 grep在数据中查找一个字符串时,是以整行为单位来进行数据的选取的,也就是说假如一个文件内有10行,那么其中两行是有用的,那么就将这两行显示出来,其它的丢弃

    3 在bash当中,我们知道通配符*可以用来表示任意个字符,但是正则表达式中的*表示不同的含义

       在正则表达式中,'.'表示的是一定有一个任意字符的意思

       在正则表达式中,'*'表示的是重复前一个字符0到无穷多次的意思

    4 基础的正则表达式

       RE字符                        意义

        ^word                    查找行首为word的行

        word$                   查找结尾为word的行

            .                        代表一定有一个任意的字符

            \                        转义字符,将特殊字符的特殊意义去除

            *                       重复前一个字符0个到无穷多个

          [list]                     从字符集合里面选择一个字符

          [n1-n2]                从要选择的范围里面选择一个字符

          [^list]                   从不是这个字符集合里面找出一个字符

          \{n,m\}                 连续n到m个的前一个字符,\{n\}则是连续n个前一个字符,\{n,\}则是联系n到无穷多个前一个字符


二 sed 工具

     1 sed本省是一个管道命令,可以分析标转输入,而且sed还可以将数据进行替换,删除,新增,选取特定行等功能

     2 sed的用法

        sed [-nefr] [动作]

        -n 使用安静模式,在一般模式中,所有来自stdin的数据一般都会被列出到屏幕上,但是如果加上-n这个参数的话,则只有经过sed特殊处理的那一行才会被列出

        -e 直接在命令模式上进行sed的动作编辑

        -f 直接将sed的动作写在一个文件内,-f filename则可以执行filename内的sed动作

        -r sed的动作支持的是扩展正则表达式的语法

        -i 直接修改文件的内容,而不是由屏幕输出

     3 动作说明 n1,n2 function

        n1,n2不见得会存在,一般代表的是进行的动作的行数

        function有下面这些参数

        a: 新增,a的后面可以接字符串,而这些字符串会在新的一行出现,目前的下一行

        c: 替换,c的后面可以接字符串,这些字符串可以替换n1,n2之间的行

        d: 删除,因为是删除,所以d后面通常不接任何参数

         i: 插入,i的后面可以接字符串,而这些字符串会在新的一行,目前的上一行

        p: 打印,也就是将某个选择的数据打印出来

        s: 替换,可以直接进行替换的工作


三 文件的格式化以及相关处理

     1 格式化打印

        printf '打印内容‘ 实际内容

        关于C程序语言内,常见的变量格式

        %ns  那个n是数字,s代表的是string

        %nd  那个n是数字,d代表的是整数

        %N.nf 那个n与N都是数字,f代表浮点数

     2 文件比较工具diff

        diff就是用在比较两个文件之间的区别,并且是行为单位来比较的,一般是用在ASCLL纯文本文件的比较上

        diff的用法

        diff [-bBi] from_file to_file

        -b 忽略一行当中仅有多个空白的区别

        -B 忽略空白行的区别

        -i   忽略大小写的不同

      3 如果我们要将旧的文件升级成为新的文件时,我们可以先利用diff比较出文件的区别,并将区别文件制作成为补丁文件,再由补丁文件更新旧文件即可。

         一般来说我们使用diff制作出来的比较文件通常扩展名为.patch

         更新:patch -pN < patch_file

         还原:patch -R -pN < patch_file

         举例: diff file1 file2 > diff.patch   //得到补丁文件diff.patch

                   patch file1 < diff.patch  //为file1打补丁




你可能感兴趣的:(Linux基本操作 10----- 正则表达式与文件格式化处理)