awk、sed和正则表达式

awk也是一种脚本语言,SHELL能做的,awk几乎都能办到。awk较常用于处理按指定分隔符分隔的文本文件。

printf  '列印格式' 实际内容

sed 可以分析 Standard Input (STDIN) 的资料, 然后将资料经过处理后,再将他输出到 standrad out (STDOUT) 的一个工具。 至于处理呢?可以进行取代、删除、新增、撷取特定行等等的功能呢!

sed [-nefr] [动作]

参数∶

-n ∶使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN 的资料一般都会被列出到萤幕上。但如果加上 -n 参数后,则只有经过 sed 特殊处理的那一行(或者动作)才会被列出来。

-e ∶直接在指令列模式上进行 sed 的动作编辑;

-f ∶直接将 sed 的动作写在一个档案内, -f filename 则可以执行 filename 内的 sed 动作;

-r ∶sed 的动作支援的是延伸型正规表示法的语法。(预设是基础正规表示法语法)

-i ∶直接修改读取的档案内容,而不是由萤幕输出。

动作说明∶ [n1[,n2]]function n1, n2 ∶不见得会存在,一般代表『选择进行动作的行数』,举例来说,如果我的动作 是需要在 10 到 20 行之间进行的,则『 10,20[动作行为] 』

function 有底下这些咚咚∶

a ∶新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)~

c ∶取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行!

d ∶删除,因为是删除啊,所以 d 后面通常不接任何咚咚;

i ∶插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);

p ∶列印,亦即将某个选择的资料印出。通常 p 会与参数 sed -n 一起运作~

s ∶取代,可以直接进行取代的工作哩!通常这个 s 的动作可以搭配 正规表示法!例如 1,20s/old/new/g 就是啦!

sed 后面接的动作,请务必以 '' 两个单引号括住喔!

awk '条件类型1{动作1}   条件类型2{动作2}   ...'   filename

awk 主要是处理『每一行的栏位内的资料』,而预设的『栏位的分隔符号为 "空白键" 或 "[tab]键" 』!

awk 的处理流程是∶

  1. 读入第一行,并将第一行的资料填入 $0, $1, $2.... 等变数当中;
  2. 依据 "条件类型" 的限制,判断是否需要进行后面的 "动作";
  3. 做完所有的动作与条件类型;
  4. 若还有后续的『行』的资料,则重复上面 1~3 的步骤,直到所有的资料都读完为止。
注意, awk 后续的所有动作以 ' 括住, 所以,内容如果想要以 print 列印时,记得,非变数的文字部分,包含上一小节 printf 提到的格式中,都需要使用双引号来定义出来喔!

awk、sed和正则表达式_第1张图片

awk、sed和正则表达式_第2张图片

有趣吧!不过,怎么第一行没有正确的显示出来呢?这是因为我们读入第一行的时候, 那些变数 $1, $2... 预设还是以空白键为分隔的,所以虽然我们定义了 FS=":" 了, 但是却仅能在第二行后才开始生效。那么怎么办呢?我们可以预先设定 awk 的变数啊! 利用 BEGIN 这个关键字喔!这样做∶

awk、sed和正则表达式_第3张图片

  • 所有的动作,亦即在 {} 内的动作,如果有需要多个指令辅助时,可利用分号『;』间隔, 或者直接以 [Enter] 按键来隔开每个指令,例如上面的 NR>=2 后面接的动作, 利用 total = ... 那个指令来指定加总,而后续则以 printf 来格式化输出!
  • 逻辑运算当中,如果是『等于』的情况,则务必使用两个等号『==』!
  • 格式化输出时,在 printf 的格式设定当中,务必加上 /n ,才能进行分行
  • 与 bash shell 的变数不同,在 awk 当中,变数可以直接使用,不需加上 $ 符号

另外, awk 的动作内 {} 也是支援 if (条件) 的喔!

你可能感兴趣的:(正则表达式,function,shell,bash,input,n2)