Linux三剑客(awk-3)-awk变量

本文取自朱双印——awk从放弃到入门(3):awk变量

对于awk来说,变量又分为内置变量自定义变量输入分隔符FS输出分割符OFS都属于内置变量。内置变量就是awk预定义好的,内置在awk内部的变量,而自定义变量就是用户定义的变量。

我们先看下awk常用的内置变量。

命令 作用
FS 输入字段分割符,默认是空白字符
OFS 输出字段分割符,默认是空白字符
RS 输入记录分割符(输入换行符)指定输入时的换行符
ORS 输出记录分割符(输出换行符)输出时用指定符号代替换行符
NF (number of Field)当前行的字段个数(当前行分割了几列),字段数量
NR 行号,当前处理的文本行的行号
FNR 各文件分别计数的行号
FILENAME 当前文件名
ARGV 数组,保存的是命令行所给定的各参数
  1. 内部变量NR

NR比较简单,我们先看NR的例子。

首先,如下图所示,test1文件一共有两行文本,使用空格隔开,第1行有4列,第2行有5列。


文件准备

而内置变量NR表示每一行的行号,内置变量NF表示每一行中一共有几列。

Linux三剑客(awk-3)-awk变量_第1张图片
image.png

或者,利用NR内置变量,先打印行号,在打印出整行内容,相当于为test1的没一行都添加了行号一行在输出。

Linux三剑客(awk-3)-awk变量_第2张图片
添加行号打印

注意:在base中,我们在引用变量时,都会使用$符进行引用,但是在awk中,只有在引用$0,$1等内置变量的值的时候,才会使用$,引用其他变量时,不管是内置变量,还是自定义变量,都不使用$,而是直接使用变量名。

2. 内置变量FNR

内置变量FNR是什么意思?

当我们使用awk同时处理多个文件的时候,并且使用NR显示行号。效果如下图:


Linux三剑客(awk-3)-awk变量_第3张图片
image.png

从返回结果可以看出,awk处理多个文件的时候,使用NR显示行号,那么,多个文件的所有行会按照顺序进行排序。

可是,如果我们想要分别显示两个文件的行号,该怎么办,这时候就会使用到内置变量FNR,效果如下:

Linux三剑客(awk-3)-awk变量_第4张图片
分别对文件行数计数

FNR内置变量的作用就是当awk处理多个文件时,分别对每个文件的行数进行计数。

3. 内置变量RS

RS可以理解为Return Separator。输入行分割符,如果不指定,默认的“行分割符”就是我们理解的“回车换行”。

Linux三剑客(awk-3)-awk变量_第5张图片
使用RS指定输入行分隔符

如上图所示,我们先使用默认的“回车换行”作为“行分割符”输出test1文本,这时显示的文本一共2行。

当我们使用“空格”作为“行分割符时”,在awk解析文本时,每当遇到空格,awk就会认为遇到的[空格]是[换行符],于是awk就将文件换行了,而此时人类所理解的[回车换行],对于awk来说并不是所谓的换行符,所以才会出现上图的情况。

所以,正如上图所返回的信息中,我们可以看到,人类所认为的“两行”,共用了一个行号,awk认为他们就是第4行。

4. 内置变量OFS

默认情况下,awk将人类眼中的“回车换行”,当做“输出行分隔符”,此时,awk的世界观和人类的世界观是相同的。

此时,我们改变一下awk的想法,我们让awk认为,“+++”才是真正的输出行分割符,示例如下图所示:

Linux三剑客(awk-3)-awk变量_第6张图片
ORS行分割符

在没有指定输出行分割符之前,awk跟人类的逻辑是一样的,当awk输出文件的时候,如果想要换行,就会“另起一行”(回车换行),可是,若是我们指定了“输出行分割符”为“+++”,那么,当awk在输出文字的时候,如果想要换行,就会“另起一行”(+++)。所有,对于awk来说,他完成了“另起一行”的动作。

输入换行符合输出换行符同时使用。


Linux三剑客(awk-3)-awk变量_第7张图片
输入换行符合输出换行符

5. 内置变量FILENAME

FILENAME这个内置变量,从字面意思上看,就是显示文件名。

Linux三剑客(awk-3)-awk变量_第8张图片
FILENAME显示文件名

6. 内置变量ARGC和ARGV

ARGV内置变量表示一个数组,这个数组中保存的是命令行给定的采纳数。【ARG Value表示的是参数值】

Linux三剑客(awk-3)-awk变量_第9张图片
ARGV给定的参数

上图,我们使用BEGIN模式,输出一个字符串“aaa”,然后,传入两个文件的文件名作为参数,我们发现,BEGIN模式正常执行了打印操作,输出了“aaa”字符串,我们使用同样的命令,同样的BEGIN模式,只不过,这次不只是打印了“aaa”,还打印了ARGV这个数组中第二个元素的值。

ARGV内置变量表示的是一个数组,既然是数组,就需要上图的下标的方式,引用对应元素的值,因为数组的索引都是0开始的,所以,ARGV[1]表示的引用ARGV数组的第二个元素的值,从返回结果可以看到,ARGV[1]对应的是test1。同理,我们又使用了第三条命令,多打印一个ARGV[2]的值,发现ARGV[2]对应的值为test2。即:ARGV内置变量表示的是:所有参数组成的数组。那么ARGV[0]对应的是哪个参数呢?

ARGV[0]对应的参数

ARGV的第一个参数居然是:awk参数本身。

好吧,awk就是这么规定的,'pattern{action}'并不被看作是参数,awk被看做为参数。

ARGC可以看做【ARG Count】表示的是参数的数量。也可以理解为ARGV数组的长度。

ARGV表示的数组的长度

6. 自定义变量

自定义变量就是用户定义的变量,有两种方法可以自定义变量。

方法一:-v varName=value 变量名区分字符大小写;
方法二: 在program中直接定义;

2.1 方法一自定义变量

自定义变量

这种方法,与设置内置变量的值得方法是一样的。

2.2 program中自定义变量

paogram自定义变量

当然我们也可以一次性定义多个变量。

一次性定义多个变量

需要注意的是,第一种方式虽然看起来麻烦,但是这种方法也有自己的优势。

当我们需要在awk中引用shell变量的时候,可以通过方法一间接引用。

Linux三剑客(awk-3)-awk变量_第10张图片
awk自定义变量间接引用shell变量

你可能感兴趣的:(Linux三剑客(awk-3)-awk变量)