Shell脚本三剑客之Awk

目录

一、AWK工具介绍

1.1.AWK工作原理

1.2.AWK基本命令格式

1.3 常见的内建变量

二、AWK 命令的使用

2.1打印文本内容

2.2 根据$n提取字段

2.3 awk 的运算

2.4 awk 的高级用法 


一、AWK工具介绍


AWK是一种处理文本文件的语言,是一个强大的文本分析工具。
它是专门为文本处理设计的编程语言,也是行处理软件,通常用于扫描、过滤、统计汇总工作。
数据可以来自标准输入也可以是管道或文件。

1.1.AWK工作原理

逐行读取文本,默认以空格或tab键为分隔符进行分隔,将分隔所得的各个字段保存到内建变量中,并按模式或者条件执行编辑命令。
sed命令常用于一整行的处理,而awk比较倾向于将一行分成多个""字段然后再进行处理。awk信息的读入也是逐行读取的,执行结果可以通过print的功能将字段数据打印显示。在使用awk命令的过程中,可以使用逻辑操作符"&"表示"与"、"||表示"或"、"!"表示非";还可以进行简单的数学运算,如+、-、*、/、%、^分别表示加、减、乘、除、取余和乘方。

1.2.AWK基本命令格式

awk [选项] '模式条件{操作}' 文件1 文件2...
awk -f 脚本文件 文件1 文件.....

awk包含几个特殊的内建变量如下所示:

FS:指定每行文本的字段分隔符,默认为空格或制表位。
 
NF:当前处理的行的字段个数。
 
NR:当前处理的行的行号(序数)。
 
$0:当前处理的行的整行内容。
 
$n:当前处理行的第n个字段(第n列)。
 
FILENAME:被处理的文件名。
 
RS:行分隔符。awk从文件上读取资料时,将根据Rs的定义把资料切割成许多条记录,而awk一次仅读入一条记录,以进行处理。预设值是"\n'
简说:数据记录分隔,默认为\n,即每行为一条记录

1.3 常见的内建变量

FS:指定每行文本的字段分隔符,默认为空格或制表位。

NF:当前处理的行的字段个数。

NR:当前处理的行的行号(序数)。

$0:当前处理的行的整行内容。

$n:当前处理行的第n个字段(第n列)。

FILENAME:被处理的文件名。

RS∶ 行分隔符。awk从文件上读取资料时,将根据RS的定义把资料切割成许多条记录,而awk一次仅读入一条记录,以进行处理。预设值是’\n’。

二、AWK 命令的使用

2.1打印文本内容

1.打印 test 文件内容

Shell脚本三剑客之Awk_第1张图片

 

 awk 默认把这一行都看成一列,因为没有被空格分隔,awk默认以 空格 或 tab键 分隔

Shell脚本三剑客之Awk_第2张图片

自定义冒号为分隔符显示分隔之后的第五列

Shell脚本三剑客之Awk_第3张图片 

用 x 作分隔符

Shell脚本三剑客之Awk_第4张图片 

 显示一个空格,空格需要用双引号引起来,如果不用引号默认以变量看待,如果是常量就需要双引号引起来,逗号也有空格效果

2.2 根据$n提取字段

$n,代表提取第几列

awk常用内置变量:$1、$2、NF、NR、$0

$1:代长第一列

s2:代表第二列以此类推

s0:代表整行

NE:一行的列数

NR:行数

例:
打印包含root的整行内容

打印包含root的行的第一列

Shell脚本三剑客之Awk_第5张图片 

 打印包含root的行的第一列和第六列

 打印每一行的列数

Shell脚本三剑客之Awk_第6张图片

显示行号

Shell脚本三剑客之Awk_第7张图片 

打印整行,并显示行号

Shell脚本三剑客之Awk_第8张图片 

打印第二行,不加print也一样,默认就是打印 

Shell脚本三剑客之Awk_第9张图片

打印第二行的第一列

 

 打印总行数

 打印文件最后一行

Shell脚本三剑客之Awk_第10张图片

当前行有几列
第几行有几列

Shell脚本三剑客之Awk_第11张图片 

 Shell脚本三剑客之Awk_第12张图片

 

网卡的IP,流量

根分区的可用量
Shell脚本三剑客之Awk_第13张图片 

逐行执行开始之前执行什么任务,结束之后再执行什么任务,用BEGIN、END

BEGIN一般用来做初始化操作,仅在读取数据记录之前执行一次

END一般用来做汇总操作,仅在读取完数据记录之后执行一次

2.3 awk 的运算

模糊匹配,用 ~ 表示包含,!~ 表示不包含
awk -F: ‘$1~/ro/{pring $2}’ zz ##打印第一列包含ro的行的第二列,以 " : " 分隔
awk -F: ‘$1!~/ro/{pring $2}’ zz ##打印第一列不包含ro的行的第二列,以 " : " 分隔
 

Shell脚本三剑客之Awk_第14张图片

 Shell脚本三剑客之Awk_第15张图片

打印第一列等于 root 的行 

 

打印第三列大于等于1000的行

 打印第三列小于10,或者第三列大于1000的行

Shell脚本三剑客之Awk_第16张图片 

 打印行号大于1小于10的整行

Shell脚本三剑客之Awk_第17张图片

把多行合并为一行,输出时以空格分隔每行,可自定义

Shell脚本三剑客之Awk_第18张图片 

2.4 awk 的高级用法 

awk -v b=“KaTeX parse error: Expected 'EOF', got '#' at position 21: …EGIN{print b}' #̲#将系统的变量a,在awk里赋…a’”}’ ##直接调用需要先用双引号再用单引号
awk -vc=1 ‘BEGIN{print c}’ ##awk直接定义并引用
 

调用函数getline,读取一行数据的时候并不是得到当前行而是当前行的下一行

Shell脚本三剑客之Awk_第19张图片

 打印第三列小于10的整行

Shell脚本三剑客之Awk_第20张图片

 第三列小于10,打印第二列,否则打印第五列

Shell脚本三剑客之Awk_第21张图片

 

 

你可能感兴趣的:(linux,运维,服务器,云计算)