从零开始学习Linux(四十三):Shell编程之awk命令

1、awk命令简介

awk命令是一种处理文本文件的语言,是一个强大的文本分析工具。
awk命令也可以叫awk编程,能够识别非制表符的空格,可以解决cut命令解决不了的问题。
awk命令非常复杂,本章节我们只介绍部分常用的功能。

2、awk命令格式

命令格式:awk '条件1{动作1} 条件2{动作2}…' 文件名

条件:
一般使用关系表达式作为条件
x > 10 判断变量x是否大于10;
x >= 10 判断变量x是否大于等于10;
x <= 10 判断变量x是否小于等于10;

动作:
格式化输出;
流程控制语句;

3、awk命令使用说明

创建成绩单文件score.txt,内容如下:

从零开始学习Linux(四十三):Shell编程之awk命令_第1张图片
3.1、提取成绩单中第2列和第4列

执行命令:

awk '{printf $2 "\t" $4 "\n"}' score.txt

命令中$2代表第2列,$4代表第4列。命令中没有加入任何条件,所以针对的是文件中的每一行数据。对每一行数据打印第2列和第4列。命令执行结果如下图所示:

从零开始学习Linux(四十三):Shell编程之awk命令_第2张图片
3.2、提取按空格分隔的内容

使用 df -h 命令,查看空间占用情况。命令输出内容如下图所示:

从零开始学习Linux(四十三):Shell编程之awk命令_第3张图片

df命令输出结果是以空格分隔的,而非Tab键。

执行命令,提取输出结果的中FileSystem列和Mounted列:

df -h | awk '{printf $1 "\t" $6 "\n"}'

命令执行结果如下所示:

从零开始学习Linux(四十三):Shell编程之awk命令_第4张图片

执行以下命令也可以输出同样的结果:

df -h | awk '{print $1 "\t" $6}'
从零开始学习Linux(四十三):Shell编程之awk命令_第5张图片

两条命令区别:

  • printf 不可以自动换行,需要在行尾增加换行符;
  • print 可以在末尾自动换行;
  • 在Linux系统中没有print命令只有printf命令,在awk命令中两个都支持;
3.3、BEGIN

注意:BEGIN必须是大写,它是一个条件。它的作用是强制第一个执行他后面的语句。

执行命令:

awk 'BEGIN{printf "Test Begin \n"}{printf $2 "\t" $4 "\n"}' score.txt

执行结果如下图所示:

从零开始学习Linux(四十三):Shell编程之awk命令_第6张图片

BEGIN{printf "Test Begin \n"} 会在输出文件内容第2列和第4列之前输出一句话Test Begin。

3.4、END

同BEGIN相类似,END是强制最后一个执行它后面的语句。

同时指定BEGIN和END,执行命令:

awk 'BEGIN{printf "Test Begin \n"}{printf $2 "\t" $4 "\n"}END{printf "Test End \n"}' score.txt

输出结果如下图所示:

从零开始学习Linux(四十三):Shell编程之awk命令_第7张图片
3.5、FS内置变量

可以在BEGIN中通过FS内置变量指定分隔符。
FS=':',表示指定:为分隔符。

cat /etc/passwd | grep "/bin/bash"

查看passwd文件中可登陆用户信息,输出结果如下图所示:

从零开始学习Linux(四十三):Shell编程之awk命令_第8张图片

指定分隔符按照:分隔,将结果输出第一列和第三列,执行命令:

cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} {printf $1 "\t" $3 "\n"}'

命令执行结果如下图所示:

从零开始学习Linux(四十三):Shell编程之awk命令_第9张图片
3.6、关系运算符

筛选出来语文成绩大于等于90的同学,输出其名称和语文成绩。执行命令:

cat score.txt | awk '$3>=90{printf $2 "\t" $3 "\n"}'

命令执行结果,如下图所示:

从零开始学习Linux(四十三):Shell编程之awk命令_第10张图片

说明:awk命令还有其他的功能,其功能非常强大。专门有书籍介绍awk命令,有兴趣的可以自行摸索使用方法。

你可能感兴趣的:(从零开始学习Linux(四十三):Shell编程之awk命令)