昨天看了同事的一个shell脚本,如下:
awk 'NR==FNR{++a[$1]}a[$1]==0{print $1,a[$1]}' ./a.txt ./b.txt
作用是:打印出b.txt第一列中不在a中行,初一看,不是很懂,shell脚本没有系统的学过,平时用也只是一些简单的执行下可执行程序,跑下定时任务
NR和FNR,NR打印行数,FNR同样是打印行数,区别是后者每次打开一个文件时都会置0
a.txt
123
456
b.txt
456
789
111
awk '{print NR,FNR,$1}' a.txt b.txt
1 1 123
2 2 456
3 1 456
4 2 4567
5 3 90
看下这行语句,看怎么实现的吧
NR==FNR{++a[$1]} 表示打开第一个文件,建立一个关联数据a[$1]=1,即将文件一中第一列的每一行放到一个关联数组中了
这是第一个文件的处理,再看下第二个文件
a[$1]==0{print $1}如果a[$1]==0即对于第二个文件中,元素不在关联数组中则打印出来!
这样一个简单的语句就实现了功能,也有其他更简单的方法 比如grep -vwf a.txt b.txt