awk基础

AWK程序:

调用方式:

1、命令行方式:awk [-F field-separator] 'commands' input-file(s)
2、将所有awk命令插入一个文件,并使其可执行,然后用awk命令解释器作为脚本首行,便于输入脚本名称来调用。#!/bin/awk -f
3、将所有awk命令插入一个单独的文件,然后调用:awk -f awk-script-file input-file(s)

任何的awk语句都是由模块和动作组成,模块包括两个特殊的字段BEGIN和END,BEGIN用于设置计数和打印头,END用来在awk完成文本浏览动作之后打印输出文本总数和结尾状态标志。实际的动作在{}内部指明,如不指定,awk将打印出所有浏览出来的记录。

awk执行时,其浏览域标记为$1,$2...$n。所有域用$0表示。

awk中的正则表达式及操作,元字符 \ ^ $ . [] | () + ? * 等。条件操作符有 < <= == != > >= ~ !~;~为匹配正则表达式。逻辑运算: && and || or ! 等。

内置变量:

ARGC 命令行参数个数
ARGV 命令行参数排列
ENVIRON 支持队列中系统环境变量的使用
FILENAME awk浏览的文件名
FNR 浏览文件的记录数
FS 设置输入域分隔符,等价于命令行 -F选项
NF 浏览记录的域的个数
NR 已读的记录数
OFS 输出域分隔符
ORS 输出记录分隔符
RS 控制记录分隔符

这里的NF的一个常用的功能是将变量$PWD 返回值传入awk并显示其目录,当然这里需要指定分隔符为’/’。echo $PWD | awk -F '/' '{print $NF}'

awk命令出错排查

1、确保命令内部的引号都是成对出现
2、保证整个命令是用”单引号括起来的
3、注意{}括起动作语句,()括起条件语句

awk '{if($4~/aa/) print $0}' test.file <===> awk '$0 ~ /aa/' test.file

awk内置字符串函数

gsub(r,s) 在整个 0srgsub(r,s,t)tsrindex(s,t)stlength(s)smatch(s,r)srsplit(s,a,fs)fssasprint(fmt,exp)fmtexpsub(r,s) 0中最左边最长的子串代替s
substr(s,p) 返回字符串s中从p开始的后缀部分
substr(s,p,n) 返回字符串s中从p开始长度为n的后缀部分

向一行awk命令传值:awk '{if($5 < AGE) print $0}' AGE=10 test.file
向awk脚本传值:awk script_file var=value input_file
写awk脚本:首行:#!/bin/awk -f

#!/bin/awk -f

BEGIN{
str="123,456,789";
split(str,myarray,",")}
END{
for (i in myarray) {print myarray[i]}
}

你可能感兴趣的:(linux)