shell脚本之awk基础知识

shell脚本之awk基础知识

  • 命令形式
  • 常用变量名称
  • 内置字符串函数

首先,AWK 是一种处理文本文件的语言,是一个强大的文本分析工具。所以我们使用好AWK就可以提高文本处理效率。

命令形式

awk基本命令格式如下:
awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file
[-F|-f|-v]
大参数,-F指定分隔符,-f调用脚本,-v定义变量 var=value
’ ’
引用代码块
BEGIN
初始化代码块,在对每一行进行处理之前,初始化代码,主要是引用全局变量,设置FS分隔符
//
匹配代码块,可以是字符串或正则表达式
{}
命令代码块,包含一条或多条命令

多条命令使用分号分隔
END
结尾代码块,在对每一行进行处理之后再执行的代码块,主要是进行最终计算或输出结尾摘要信息

常用变量名称

$0 当前行
$1 每行第一个字段
NF 字段数量
NR 行号,多文件递增
FNR 行号,多文件不递增
-F’[:#/]’ 定义三个分隔符

内置字符串函数

gsub(r,s) 在整个$0中用s替代r
gsub(r,s,t) 在整个t中用s替代r
index(s,t) 返回s中字符串t的第一位置
length(s) 返回s长度
match(s,r) 测试s是否包含匹配r的字符串
split(s,a,fs) 在fs上将s分成序列a
sprint(fmt,exp) 返回经fmt格式化后的exp
sub(r,s) 用$0中最左边最长的子串代替s
substr(s,p) 返回字符串s中从p开始的后缀部分
substr(s,p,n) 返回字符串s中从p开始长度为n的后缀部分
gensub(a,b,c,[d])全局替换,匹配正则a, 用b替换,c为指定替换目标是第几次匹配,d为指定替换目标是哪个域如$1,$2,若无d指$0,返回值为target替换后内容(未替换还是返回 target原内容),与sub、gsub不同的是,target内容替换后不改变。
gensub(/123/,“x”,1,$1)替换$1中 第一次匹配到的123为字符x,返回值为$1替换后的内容,且$1的内容并没有改变
gensub(/a(.)b/,"\1",1) 返回值为匹配正则第1对()内的内容
gensub(/a(.
)b(.*)c/,"\2",1) 返回值为匹配正则第2对()内的内容

gather from https://blog.csdn.net/lukabruce/article/details/86692471, https://www.cnblogs.com/anny-1980/articles/3616086.html

你可能感兴趣的:(shell,awk,linux)