2019-07-25

知识梳理:
1) awk命令概念介绍: 语法 原理 BEGIN 处理文件 END
2) awk命令操作说明: 作用 查询 排除 替换
参数:
-F : 指定列分割符号
-v : 指定变量信息
动作:
print : 输出指定信息
gsub : 替换指定信息
符号:
~ : 匹配信息 按照指定列进行匹配
!~ : 将匹配的信息取反
// : 指定匹配信息
3) awk命令模式分类
BEGIN{}: 处理文件前, 执行什么动作
END{}: 处理文件后, 执行什么动作
内置变量: FS NF NR --n

awk

语法 : awk [参数] '模式{动作}' 文件
处理文件信息: 文本文件信息 日志文件信息 配置文件信息
处理文件方式: 排除信息 查询信息 统计信息 替换信息
对文件列进行处理

awk操作:创建测试环境

[root@oldboyedu ~]# cat reg.txt
Zhang  Dandan    41117397    :250:100:175
Zhang  Xiaoyu    390320151   :155:90:201
Meng   Feixue    80042789    :250:60:50
Wu     Waiwai    70271111    :250:80:75
Liu    Bingbing  41117483    :250:100:175
Wang   Xiaoai    3515064655  :50 :95 :135
Zi     Gege      1986787350  :250:168:200
Li     Youjiu    918391635   :175:75:300
Lao    Nanhai    918391635   :250:100:175
  1. 显示xiaoyu的姓氏和ID号码

awk '{print $1 $3}'  文件信息

第一个步骤: 找出需要编写模式信息
获取xiaoyu信息

awk '/Xiaoyu/'  reg.txt
awk '$2~/Xiaoyu/' reg.txt

第二个步骤: 根据条件做处理
显示满足条件的第三列和第一列信息

awk '$2~/Xiaoyu/{动作}' reg.txt
awk '$2~/Xiaoyu/{print $1 $3}' reg.txt

答案:

[root@oldboyedu ~]# awk '$2~/Xiaoyu/{print $1,$3}' reg.txt
Zhang 390320151
[root@oldboyedu ~]# awk '$2~/Xiaoyu/{print $1" "$3}' reg.txt
Zhang 390320151
  1. 姓氏是Zhang的人,显示他的第二次捐款金额及他的名字
    第一个步骤: 找出需要编写模式信息

awk '$1~/Zhang/' reg.txt

第二个步骤: 根据条件做处理

awk '$1~/Zhang/{print $1,$2,$4}' reg.txt
awk -F ":"  '$1~/Zhang/{print $3}' reg.txt

答案:

[root@oldboyedu ~]# awk -F "[: ]+"  '$1~/Zhang/{print $1,$2,$5}' reg.txt
Zhang Dandan 100
Zhang Xiaoyu 90
  1. 显示所有以41开头的ID号码的人的全名和ID号码
    第一个步骤: 找出需要编写模式信息

awk '$3~/^41/' reg.txt

第二个步骤: 根据条件做处理
答案:

[root@oldboyedu ~]# awk '$3~/^41/{print $1,$2,$3}' reg.txt
Zhang Dandan 41117397
Liu Bingbing 41117483
[root@oldboyedu ~]# awk '$3~/^41/{print $1,$2,$3}' reg.txt|column -t
Zhang  Dandan    41117397
Liu    Bingbing  41117483
  1. 显示所有ID号码最后一位数字是1或5的人的全名
    第一个步骤: 找出需要编写模式信息

awk '$3~/1$|5$/' reg.txt
awk '$3~/[15]$/' reg.txt
awk '$3~/(1|5)$/' reg.txt

第二个步骤: 根据条件做处理
答案

[root@oldboyedu ~]# awk '$3~/[15]$/{print $1,$2}' reg.txt|column -t
Zhang  Xiaoyu
Wu     Waiwai
Wang   Xiaoai
Li     Youjiu
Lao    Nanhai
[root@oldboyedu ~]# awk '$3~/[15]$/{print $1,$2,$3}' reg.txt|column -t
Zhang  Xiaoyu  390320151
Wu     Waiwai  70271111
Wang   Xiaoai  3515064655
Li     Youjiu  918391635
Lao    Nanhai  918391635
  1. 获取文件中有井号或空行的内容, 将空行和井号信息的行排除
    第一个步骤: 找出需要编写模式信息

awk '/#|^$/'  reg.txt       
awk '$0~/#|^$/'  reg.txt    
说明: $0 表示将文件所有列信息进行显示
awk '$0!~/#|^$/'  reg.txt
awk '!/#|^$/'  reg.txt

第二个步骤: 根据条件做处理
答案:

[root@oldboyedu ~]# awk '$0!~/#|^$/'  reg.txt
Zhang  Dandan    41117397    :250:100:175
Meng   Feixue    80042789    :250:60:50
Wu     Waiwai    70271111    :250:80:75
Liu    Bingbing  41117483    :250:100:175
Zi     Gege      1986787350  :250:168:200
Li     Youjiu    918391635   :175:75:300
Lao    Nanhai    918391635   :250:100:175
Lao    Nanhai    Xiaoyu   :250:100:175
[root@oldboyedu ~]# awk '$0!~/#|^$/{print $0}'  reg.txt
Zhang  Dandan    41117397    :250:100:175
Meng   Feixue    80042789    :250:60:50
Wu     Waiwai    70271111    :250:80:75
Liu    Bingbing  41117483    :250:100:175
Zi     Gege      1986787350  :250:168:200
Li     Youjiu    918391635   :175:75:300
Lao    Nanhai    918391635   :250:100:175
Lao    Nanhai    Xiaoyu   :250:100:175

6. 显示Xiaoyu的捐款,每个捐款数额都是以$开头, 如$110$220$330  
awk '$2~/Xiaoyu/{print $4}' reg.txt|sed 's#:#$#g'   
awk '$2~/Xiaoyu/{print $4}' reg.txt|tr ':' '$'
awk -F "[: ]+" '$2~/Xiaoyu/{print "$"$4,"$"$5,"$"$6}' reg.txt
![image.png](https://upload-images.jianshu.io/upload_images/18572620-286c144c3187f87e.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

awk替换

gsub  = gawk substitute
gsub(/要替换的信息/,"替换成什么".$将第几列)
[root@oldboyedu ~]# awk  '$2~/Xiaoyu/{gsub(/:/,"$",$NF);print $NF}' reg.txt
$155$90$201
说明: $NF 表示文件的最后一列信息 

awk命令模式分类

普通模式: 比较行信息

[root@oldboyedu ~]# cat reg.txt
Zhang  Dandan    41117397    :250:100:175
Zhang  Xiaoyu    390320151   :155:90:201
Meng   Feixue    80042789    :250:60:50
Wu     Waiwai    70271111    :250:80:75
Liu    Bingbing  41117483    :250:100:175
Wang   Xiaoai    3515064655  :50:95:135
Zi     Gege      1986787350  :250:168:200
Li     Youjiu    918391635   :175:75:300
Lao    Nanhai    918391635   :250:100:175

(将大于第二行(不包括第二行)的信息显示出来)

[root@oldboyedu ~]# awk  'NR>2' reg.txt
Meng   Feixue    80042789    :250:60:50
Wu     Waiwai    70271111    :250:80:75
Liu    Bingbing  41117483    :250:100:175
Wang   Xiaoai    3515064655  :50:95:135
Zi     Gege      1986787350  :250:168:200
Li     Youjiu    918391635   :175:75:300
Lao    Nanhai    918391635   :250:100:175

(将小于第二行(不包括第二行)的信息显示出来)

[root@oldboyedu ~]# awk  'NR<2' reg.txt
Zhang  Dandan    41117397    :250:100:175   
说明: NR 表示文件行信息

取出多行信息

[root@oldboyedu ~]# awk  'NR==2,NR==4' reg.txt  --- 连续多行
Zhang  Xiaoyu    390320151   :155:90:201    (逗号表示从2到4行)
Meng   Feixue    80042789    :250:60:50
Wu     Waiwai    70271111    :250:80:75

[root@oldboyedu ~]# awk  'NR==2;NR==4' reg.txt  --- 不连续多行
Zhang  Xiaoyu    390320151   :155:90:201      (分号表示2行和4行)
Wu     Waiwai    70271111    :250:80:75

特殊模式:
BEGIN{动作}: 在处理文件之前,先做什么事情

awk 'BEGIN{print "姓","名","号码","捐款记录"}{print $0}' reg.txt|column -t

[root@oldboyedu ~]# awk  'BEGIN{print "姓","名","号码","捐款记录"}{print $0}' reg.txt|column -t
姓     名        号码        捐款记录
Zhang  Dandan    41117397    :250:100:175
Zhang  Xiaoyu    390320151   :155:90:201
Meng   Feixue    80042789    :250:60:50
Wu     Waiwai    70271111    :250:80:75
Liu    Bingbing  41117483    :250:100:175
Wang   Xiaoai    3515064655  :50:95:135
Zi     Gege      1986787350  :250:168:200
Li     Youjiu    918391635   :175:75:300
Lao    Nanhai    918391635   :250:100:175

用于计算:

[root@oldboyedu ~]# awk "BEGIN{print 2+2}"
4
[root@oldboyedu ~]# awk "BEGIN{print 2-2}"
0
[root@oldboyedu ~]# awk "BEGIN{print 2*2}"
4
[root@oldboyedu ~]# awk "BEGIN{print 3/2}"
1.5
[root@oldboyedu ~]# awk "BEGIN{print 3^2}"
9
[root@oldboyedu ~]# awk "BEGIN{print 3^3}"
27
[root@oldboyedu ~]# awk "BEGIN{print 3**3}"
27
[root@oldboyedu ~]# awk "BEGIN{print 5%3}"
2

修改内置变量:
NF: 取出最后一列

awk '{print $(NF-1)}' reg.txt   --- 取出倒数第二列

NR: 表示行信息
FS: 指定列分隔符, 默认识别空格为分割符

[root@oldboyedu ~]# awk 'BEGIN{FS="[: ]+"}{print $4}' reg.txt
     250
     155
     250
     250
     250
     50
     250
     175
     250
[root@oldboyedu ~]# awk -vFS="[: ]+"  '{print $1,$4}' reg.txt
     Zhang 250
     Zhang 155
     Meng 250
     Wu 250
     Liu 250
     Wang 50
     Zi 250
     Li 175
     Lao 250

END{动作}: 在处理文件之后,再做什么事情
awk 'BEGIN{print "姓","名","号码","捐款记录"}{print $0}END{print "学生捐款登记表"}' reg.txt|column -t

[root@oldboyedu ~]# awk  'BEGIN{print "姓","名","号码","捐款记录"}{print $0}END{print "学生捐款登记表"}' reg.txt|column -t
姓              名        号码        捐款记录
Zhang           Dandan    41117397    :250:100:175
Zhang           Xiaoyu    390320151   :155:90:201
Meng            Feixue    80042789    :250:60:50
Wu              Waiwai    70271111    :250:80:75
Liu             Bingbing  41117483    :250:100:175
Wang            Xiaoai    3515064655  :50:95:135
Zi              Gege      1986787350  :250:168:200
Li              Youjiu    918391635   :175:75:300
Lao             Nanhai    918391635   :250:100:175
学生捐款登记表

实际作用:
可以将统计后的最终结果进行输出

awk对文件进行统计分析

  1. awk统计运算公式
    a 文本信息累加运算


    image.png

i=i+1   或 i++

统计文件行数
awk '{i=i+1}END{print i}' test.txt

[root@oldboyedu ~]# awk '/oldboy/{i=i+1}END{print i}' test.txt 
4
[root@oldboyedu ~]# awk '/oldboy/{i++}END{print i}' test.txt 
4

b 数值信息求和运算

image.png

sum=sum+$n  $n  你要对文件第几列信息做求和运算 
[root@oldboyedu ~] # seq 10|awk '{sum=sum+$1}END{print sum}'
  55

windows文件如何传输到linux系统
yum install -y lrzsz --- 实现windows和linux系统之间数据传输
rz -- 将windows数据 ---> linux系统
sz -- 将linux数据 ---> windows系统

找出有faild信息, 总共出现了多少次 (awk统计)

[root@oldboyedu ~]# awk '/Failed/{i++}END{print i}' secure-20161219
367500
[root@oldboyedu ~]# awk '$6~/Failed/{i++}END{print i}' secure-20161219
367500

你可能感兴趣的:(2019-07-25)