linux-awk练习

1.只处理用户ID为奇数的行,并打印用户名和uid号

代码:

awk -F: '$3%2 != 0{print $1,$3}' /etc/passwd

运行结果:
linux-awk练习_第1张图片

2.显示系统的普通用户,并打印用户名和ID

代码:

awk -F: '$1! = "root" {print $1,$3}' /etc/passwd

运行结果:

linux-awk练习_第2张图片

3.显示用户shell是’/bin/bash’的用户,并打印用户名

代码:

awk -F: '$7 == "/bin/bash"{print $1}' /etc/passwd

运行结果:

linux-awk练习_第3张图片

4.统计普通用户的个数

代码:

awk -F: '$1!="root" {print $1,$3}' /etc/passwd | wc -l

运行结果:

在这里插入图片描述

5.统计文本的总行数

代码:

awk -F: '{print}' /etc/passwd | wc -l

运行结果:

在这里插入图片描述

6.显示文件名

代码:

ll |awk  '{print $9}'

运行结果:

linux-awk练习_第4张图片

7.显示UID为1001用户的相关信息

代码:

awk -F: '$3 == 1001{print $0}' /etc/passwd

运行结果:

在这里插入图片描述

8.利用awk模拟tail -1的效果

代码:

awk 'END{print $0}' /etc/passwd

运行结果:

在这里插入图片描述

9.看懂数组两个练习(统计tcp链接数)

代码:

1.统计tcp的链接数

netstat -ant | awk '/^tcp/ {++state[$NF]} END {for(key in state) print key,"\t",state[key]}'

统计tcp两个状态(LISTEN\ESTABLISHED)的链接个数,用数组state计数

2.分别统计不同ip的tcp连接

netstat -ant | awk '/^tcp/ {n=split($(NF-1),array,":");if(n<=2)++S[array[(1)]];else++S[array[(4)]];++s[$NF];++N} END {for(a in S){printf("%-20s %s\n", a, S[a]);++I}printf("%-20s %s\n","TOTAL_IP",I);for(a in s) printf("%-20s %s\n",a, s[a]);printf("%-20s %s\n","TOTAL_LINK",N);}'

split( ( N F − 1 ) , a r r a y , " : " ) 将 倒 数 第 二 个 字 段 按 照 " : " 分 割 成 a r r a y 数 组 , S [ ] 数 组 下 标 是 i p 地 址 , 元 素 是 每 个 i p 地 址 的 链 接 个 数 , , s [ (NF-1),array,":")将倒数第二个字段按照":"分割成array数组,S[]数组下标是ip地址,元素是每个ip地址的链接个数,,s[ (NF1),array,":")":"arrayS[]ipips[NF]下标是状态(LISTEN\ESTABLISHED),元素是每个状态链接个数;N是总链接数。

10.将test2文件中的行追加到test1的同一行后,并保存到文件test3

test1文本内容:

haha
hehe
alice
bob

test2文本内容:

20
25
18
30

test3文本内容:

haha:20
hehe:25
alice:18
bob:30

代码:

awk '{printf "%s: ",$1; getline t < "test2" ; printf " %s\n",t}' test1 > test3

运行结果:
linux-awk练习_第5张图片

11.某产品的CDN带宽运营成本迅猛增涨,其带宽主要由各种类型的图片组成,为了对某产品的图片流量带宽进行优化,现需要对该产品的图片和号码特性做一些分析,已有的日志文件test.log供分析使用,格式:

号码|请求大小|请求id,内容如下:

001|100|abc.gif
002|80|abd.jpg
003|150|abe.gif
001|60|abf.gif

003|30|abg.jpg

其中带有gif表示是gif图片的请求,带有jpg表示是jpg图片的请求,请使用(python/shell/awk/sort)编写程序实现如下分析思路(1,2为中间步骤,可以只输出3,4结果):

1.找出所有gif图片请求的所有号码

2.找出所有gif图片请求的号码和其对应的请求大小总和及请求数总和.

3.找出所有gif图片请求的号码,并按照其请求大小总和从大到小排序.

4.找出所有gif图片请求的号码,并按其请求平均图片大小从大到小排序.

代码:

awk -F '|' '/gif$/{print$1}' test.log |sort -n | uniq
awk -F '|' '/gif$/{arg[$1] += $2}END{for(i in arg){print i,arg[i]}}' test.log 
awk -F '|' '/gif$/{arg[$1] += $2}END{for(i in arg){print i,arg[i]}}' test.log |sort -k2nr

linux-awk练习_第6张图片
4.

awk -F '|' '/gif$/{++sum[$1];arg[$1] += $2}END{for(i in arg){print i,arg[i]/sum[i]}}' test.log |sort -k2nr

linux-awk练习_第7张图片
参考改进:awk脚本作业

你可能感兴趣的:(linux-awk练习)