实用awk一行流01_2021-06-16

废话没有,直接上实用代码,当你着急忙慌的时候,希望它能帮到你

测试数据:WorldCupGroup.data(9行X6列)

cat WorldCupGroup.data

分组第一档第二档第三档第四档第五档

A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

1.首先我们来获取文件的总行数(方法有很多,当然你也可以使用wc -l WorldCupGroup.data;也可以实用less -SN WorldCupGroup.data,输入G,查看行数;更可以使用vim编辑器打开然后输入:set nu,接着输入G跳到最后一行,来查看行数),但是我们用awk实现就是下面的代码:

awk 'END{print FILENAME"的行数为:"NR}' WorldCupGroup.data

WorldCupGroup.data的行数为:9

2.接着我们打印第5行内容(方法也有很多,可以用sed)

awk 'NR==5' WorldCupGroup.data

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

当然如果你知道第五行有关键而且特殊的词,例如‘D组’

awk '/D组/ {print $0}' WorldCupGroup.data或者

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

awk '$1~/D组/ {print $0}' WorldCupGroup.data

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

3.我们接着打印每个输入行的最后一个字段

awk '{ print $NF }' WorldCupGroup.data

第五档

关岛*

尼泊尔

柬埔寨*

新加坡

孟加拉国*

蒙古*

印度尼西亚

斯里兰卡*

4.然后,我们打印打印最后一行的最后一个字段

awk '{ field = $NF } END { print field }' WorldCupGroup.data

斯里兰卡*


5.打印字段数小于等于6的行

awk 'NF<=6' WorldCupGroup.data

分组第一档第二档第三档第四档第五档

A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

6.打印最后一个字段数大于等于3的行

awk '$NF >=3' WorldCupGroup.data

分组第一档第二档第三档第四档第五档

A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

7.统计所有输入行的字段数总和

awk '{ nf = nf + NF } END { print nf }' WorldCupGroup.data

54

8.打印包含‘组’的所有行数

awk '/组/ { nlines = nlines + 1 } END { print nlines }' WorldCupGroup.data

9

9.打印具有最大值的第一个字段, 以及包含它的行(字符串也是可以比较大小的,根据ASCII编码的前后顺序,具体见ASCII码 - 基本ASCII码和扩展ASCII码,最全的ASCII码对照表 (asciim.cn))

awk '$1 > max { max = $1; maxline = $0 } ⏎

END { print max, maxline }' WorldCupGroup.data

分组分组第一档第二档第三档第四档第五档


10.打印字段数不为0的行

awk 'NF != 0' WorldCupGroup.data

分组第一档第二档第三档第四档第五档

A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*


11.打印长度超过 60 个字符的行

awk 'length($0) > 60' WorldCupGroup.data

D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*


12.获取每行的字符数

awk '{nch=length($0);print nch"\t"$0}' WorldCupGroup.data | column -t

56 分组 第一档 第二档 第三档 第四档 第五档

52 A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

57 B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

52 C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

69 D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

52 E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

61 F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

58 G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

52 H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

13.在每一行的前面加上它的字段数

awk '{ print NF, $0 }' WorldCupGroup.data

6 分组 第一档 第二档 第三档 第四档 第五档

6 A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

6 B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

6 C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

6 D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

6 E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

6 F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

6 G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

6 H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

14. 在每一行的前面加上行数、字段数、字符数

awk '{ nch=length($0);print NR"\t"NF"\t"nch"\t"$0 }' WorldCupGroup.data

1 6 56 分组 第一档 第二档 第三档 第四档 第五档

2 6 52 A组 中国 叙利亚 菲律宾 马尔代夫 关岛*

3 6 57 B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔

4 6 52 C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*

5 6 69 D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

6 6 52 E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

7 6 61 F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

8 6 58 G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚

9 6 52 H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

15.打印每一行的第 1 与第 2 个字段, 但顺序相反

awk '{ print $2"\t"$1 }' WorldCupGroup.data

第一档分组

中国A组

澳大利亚B组

伊朗C组

沙特阿拉伯D组

卡塔尔E组

日本F组

阿联酋G组

韩国H组

16.我们继续交换每一行的第 1 与第 2 个字段, 并打印该行

awk '{ temp = $1; $1 = $2; $2 = temp; print }' WorldCupGroup.data | column -t

第一档分组第二档第三档第四档第五档

中国A组 叙利亚 菲律宾 马尔代夫 关岛*

澳大利亚B组 约旦 台湾地区 科威特 尼泊尔

伊朗C组 伊拉克 巴林 中国香港 柬埔寨*

沙特阿拉伯D组 乌兹别克斯坦 巴勒斯坦 也门 新加坡

卡塔尔E组 阿曼 印度 阿富汗 孟加拉国*

日本F组 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

阿联酋G组 越南 泰国 马来西亚* 印度尼西亚

韩国H组 黎巴嫩 朝鲜 土库曼 斯里兰卡*

17.将每一行的第一个字段用行号代替

awk '{ $1=NR; print }' WorldCupGroup.data | column -t

1 第一档 第二档 第三档 第四档 第五档

2 中国 叙利亚 菲律宾 马尔代夫 关岛*

3 澳大利亚 约旦 台湾地区 科威特 尼泊尔

4 伊朗 伊拉克 巴林 中国香港 柬埔寨*

5 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡

6 卡塔尔 阿曼 印度 阿富汗 孟加拉国*

7 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

8 阿联酋 越南 泰国 马来西亚* 印度尼西亚

9 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*

18.打印删除了第 6个字段后的行

awk '{ $2 = ""; print }' WorldCupGroup.data | column -t

分组第二档第三档第四档第五档

A组 叙利亚 菲律宾 马尔代夫 关岛*

B组 约旦 台湾地区 科威特 尼泊尔

C组 伊拉克 巴林 中国香港 柬埔寨*

D组 乌兹别克斯坦 巴勒斯坦 也门 新加坡

E组 阿曼 印度 阿富汗 孟加拉国*

F组 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*

G组 越南 泰国 马来西亚* 印度尼西亚

H组 黎巴嫩 朝鲜 土库曼 斯里兰卡*

19.将每一行的字段按逆序打印

awk '{ for (i = NF; i > 0; i = i - 1) printf("%s ", $i);printf("\n") }' WorldCupGroup.data | column -t

第五档第四档第三档第二档第一档分组

关岛* 马尔代夫 菲律宾 叙利亚 中国 A组

尼泊尔科威特台湾地区约旦澳大利亚B组

柬埔寨* 中国香港 巴林 伊拉克 伊朗 C组

新加坡也门巴勒斯坦乌兹别克斯坦沙特阿拉伯D组

孟加拉国* 阿富汗 印度 阿曼 卡塔尔 E组

蒙古* 缅甸 塔吉克斯坦 吉尔吉斯斯坦 日本 F组

印度尼西亚马来西亚* 泰国 越南 阿联酋 G组

斯里兰卡* 土库曼 朝鲜 黎巴嫩 韩国 H组

你可能感兴趣的:(实用awk一行流01_2021-06-16)