废话没有,直接上实用代码,当你着急忙慌的时候,希望它能帮到你
测试数据:WorldCupGroup.data(9行X6列)
cat WorldCupGroup.data
分组第一档第二档第三档第四档第五档
A组 中国 叙利亚 菲律宾 马尔代夫 关岛*
B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔
C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*
D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡
E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*
F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*
G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚
H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*
1.首先我们来获取文件的总行数(方法有很多,当然你也可以使用wc -l WorldCupGroup.data;也可以实用less -SN WorldCupGroup.data,输入G,查看行数;更可以使用vim编辑器打开然后输入:set nu,接着输入G跳到最后一行,来查看行数),但是我们用awk实现就是下面的代码:
awk 'END{print FILENAME"的行数为:"NR}' WorldCupGroup.data
WorldCupGroup.data的行数为:9
2.接着我们打印第5行内容(方法也有很多,可以用sed)
awk 'NR==5' WorldCupGroup.data
D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡
当然如果你知道第五行有关键而且特殊的词,例如‘D组’
awk '/D组/ {print $0}' WorldCupGroup.data或者
D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡
awk '$1~/D组/ {print $0}' WorldCupGroup.data
D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡
3.我们接着打印每个输入行的最后一个字段
awk '{ print $NF }' WorldCupGroup.data
第五档
关岛*
尼泊尔
柬埔寨*
新加坡
孟加拉国*
蒙古*
印度尼西亚
斯里兰卡*
4.然后,我们打印打印最后一行的最后一个字段
awk '{ field = $NF } END { print field }' WorldCupGroup.data
斯里兰卡*
5.打印字段数小于等于6的行
awk 'NF<=6' WorldCupGroup.data
分组第一档第二档第三档第四档第五档
A组 中国 叙利亚 菲律宾 马尔代夫 关岛*
B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔
C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*
D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡
E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*
F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*
G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚
H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*
6.打印最后一个字段数大于等于3的行
awk '$NF >=3' WorldCupGroup.data
分组第一档第二档第三档第四档第五档
A组 中国 叙利亚 菲律宾 马尔代夫 关岛*
B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔
C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*
D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡
E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*
F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*
G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚
H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*
7.统计所有输入行的字段数总和
awk '{ nf = nf + NF } END { print nf }' WorldCupGroup.data
54
8.打印包含‘组’的所有行数
awk '/组/ { nlines = nlines + 1 } END { print nlines }' WorldCupGroup.data
9
9.打印具有最大值的第一个字段, 以及包含它的行(字符串也是可以比较大小的,根据ASCII编码的前后顺序,具体见ASCII码 - 基本ASCII码和扩展ASCII码,最全的ASCII码对照表 (asciim.cn))
awk '$1 > max { max = $1; maxline = $0 } ⏎
END { print max, maxline }' WorldCupGroup.data
分组分组第一档第二档第三档第四档第五档
10.打印字段数不为0的行
awk 'NF != 0' WorldCupGroup.data
分组第一档第二档第三档第四档第五档
A组 中国 叙利亚 菲律宾 马尔代夫 关岛*
B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔
C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*
D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡
E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*
F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*
G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚
H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*
11.打印长度超过 60 个字符的行
awk 'length($0) > 60' WorldCupGroup.data
D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡
F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*
12.获取每行的字符数
awk '{nch=length($0);print nch"\t"$0}' WorldCupGroup.data | column -t
56 分组 第一档 第二档 第三档 第四档 第五档
52 A组 中国 叙利亚 菲律宾 马尔代夫 关岛*
57 B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔
52 C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*
69 D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡
52 E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*
61 F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*
58 G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚
52 H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*
13.在每一行的前面加上它的字段数
awk '{ print NF, $0 }' WorldCupGroup.data
6 分组 第一档 第二档 第三档 第四档 第五档
6 A组 中国 叙利亚 菲律宾 马尔代夫 关岛*
6 B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔
6 C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*
6 D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡
6 E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*
6 F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*
6 G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚
6 H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*
14. 在每一行的前面加上行数、字段数、字符数
awk '{ nch=length($0);print NR"\t"NF"\t"nch"\t"$0 }' WorldCupGroup.data
1 6 56 分组 第一档 第二档 第三档 第四档 第五档
2 6 52 A组 中国 叙利亚 菲律宾 马尔代夫 关岛*
3 6 57 B组 澳大利亚 约旦 台湾地区 科威特 尼泊尔
4 6 52 C组 伊朗 伊拉克 巴林 中国香港 柬埔寨*
5 6 69 D组 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡
6 6 52 E组 卡塔尔 阿曼 印度 阿富汗 孟加拉国*
7 6 61 F组 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*
8 6 58 G组 阿联酋 越南 泰国 马来西亚* 印度尼西亚
9 6 52 H组 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*
15.打印每一行的第 1 与第 2 个字段, 但顺序相反
awk '{ print $2"\t"$1 }' WorldCupGroup.data
第一档分组
中国A组
澳大利亚B组
伊朗C组
沙特阿拉伯D组
卡塔尔E组
日本F组
阿联酋G组
韩国H组
16.我们继续交换每一行的第 1 与第 2 个字段, 并打印该行
awk '{ temp = $1; $1 = $2; $2 = temp; print }' WorldCupGroup.data | column -t
第一档分组第二档第三档第四档第五档
中国A组 叙利亚 菲律宾 马尔代夫 关岛*
澳大利亚B组 约旦 台湾地区 科威特 尼泊尔
伊朗C组 伊拉克 巴林 中国香港 柬埔寨*
沙特阿拉伯D组 乌兹别克斯坦 巴勒斯坦 也门 新加坡
卡塔尔E组 阿曼 印度 阿富汗 孟加拉国*
日本F组 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*
阿联酋G组 越南 泰国 马来西亚* 印度尼西亚
韩国H组 黎巴嫩 朝鲜 土库曼 斯里兰卡*
17.将每一行的第一个字段用行号代替
awk '{ $1=NR; print }' WorldCupGroup.data | column -t
1 第一档 第二档 第三档 第四档 第五档
2 中国 叙利亚 菲律宾 马尔代夫 关岛*
3 澳大利亚 约旦 台湾地区 科威特 尼泊尔
4 伊朗 伊拉克 巴林 中国香港 柬埔寨*
5 沙特阿拉伯 乌兹别克斯坦 巴勒斯坦 也门 新加坡
6 卡塔尔 阿曼 印度 阿富汗 孟加拉国*
7 日本 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*
8 阿联酋 越南 泰国 马来西亚* 印度尼西亚
9 韩国 黎巴嫩 朝鲜 土库曼 斯里兰卡*
18.打印删除了第 6个字段后的行
awk '{ $2 = ""; print }' WorldCupGroup.data | column -t
分组第二档第三档第四档第五档
A组 叙利亚 菲律宾 马尔代夫 关岛*
B组 约旦 台湾地区 科威特 尼泊尔
C组 伊拉克 巴林 中国香港 柬埔寨*
D组 乌兹别克斯坦 巴勒斯坦 也门 新加坡
E组 阿曼 印度 阿富汗 孟加拉国*
F组 吉尔吉斯斯坦 塔吉克斯坦 缅甸 蒙古*
G组 越南 泰国 马来西亚* 印度尼西亚
H组 黎巴嫩 朝鲜 土库曼 斯里兰卡*
19.将每一行的字段按逆序打印
awk '{ for (i = NF; i > 0; i = i - 1) printf("%s ", $i);printf("\n") }' WorldCupGroup.data | column -t
第五档第四档第三档第二档第一档分组
关岛* 马尔代夫 菲律宾 叙利亚 中国 A组
尼泊尔科威特台湾地区约旦澳大利亚B组
柬埔寨* 中国香港 巴林 伊拉克 伊朗 C组
新加坡也门巴勒斯坦乌兹别克斯坦沙特阿拉伯D组
孟加拉国* 阿富汗 印度 阿曼 卡塔尔 E组
蒙古* 缅甸 塔吉克斯坦 吉尔吉斯斯坦 日本 F组
印度尼西亚马来西亚* 泰国 越南 阿联酋 G组
斯里兰卡* 土库曼 朝鲜 黎巴嫩 韩国 H组