awk按照指定分隔符进行分割
awk默认的分隔符为空格和tab。然而,实践中往往需要指定其它符号作为分隔符。
假设有一个test.txt文本文件,其内容如下所示,共4行,每行由逗号分隔成三个元素。现在,通过后续的几种方式对它进行分列操作。
cat test.txt
sample1,male,12
sample2,female,23
sample3,male,15
sample4,female,28
通过 -F 参数指定分隔符。需要注意的是,分隔符紧跟在-F参数后面(中间没有空格)。
awk -F, '{print $2}' test.txt
male
female
male
female
通过-v参数,设置内置变量FS的值为,,从而达到将分隔符指定为逗号。
awk -v FS="," '{print $2}' test.txt
male
female
male
female
如果拆分的2列或2列以上需要输出,默认也是以空格进行分隔的。例如:
awk -v FS=',' '{print $1,$3}' test.txt
sample1 12
sample2 23
sample3 15
sample4 28
那么,当需要在输出文件中,需要指定其它分隔符时,可以通过-v 参数指定内置变量OFS实现。例如:
awk -v FS="," -v OFS="@@" '{print $1,$3}' test.txt
sample1@@12
sample2@@23
sample3@@15
sample4@@28
处理一个文件data
cat data
zhc-123|zhang
hongchangfirst-99|zhang
hongchang-100|zhang
如果我们
awk -F ‘-’ ‘{print $1}’ data
会打印出
zhc
hongchangfirst
hongchang
但是如果我想根据多个分隔符进行分割呢?一种办法是两次awk,但是我们可以一次告诉awk我们所有的分隔符,如-和|这两个:
awk -F ‘[-|]’ ‘{print $3}’ data
会打印出
zhang
zhang
zhang
另一个技巧(粘贴在一起),如果你想把两个文件按照对应的每行放在同一行上,可以用paste,比如:
data1文件为
1
2
3
data2的文件为
zhang
zhc
hongchangfirst
使用
paste data1 data2
将得到
1 zhang
2 zhc
3 hongchangfirst
默认使用tab键作为份分隔符,还可以自定义分隔符,如用=号:
paste -d‘=’ data1 data2
1=zhang
2=zhc
3=hongchangfirst