awk按照多个分隔符进行分割

awk按照指定分隔符进行分割

awk默认的分隔符为空格tab。然而,实践中往往需要指定其它符号作为分隔符。

输入分隔符

假设有一个test.txt文本文件,其内容如下所示,共4行,每行由逗号分隔成三个元素。现在,通过后续的几种方式对它进行分列操作。

cat test.txt
sample1,male,12
sample2,female,23
sample3,male,15
sample4,female,28

第一种方式:通过-F参数实现

通过 -F 参数指定分隔符。需要注意的是,分隔符紧跟在-F参数后面(中间没有空格)。

awk -F, '{print $2}' test.txt
male
female
male
female

第二种方式:通过指定内置变量 FS 来实现

通过-v参数,设置内置变量FS的值为,,从而达到将分隔符指定为逗号。

awk -v FS="," '{print $2}' test.txt
male
female
male
female

输出分隔符

如果拆分的2列或2列以上需要输出,默认也是以空格进行分隔的。例如:

awk -v FS=',' '{print $1,$3}' test.txt
sample1 12
sample2 23
sample3 15
sample4 28

那么,当需要在输出文件中,需要指定其它分隔符时,可以通过-v 参数指定内置变量OFS实现。例如:

awk -v FS="," -v OFS="@@" '{print $1,$3}' test.txt
sample1@@12
sample2@@23
sample3@@15
sample4@@28

awk按照多个分隔符进行分割

处理一个文件data

cat data
zhc-123|zhang
hongchangfirst-99|zhang
hongchang-100|zhang

如果我们

awk -F ‘-’ ‘{print $1}’ data

会打印出

zhc
hongchangfirst
hongchang

但是如果我想根据多个分隔符进行分割呢?一种办法是两次awk,但是我们可以一次告诉awk我们所有的分隔符,如-和|这两个:

awk -F ‘[-|]’ ‘{print $3}’ data

会打印出

zhang
zhang
zhang

另一个技巧(粘贴在一起),如果你想把两个文件按照对应的每行放在同一行上,可以用paste,比如:

data1文件为

1
2
3

data2的文件为

zhang
zhc
hongchangfirst

使用

paste data1 data2

将得到

1 zhang
2 zhc
3 hongchangfirst

默认使用tab键作为份分隔符,还可以自定义分隔符,如用=号:

paste -d‘=’ data1 data2
1=zhang
2=zhc
3=hongchangfirst

你可能感兴趣的:(linux,大数据,运维)