cut命令

作用

cut命令主要用于裁剪文本每行中的数据

主要参数:

-b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。

-c :以字符为单位进行分割。

-d :自定义分隔符,默认为制表符。

-f :与-d一起使用,指定显示哪个区域。

-n :取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的范围之内,该字符将被写出;否则,该字符将被排除。

 -s表示不包括那些不含分隔符的行,只切割和显示匹配的字符

 

-c和-f参数可以跟以下子参数:
m
第m个字符或字段
m-
从第m个字符或字段到文件结束
m-n
从第m个到第n个字符或字段
-n
从第1个到第n个字符或字段

事例

 

三种定位方法:

以字节定位-b

[jeck@localhost~]$ cat test

aa aa

bb aa

cc aa

dd AA

[jeck@localhost~]$ cut -b 1 test

a

b

c

d

以字符定位-c

[jeck@localhost~]$ cat test

星期一

星期二

星期三

星期四

[jeck@localhost~]$ cut -b 3 test

?

?

?

?

[jeck@localhost~]$ cut -c 3 test

-c处理的是一个字符,而-b处理的是一个字节。所以。当出现汉字时,使用-b就会乱码,可以加-n,使不拆分字节

以域定位 -f -d

 

[jeck@localhost~]$ cat test

a:b:c

1:2:3

aa:11:bb

dd:nn:mm

[jeck@localhost~]$ cut -d : -f 2 test

b

2

11

nn

[root@localhosttmp]# cut -d : -f1,2 test 

a:b

1:2

aa:11

dd:nn

 

[root@localhosttmp]# cut -d : -f1-3 test  

a:b:c

1:2:3

aa:11:bb

dd:nn:mm

-s 用法

[root@localhosttmp]# cat test

a:b:c

1:2:3

aa:11:bb

dd:nn:mm

vv-aa-22

dd-44-55

[root@localhosttmp]# cut -d : -f1 test      下面两行不匹配,会全部打印

a

1

aa

dd

vv-aa-22

dd-44-55

[root@localhosttmp]# cut -d : -f1  -s test  加-s之后,只切割匹配的

a

1

aa

dd

--output-delimiter指定打印的分隔符

[root@localhosttmp]# cut -d : -f1,3  -s--output-delimiter="****" test  

a****c

1****3

aa****bb

dd****mm

区分空格和制表符

使用sort -n l 即可

 

[jeck@localhost~]$ cat test1

aa bb

11      22

 

[jeck@localhost~]$ sed  -n l test1

aa bb$

11\t22$

如果是制表符(TAB,那么会显示为\t符号,如果是空格,就会原样显示