第十二章 字符转换、删除及压缩工具:tr命令

名字解释

tr命令 对来自标准输入的字符进行替换、压缩和删除。它可以将一组字符变成另一组字符,经常用来编写优美的单行命令,作用很强大。

语法

tr (选项) (参数) 

选项

  • -c或--complerment:[set2]取代所有不属于[set1]的字符;
  • -d或--delete:删除[set1]的指定字符;
  • -s或--squeeze-repeats:把连续重复的字符以一个字符表示;去重;
  • -t或--truncate-set1:将[set1]用[set2]替换,tr缺省为-t 。

参数

[set1][set2]

  1. 字符集1:指定要转换或删除的原字符集。当执行转换操作时,必须使用参数“字符集2”指定转换的目标字符集。但执行删除操作时,不需要参数“字符集2”;
  2. 字符集2:指定要转换成的目标字符集。

实例

-c [set2]替换[set1]中不包含的字符串

[root@localhost ~]# cat time.txt 
Monday 001
Tuesday 002
Wednesday 003
Thursday 004
Friday 005
Saturday 006
Sunday 007
[root@localhost ~]# cat time.txt | tr -cs "a-z,A-Z" "\n" 
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday
# tr 利用-c 选项指定[set1]的内容包含:"a-z,A-Z",然后用\n 取代time.txt中的其他字符,在这里也就是替代里边的数字;-s 代表去重 将多个\n 去重成为一个\n 就够了。

#用可以写成:
[root@localhost ~]# cat time.txt | tr -cs [a-z][A-Z] "\n"     

-d 删除[set1] 指定字符

使用tr删除字符:

[root@ceshi xargs]# echo "hello 123 world" | tr -d '0-9'
hello  world

字符集补集,从输入文本中将不再补集中的所有字符删除:

[root@ceshi xargs]# echo "a 1 b@ 2# c 3 d 4 " | tr -d -c '0-9 \n' 
 1  2  3  4 

此例中,因为字符集1包含了数字0-9、空格和换行\n,所以这些元素没有被删除,而其他字符都被删除掉了。

-s 去重

使用tr压缩字符,可以压缩输入中重复的字符:

[root@ceshi xargs]# echo "thissss isss a test lineee" | tr -s 'se' 
this is a test line

-t [set1]替换成[set2]

将输入字符由大写转换成小写:

[root@localhost ~]# echo "HELLO WORLD" | tr 'A-Z' 'a-z'
hello world
#和-t 一样的作用
[root@localhost ~]# echo "HELLO WORLD" | tr -t "A-Z" "a-z"
hello world

'A-Z'和'a-z’ 都是集合,集合是可以自己制定的,例如:‘{ABCD}’、‘bB,.’、‘a-de-h’、‘a-c0-9’都属于集合,集合里可以使用’\n‘、’\t‘,也可以使用其他ASCII字符。

将空格转换为+:

[root@ceshi xargs]# echo "a b c d " | tr ' ' '+'
a+b+c+d+

巧妙使用tr做数字相加操作:

echo '1 2 3 4 5' | xargs -n1 | echo $[ $(tr '\n' '+') 0 ]

删除windows文件造成的 ’^M‘ 字符:

cat file | tr -s "\r" "\n" > new_file
或
cat file | tr -d "\r" > new_file

tr可以使用的字符类:

[:alnum:]:字母和数字
[:alpha:]:字母
[:cntrl:]:控制(非打印)字符
[:digit:]:数字
[:graph:]:图形字符
[:lower:]:小写字母
[:print:]:可打印字符
[:punct:]:标点符号
[:space:]:空白字符
[:upper:]:大写字母
[:xdigit:]:十六进制字符

使用方式:

tr '[:lower:]' '[:upper:]'
[root@ceshi xargs]# echo "AbCdefg" | tr '[:lower:]' '[:upper:]'
ABCDEFG