【Linux 基础入门】(十)简单的文本处理

文章目录

    • 1 介绍
    • 2 文本处理命令
      • 2.1 tr 命令
      • 2.2 col 命令
      • 2.3 join 命令
      • 2.4 paste 命令

1 介绍

内容

  • 这一节我们将介绍这几个命令 tr(注意不是 tar),coljoinpaste。实际这一节是上一节关于能实现管道操作的命令的延续,所以我们依然将结合管道来熟悉这些命令的使用。

知识点

  • 常见文本处理命令
  • 如何简单处理文本

2 文本处理命令

2.1 tr 命令

tr 命令可以用来删除一段文本信息中的某些文字。或者将其进行转换。

使用方式:

tr [option]...SET1 [SET2]

常用的选项有:

选项 说明
-d 删除和 set1 匹配的字符,注意不是全词匹配也不是按字符顺序匹配
-s 去除 set1 指定的在输入文本中连续并重复的字符
# 删除 "hello world" 中所有的'o','l','h'
$ echo 'hello world' | tr -d 'olh'
# 将"hello" 中的ll,去重为一个l
$ echo 'hello' | tr -s 'l'
# 将输入文本,全部转换为大写或小写输出
$ echo 'hello' | tr '[:lower:]' '[:upper:]'
# 上面的'[:lower:]' '[:upper:]'你也可以简单的写作'[a-z]' '[A-Z]',当然反过来将大写变小写也是可以的

【Linux 基础入门】(十)简单的文本处理_第1张图片

2.2 col 命令

col 命令可以将 Tab 换成对等数量的空格键,或反转这个操作。

使用方式:

col [option]

常用的选项有:

选项 说明
-x Tab 转换为空格
-h 将空格转换为 Tab (默认选项)
# 查看 /etc/protocols 中的不可见字符,可以看到很多 ^I ,这其实就是 Tab 转义成可见字符的符号
$ cat -A /etc/protocols
# 使用 col -x 将 /etc/protocols 中的 Tab 转换为空格,然后再使用 cat 查看,你发现 ^I 不见了
$ cat /etc/protocols | col -x | cat -A

2.3 join 命令

学过数据库的用户对这个应该不会陌生,这个命令就是用于将两个文件中包含相同内容的那一行合并在一起。

使用方式:

join [option]... file1 file2

常用的选项有:

选项 说明
-t 指定分隔符,默认为空格
-i 忽略大小写的差异
-1 指明第一个文件要用哪个字段来对比,默认对比第一个字段
-2 指明第二个文件要用哪个字段来对比,默认对比第一个字段
# 创建两个文件
$ echo '1 hello' > file1
$ echo '1 world' > file2
$ join file1 file2
# 将/etc/passwd与/etc/shadow两个文件合并,指定以':'作为分隔符
$ sudo join -t':' /etc/passwd /etc/shadow
# 将/etc/passwd与/etc/group两个文件合并,指定以':'作为分隔符, 分别比对第4和第3个字段
$ sudo join -t':' -1 4 /etc/passwd -2 3 /etc/group

在这里插入图片描述

2.4 paste 命令

paste 这个命令与 join 命令类似,它是在不对比数据的情况下,简单地将多个文件合并一起,以 Tab 隔开。

使用方式:

paste [option] file...

常用的选项有:

选项 说明
-d 指定合并的分隔符,默认为 Tab
-s 不合并到一行,每个文件为一行

example:

$ echo hello > file1
$ echo world> file2
$ echo welcome > file3
$ paste -d ':' file1 file2 file3
$ paste -s file1 file2 file3

【Linux 基础入门】(十)简单的文本处理_第2张图片

你可能感兴趣的:(Linux)