Shell脚本之正则表达式与文本处理工具详解

文章目录

  • 一.正则表达式定义
  • 二.正则表达式元字符
    • 2.1基础正则表达式元字符
    • 2.2扩展正则表达式元字符
  • 三.文本处理工具
    • 3.1列截取工具--cut
    • 3.2排序工具--sort
    • 3.3去重工具--uniq
    • 3.4修改工具--tr
    • 3.5文本工具组合
  • 四.总结

引言:
正则表达式,又称规则表达式。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本,正则表达式不只有一种,而且 Linux 中不同的程序可能会使用不同的正则表达式。

一.正则表达式定义

正则表达式,又称正规表达式、常规表达式,使用字符串来描述、匹配一些列符合某个规则的字符串
正则表达式是由普通字符元字符组成
普通字符包括大小写字母、数字、标点符号及一些其他符号
元字符是指在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式
Linux 中常用的有两种正则表达式引擎
基础正则表达式:BRE
扩展正则表达式: ERE

二.正则表达式元字符

2.1基础正则表达式元字符

基础正则表达式常见元字符如下:

<
元字符 作用
\ 转义字符,用于取消特殊符号的含义
^ 匹配字符串开始的位置
$ 匹配字符串结束的位置
^$ 匹配空行
. 匹配除\n之外的任何一个字符
* 匹配前面子表达式0次或多次
[list] 匹配list列表中的一个字符
[^list] 匹配任意非列表中的一个字符

你可能感兴趣的:(运维,linux,云计算,bash)