正则表达式

文章目录

    • 一.正则表达式
      • 1.含义
      • 2.通配符
        • 2.1通配符含义作用
        • 2.2常见的通配符
      • 3.元字符(字符匹配)
      • 4.表示次数
      • 5.位置锚定
      • 6.分组或其他
    • 二.扩展正则表达式
      • 1.表示次数
      • 2.举例

一.正则表达式

1.含义

(1)是一种特殊字符及文本字符所编写的模式,针对文本文件的内容

(2)主要用来匹配字符串(命令结果,文本内容)

2.通配符

2.1通配符含义作用

通配符只用于匹配文件名、目录名等,不能用于匹配文件内容。(而且是已存在的文件或者目录)

2.2常见的通配符

(1)*:通配符,匹配任意一个或多个字符

ls *.txt

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-T6uQx7ZT-1685779374417)(C:\Users\zhao\AppData\Roaming\Typora\typora-user-images\image-20230603135433037.png)]

(2)?:通配符,只能匹配任意一个字符

ls ?.txt

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-viaVUpJG-1685779374418)(C:\Users\zhao\AppData\Roaming\Typora\typora-user-images\image-20230603135707150.png)]

(3)[ ] 通配符,匹配list中任意单个字符

ls [a-z].txt

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sbstE5po-1685779374418)(C:\Users\zhao\AppData\Roaming\Typora\typora-user-images\image-20230603135922037.png)]

3.元字符(字符匹配)

常用元字符
. 匹配任意单个字符,可以是一个汉字
() 使用转义符,只表示()
[] 匹配指定范围内的任意单个字符
[^] 匹配指定范围外的任意单个字符(取反)
[[:space:]]:匹配空格

示例:

ls /opt/ | grep "[^A-Z]"——————————不要大写字符的文本内容
ls /opt/ | grep "[0-9].txt"—————————取含有0-9字符的txt文件名

正则表达式_第1张图片

ls /opt/ | grep "[a-zA-Z]"——————————匹配大小写英文字符
ls /opt/ | grep "[a-z0-9]"——————————同时匹配字符和数字
ls /opt/ | grep "[zj]"——————————————匹配zj任意的两个字符

4.表示次数

常用的表示
* #匹配前面的字符任意次,包括0次,贪婪模式:尽可能长的匹配
.* #任意长度的任意字符,不包括0次,也就是匹配所有
? #匹配其前面的字符出现0次或1次,即:可有可无
+ #匹配其前面的字符出现最少1次,即:肯定有且 >=1 次
{n} #匹配前面的字符=n次
{m,n} #匹配前面的字符至少m次,至多n次
{,n} #匹配前面的字符至多n次,<=n
{n,} #匹配前面的字符至少n次

示例:

echo google | grep 'go\{2\}gle'———————代表前面的o连续出现2次
echo gooooooogle | grep 'go\{2,\}gle'———————代表前面的o出现2次以上
echo goooogle | grep 'go\{2,5\}gle'——————代表前面的o出现2次以上5次以下
echo golgole | grep “\(go\)\{1\}”————————不连续的go

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-q4v4TVCO-1685779374419)(C:\Users\zhao\AppData\Roaming\Typora\typora-user-images\image-20230603144925773.png)]

ifconfig ens33 | grep -o "[0-9]\+\.[0-9]\+\.[0-9]\+\.[0-9]\+"————————————匹配IP地址过滤出所有结果

正则表达式_第2张图片

echo [email protected] | grep "[0-9]\+@qq\.[a-z]\+"————匹配邮箱号

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-c5sSz8Vs-1685779374420)(C:\Users\zhao\AppData\Roaming\Typora\typora-user-images\image-20230603145512623.png)]

5.位置锚定

常用
^ #行首错定,用于模式的最左侧
$ #行尾错定,用于模式的最右侧
^root$ #用于模式匹配整行 (单独一行 只有root )
~$ #空行
1*$ #空白行
\<或 \b       #词首错定,用于单词模式的左侧(连续的数字,字母,下划线都算单词内部)
\>或\b         #词尾错定,用于单词模式的石侧
\      #匹配敷个单词
cat /etc/fstab | grep -v "#" |grep -v "^$"————过滤出文字不包含#号行的

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-94qibWAV-1685779374420)(C:\Users\zhao\AppData\Roaming\Typora\typora-user-images\image-20230603152808358.png)]

单词模式

echo hello-123 | grep "\bhello"
echo hello-123 | grep "\b123"

正则表达式_第3张图片

6.分组或其他

分组:()将多个字符捆绑在一起,当作一个整体处理

或者:\|
echo hello-123 | grep "\bhello"
echo hello-123 | grep "\b123"
echo abccc | grep "abc\{3\}"
echo abcabcabc | grep "\(abc\)\{3\}"
echo golgogle | grep "\(go\)\{1\}"
echo golgogle | grep "\(go\)\{1\}gle"

正则表达式_第4张图片

二.扩展正则表达式

grep -E或者egrep

1.表示次数

字符
* #匹配前面字符任意次
? #0或1次
+ #1次或多次
{n} # 匹配n次
{m,n} #至少m,至多n次
{,n} #匹配前面的字符至多n次,<=n,n可以为0
{n , } #匹配前面的字符至少n次,<-n,n可以为0

2.举例

将ifconfig ens33 的地址显示出来

ifconfig ens33 | grep -E -o "[0-9]+\.[0-9]+\.[0-9]+\.[0-9]+"                 

正则表达式_第5张图片

将文本中的的区号展示出来

cat 888.txt | grep -E "[0-9]{,4}-[0-9]{,8}"

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TCSooJXI-1685779374422)(C:\Users\zhao\AppData\Roaming\Typora\typora-user-images\image-20230603155302639.png)]

将电话号码展示(11位)

cat dhhm.txt | grep -E "[0-9]{,11}"

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Xi51zDxY-1685779374423)(C:\Users\zhao\AppData\Roaming\Typora\typora-user-images\image-20230603155400296.png)]

将不同的地址展示

cat kz.txt | grep -E "[0-9a-zA-Z]+@[0-9a-z]+\.[a-z]{,3}"

正则表达式_第6张图片

不同类型的区号展示

cat lz.txt | grep -E "(\([0-9]+\)|[0-9]+)[ -]?[0-9]+[ -]?[0-9]+"

正则表达式_第7张图片


  1. [:space:] ↩︎

你可能感兴趣的:(正则表达式,linux,java)