Linux:Shell编程之正则表达式

目录

绪论

1、正则表达式

1.1 通配符

1.2 正则表达式分类

1.3 基本正则

1.4 正则表达式中表示次数的表达式

1.5 位置锚定

1.5.1 词首锚定和词尾锚定

1.6 分组()

1.7  逻辑或

1.8 扩展正则


绪论

正则表达式:有一类特殊字符以及文本字符所编写的一种模式,用来处理文本当中的内容,其中的一些字符不表示字符的字面含义,表示控制或者通配的功能

通配符:只能匹配文件名与目录名,不能匹配文件的内容

1、正则表达式

1.1 通配符

只能匹配文件名与目录名,不能匹配文件的内容

*匹配任意一个或者多个字符
touch  1.txt  2.txt  3.txt
ls *.txt
 
?匹配任意一个字符(就是匹配单个字符)
ls ?.txt
 
[ ] 匹配范围内的任意单个字符
touch {a..z}.txt
ls [a-n].txt

1.2 正则表达式分类

· 基本正则表达式

· 扩展正则表达式 

1.3 基本正则

字符匹配,元字符

. 匹配任意的单个字符,可以是一个汉字,\表示转义符,\.就是一个点 

eg:ls  |  grep  "12."  输出为123.txt

"()括号表示分组的意思",\(\)就是括号

eg:"[]"匹配指定范围内的任意单个字符

ls  |  grep  "[0-9]"

eg:大小写和数字一起匹配

ls  |  grep  "[0-9A-Za-z]"

eg:"[^]"取反,指定范围之外的

ls  |  grep  "[^A-Z]"

[[:space:]]包含空格,tab键,换行的空格,回车的空格

[[:blank:]] 空白字符(空格和tab制表符)

eg:以rc开头的任意单个字符0-6的数字

ls  /etc  |  grep  "rc[0-6]"

eg:只匹配以rc开头的文件,.不是正则

ls  /etc  |  grep  "rc\."

通配符不能完全匹配大小写, 正则可以

1.4 正则表达式中表示次数的表达式

" * "匹配前面的字符任意次,0次也行,无数次也行,有多少匹配多少(贪婪模式),没有也行

eg:

echo  goole  |  grep  "go*gle"  输出为google

echo  ggle  |  grep  "go*gle"  输出为ggle

" .* "匹配任意长度的字符,至少要有一次,不包括0次

eg:

echo  goole  |  grep  "go.*gle"  输出为google

echo  ggle  |  grep  "go.*gle"  此时匹配不到

" \?"匹配前面的字符0次或者一次,可有可无

" \+ " 匹配前面的字符至少1次,最多可以无数次

eg:

echo  ggle  |  grep  "go\+gle"

\{n\}匹配前面的字符等于n次,必须连续出现才能匹配

eg:echo  gogle  |  grep  "go\{|\}gle"

\{m,n\}匹配前面的字符,最少m次,最多n次

\{,n\}匹配前面的字符,最多n次(只要出现几次,出现都算,除非没有,只要前面的字符有,都算)

eg:echo  ggle  |  grep  "go\{,3}gle"

\{n,\}匹配前面的字符至少n次

1.5 位置锚定

^ 以什么为开头,在模式的左侧  

eg:cat  /etc/passwd  |  grep  "^root"

$ 以什么为结尾,在模式的右侧 r$表示以r为结尾

^root$ 用于匹配整行,而且整行中只有以后个root

^$ / ^[[:space:]]$  匹配空行

1.5.1 词首锚定和词尾锚定

词首锚定 \< 或者 \b

词尾锚定 \> 或者 \b   

根据\b的前后位置判断

eg:echo  hello-123  |  grep  "123\b"

输出为标红的hello-123

echo  hello-123  |  grep  "\bhello"

输出为标红的hello-123

\ 表示匹配整个单词

1.6 分组()

echo  abccc  |  grep  "abc\{3\}"

输出为abccc

\{n\}表示正好出现n次,n次表示前面的字符必须要连续出现才能匹配

\{,n}只要你出现几次都算,除非没有

eg:echo  golgogle  |  grep  "\(go  \)\{}\}gle"

输出为gogle

\(go\)是一个租,连续的go只出现一个,两个不连续的go都出现

1.7  逻辑或

\|:斜杠管道符表示逻辑或

echo  | abc2abc  |  grep  "(1\|2\)abc"

1.8 扩展正则

不用写斜杠了

需要使用grep  -E 或者egrep

echo  1abc2abc  |  grep  -E  "(1|2)abc"

匹配邮箱号码  :

vim  /opt/pipei.txt

Linux:Shell编程之正则表达式_第1张图片

cat  pipei.txt  |  grep  -E "[0-9a-z]{9,11}@[0-9a-z]{2,3}\.[a-z]{2,3} 

你可能感兴趣的:(正则表达式)