精通 正则表达式 看这一篇就够了

元字符(Metacharacters)

行的开始和结束

^脱字符 行的开始

$行的结束

[^cat]的意思是:匹配行的开始,然后紧接着是一个c字符,然后接着的是a字符,然后马上是一个t字符。

 

字符单元(Character Classes)

匹配几个符号中的任何一个

所以gr[ea]y匹配grey或gray

H[123456]匹配H1 H2 H3 H4 H5 H6 等同于H[1-6].

so ![0123456789abcdefABCDEF]" can be written as ![0-9a-fA-F]" (or, perhaps, ![A-Fa-f0-9]",横线的使用方式

注意,在方括号中元字符-代表范围,但是如果在[]开头则代表-本身。

同样的,^在开头表示否定,If you use [^…]" instead of […], the class matches any character that isn't listed.

[.]matches any character点匹配任意的一个字符。

 

Alternation 可选可以选择的

匹配任何一个或者几个 子表达式

|符号,例如gr[ea]y等同于grey|gray,或者gr(e|a)y, 必须有括号,否则就成了匹配gre或者ay了。小括号里面的为一组。

Egrep -i可以忽略大小写哦。

单词边界,egrep可以使用\来表示。 比如\

 

 

Summarize以上的总结

Summary of Metacharacters Seen So Far

Metacharacter

Name

Matches

.

[…]

[^…]

 Dot

 Character class

 Negated character class

 

 and one character

 any character in listed

 any character not in listed

^

$

\<

/>

 caret

 dollar

 Backslash less-than

 Backslash greater-than

 the position at the start of the line

 the position at the end of the line

 the position at the start of the word, not support by all version of egrep

 the position at the end of a word, not support by all version of egrep    

|

(…)

 Or; bar

 parentbeses

Matches either expression it separates

Used to limit scope of '|', plus additional uses yet to be discussed

 

 

 

 

可选的匹配条目

比如我们要匹配color或者colour。正则为:colou?r。 ?意味着可选,紧接着前面可以不存在的元字符。

比如,we can shorten the !(July;Jul)" to !(July?)".

 

 

 

 

你可能感兴趣的:(python)