正则表达式

[ABC] 匹配 [...] 中的所有字符
[^ABC] 匹配除了 [...] 中的所有字符
[A-Z]  表示一个区间,匹配所有大写字母
[a-z] 表示所有小写字母,匹配所有的小写字母
.

匹配除了换行符(\n、\r)之外的任何单个字符,

相等于 [^\n\r]。要匹配 . ,请使用 \. 。

[\s\S]

匹配所有。

\s 是匹配所有空白符,包括换行,\S 非空白符,不包括换行。

\w

匹配字母、数字、下划线。

等价于 [A-Za-z0-9_]

{n}

n 是一个非负整数。匹配确定的 n 次。

eg:o{2} 不能匹配 "Bob" 中的 o,但是能匹配 "food" 中的两个 o

{n,}

n 是一个非负整数。至少匹配n 次。

eg:o{2,} 不能匹配 "Bob" 中的 o,但能匹配 "foooood" 中的所有 o

o{1,} 等价于 o+。o{0,} 则等价于 o*。

{n,m}

m 和 n 均为非负整数,其中 n <= m。最少匹配 n 次且最多匹配 m 次。

eg:o{1,3} 将匹配 "fooooood" 中的前三个 o

o{0,1} 等价于 o?。

请注意在逗号和两个数之间不能有空格。

*

匹配前面的子表达式(字符)零次或多次。

要匹配 * 字符,请使用 \*。

eg:zo* 能匹配 "z" 以及 "zoo"。* 等价于 {0,}。

+

匹配前面的子表达式一次或多次。

要匹配 + 字符,请使用 \+。

[

标记一个中括号表达式的开始。

要匹配 [,请使用 \[。

?

匹配前面的子表达式零次或一次,或指明一个非贪婪限定符。

要匹配 ? 字符,请使用 \?。

\

将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。

eg: 'n' 匹配字符 'n'。'\n' 匹配换行符。序列 '\\' 匹配 "\",而 '\(' 则匹配 "("。

^

匹配输入字符串的开始位置,除非在方括号表达式中使用,当该符号在方括号表达式中使用时,表示不接受该方括号表达式中的字符集合。

要匹配 ^ 字符本身,请使用 \^。

{ 标记限定符表达式的开始。要匹配 {,请使用 \{。
| 指明两项之间的一个选择。要匹配 |,请使用 \|。
() () 表示捕获分组,() 会把每个分组里的匹配的值保存起来, 多个匹配值可以通过数字 n 来查看(n 是一个数字,表示第 n 个捕获组的内容)。
exp1(?=exp2) 查找 exp2 前面的 exp1。
exp1(?!exp2) 查找后面不是 exp2 的 exp1。
(?<=exp2)exp1 查找 exp2 后面的 exp1。
(? 查找前面不是 exp2 的 exp1。

* 和 + 限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个 ? 就可以实现非贪婪或最小匹配。

贪婪:下面的表达式匹配从开始小于符号 (<) 到关闭 h1 标记的大于符号 (>) 之间的所有内容。

非贪婪:如果您只需要匹配开始和结束 h1 标签,下面的非贪婪表达式只匹配

通过在 *、+ 或 ? 限定符之后放置 ?,该表达式从"贪婪"表达式转换为"非贪婪"表达式或者最小匹配。

eg:

标题

/<.*>/:

标题

/<.*?>/:

你可能感兴趣的:(1024程序员节)