第四周打卡

本周的主题是『正则』。下面列举一些常用的正则字符及用法。

正则中的特殊字符

字符	含义
\	在非特殊字符之前的反斜杠表示下一个字符是特殊的，不能从字面上解释；反斜杠也可以将其后的特殊字符，转义为字面量。
^	匹配输入的开始。如果多行标志被设置为true，那么也匹配换行符后紧跟的位置。
$	匹配输入的结束。如果多行标示被设置为true，那么也匹配换行符前的位置。
*	匹配前一个表达式0次或多次。等价于 {0,}。
+	匹配前面一个表达式1次或者多次。等价于 {1,}。
?	匹配前面一个表达式0次或者1次。等价于 {0,1}。
.	（小数点）匹配除换行符之外的任何单个字符。
(x)	匹配 'x' 并且记住匹配项，就像下面的例子展示的那样。括号被称为捕获括号。
(?:x)	匹配 'x' 但是不记住匹配项。这种叫作非捕获括号，使得你能够定义为与正则表达式运算符一起使用的子表达式。
x(?=y)	匹配'x'仅仅当'x'后面跟着'y'.这种叫做正向肯定查找。
x(?!y)	匹配'x'仅仅当'x'后面不跟着'y',这个叫做正向否定查找。
x\|y	匹配‘x’或者‘y’。
{n}	n是一个正整数，匹配了前面一个字符刚好发生了n次。
{n,m}	n 和 m 都是整数。匹配前面的字符至少n次，最多m次。如果 n 或者 m 的值是0，这个值被忽略。
[xyz]	一个字符集合。匹配方括号的中任意字符，包括转义序列。
[^xyz]	一个反向字符集。也就是说，它匹配任何没有包含在方括号中的字符。可以使用破折号（-）来指定一个字符范围。任何普通字符在这里都是起作用的。
[\b]	匹配一个退格(U+0008)。（不要和\b混淆了。）
\b	匹配一个词的边界。一个词的边界就是一个词不被另外一个“字”字符跟随的位置或者没有其他“字”字符在其前面的位置。注意，一个匹配的词的边界并不包含在匹配的内容中。换句话说，一个匹配的词的边界的内容的长度是0。（不要和[\b]混淆了）
\B	匹配一个非单词边界。他匹配一个前后字符都是相同类型的位置：都是“字”字符或者都不是“字”字符。一个字符串的开始和结尾都被认为不是“字”字符，或者空字符串。
\cX	当X是处于A到Z之间的字符的时候，匹配字符串中的一个控制符。
\d	匹配一个数字。等价于[0-9]。
\D	匹配一个非数字字符。等价于[^0-9]。
\f	匹配一个换页符 (U+000C)。
\n	匹配一个换行符 (U+000A)。
\r	匹配一个回车符 (U+000D)。
\s	匹配一个空白字符，包括空格、制表符、换页符和换行符。
\S	匹配一个非空白字符。
\t	匹配一个水平制表符 (U+0009)。
\v	匹配一个垂直制表符 (U+000B)。
\w	匹配一个单字字符（字母、数字或者下划线）。等价于[A-Za-z0-9_]。
\W	匹配一个非单字字符。等价于[^A-Za-z0-9_]。
n	在正则表达式中，它返回最后的第n个子捕获匹配的子字符串(捕获的数目以左括号计数)。
\0	匹配 NULL (U+0000) 字符，不要在这后面跟其它小数，因为 \0 是一个八进制转义序列。
\xhh	与代码 hh 匹配字符（两个十六进制数字）。
\uhhhh	与代码 hhhh 匹配字符（四个十六进制数字）。
\u{hhhh}	(仅当设置了u标志时) 使用Unicode值hhhh匹配字符 (十六进制数字)。

大写和小写字符一般是一个补集的关系。

使用正则表达式的方法

方法	描述
exec	一个在字符串中测试是否匹配的RegExp方法，它返回true或false。
match	一个在字符串中执行查找匹配的String方法，它返回一个数组或者在未匹配到时返回null。
search	一个在字符串中测试匹配的String方法，它返回匹配到的位置索引，或者在失败时返回-1。
replace	一个在字符串中执行查找匹配的String方法，并且使用替换字符串替换掉匹配到的子字符串。
split	一个使用正则表达式或者一个固定字符串分隔一个字符串，并将分隔后的子字符串存储到数组中的String方法。

修饰符&标志

符号	描述
g	全局搜索。
i	不区分大小写搜索。
m	多行搜索。
y	执行“粘性”搜索,匹配从目标字符串的当前位置开始，可以使用y标志。
u	unicode
s	dotAll

第四周打卡

正则中的特殊字符

使用正则表达式的方法

修饰符&标志

你可能感兴趣的:(第四周打卡)