第四周打卡

本周的主题是『正则』。下面列举一些常用的正则字符及用法。

正则中的特殊字符

字符 含义
\ 在非特殊字符之前的反斜杠表示下一个字符是特殊的,不能从字面上解释;反斜杠也可以将其后的特殊字符,转义为字面量。
^ 匹配输入的开始。如果多行标志被设置为true,那么也匹配换行符后紧跟的位置。
$ 匹配输入的结束。如果多行标示被设置为true,那么也匹配换行符前的位置。
* 匹配前一个表达式0次或多次。等价于 {0,}。
+ 匹配前面一个表达式1次或者多次。等价于 {1,}。
? 匹配前面一个表达式0次或者1次。等价于 {0,1}。
. (小数点)匹配除换行符之外的任何单个字符。
(x) 匹配 'x' 并且记住匹配项,就像下面的例子展示的那样。括号被称为 捕获括号
(?:x) 匹配 'x' 但是不记住匹配项。这种叫作非捕获括号,使得你能够定义为与正则表达式运算符一起使用的子表达式。
x(?=y) 匹配'x'仅仅当'x'后面跟着'y'.这种叫做正向肯定查找。
x(?!y) 匹配'x'仅仅当'x'后面不跟着'y',这个叫做正向否定查找。
x|y 匹配‘x’或者‘y’。
{n} n是一个正整数,匹配了前面一个字符刚好发生了n次。
{n,m} n 和 m 都是整数。匹配前面的字符至少n次,最多m次。如果 n 或者 m 的值是0, 这个值被忽略。
[xyz] 一个字符集合。匹配方括号的中任意字符,包括转义序列。
[^xyz] 一个反向字符集。也就是说, 它匹配任何没有包含在方括号中的字符。可以使用破折号(-)来指定一个字符范围。任何普通字符在这里都是起作用的。
[\b] 匹配一个退格(U+0008)。(不要和\b混淆了。)
\b 匹配一个词的边界。一个词的边界就是一个词不被另外一个“字”字符跟随的位置或者没有其他“字”字符在其前面的位置。注意,一个匹配的词的边界并不包含在匹配的内容中。换句话说,一个匹配的词的边界的内容的长度是0。(不要和[\b]混淆了)
\B 匹配一个非单词边界。他匹配一个前后字符都是相同类型的位置:都是“字”字符或者都不是“字”字符。一个字符串的开始和结尾都被认为不是“字”字符,或者空字符串。
\cX 当X是处于A到Z之间的字符的时候,匹配字符串中的一个控制符。
\d 匹配一个数字。等价于[0-9]。
\D 匹配一个非数字字符。等价于[^0-9]。
\f 匹配一个换页符 (U+000C)。
\n 匹配一个换行符 (U+000A)。
\r 匹配一个回车符 (U+000D)。
\s 匹配一个空白字符,包括空格、制表符、换页符和换行符。
\S 匹配一个非空白字符。
\t 匹配一个水平制表符 (U+0009)。
\v 匹配一个垂直制表符 (U+000B)。
\w 匹配一个单字字符(字母、数字或者下划线)。等价于[A-Za-z0-9_]。
\W 匹配一个非单字字符。等价于[^A-Za-z0-9_]。
*n* 在正则表达式中,它返回最后的第n个子捕获匹配的子字符串(捕获的数目以左括号计数)。
\0 匹配 NULL (U+0000) 字符, 不要在这后面跟其它小数,因为 \0 是一个八进制转义序列。
\xhh 与代码 hh 匹配字符(两个十六进制数字)。
\uhhhh 与代码 hhhh 匹配字符(四个十六进制数字)。
\u{hhhh} (仅当设置了u标志时) 使用Unicode值hhhh匹配字符 (十六进制数字)。

大写和小写字符一般是一个补集的关系。

使用正则表达式的方法

方法 描述
exec 一个在字符串中测试是否匹配的RegExp方法,它返回true或false。
match 一个在字符串中执行查找匹配的String方法,它返回一个数组或者在未匹配到时返回null。
search 一个在字符串中测试匹配的String方法,它返回匹配到的位置索引,或者在失败时返回-1。
replace 一个在字符串中执行查找匹配的String方法,并且使用替换字符串替换掉匹配到的子字符串。
split 一个使用正则表达式或者一个固定字符串分隔一个字符串,并将分隔后的子字符串存储到数组中的String方法。

修饰符&标志

符号 描述
g 全局搜索。
i 不区分大小写搜索。
m 多行搜索。
y 执行“粘性”搜索,匹配从目标字符串的当前位置开始,可以使用y标志。
u unicode
s dotAll

你可能感兴趣的:(第四周打卡)