1. 匹配单个字符
1.1 匹配纯文本
在原始文本中查找目标文本
/as/.test("asd"); // true
/ad/.test("asd"); // false
多个匹配结果
一般正则表达式默认匹配第一个结果,提供不同的匹配模式供选择。
"asdasd".match(/as/g); // ["as", "as"]
大小写
一般正则表达式会提供一个机制,选择区分或者不区分大小写。
/A/.test("asd"); // false
/A/i.test("asd"); // true
1.2 匹配任意字符
点号(.)可以匹配任何一个单个字符。
/a.d/.test("asd"); // true
/a.d/.test("afd"); // true
1.3 匹配特殊字符
对于点号,星号等在正则表达式中有特殊含义的字符,需要在前面加一个反斜杠(\)来进行转移。
“\“本身就是”\“。
/a\.d/.test("asd"); // false
/a\.d/.test("a.d"); // true
2.匹配一组字符
字符集合用来匹配特定的字符和字符区间。
2.1 匹配一组字符中的一个
用中括号([])来定义字符集合,中括号间的字符都是该集合的组成部分,字符集和的匹配结果是能够和集合中的任意一个成员相匹配的文本。
/[abc]/.test("asd"); // true
/[abc]/.test("qsd"); // /false
2.2 字符集合区间
用连字符(-)来定义字符区间。
/[0-9]a/.test("2a"); // true
/[a-z]a/.test("aa"); // true
字符区间的首尾字符可以使ASCⅡ字符表里的任意字符,且匹配是按照字符表编码的决定的。需要注意连字符两边的字符顺序。
/[9-1]a/.test("2a"); // error
连字符只在中括号之间有效,在其他地方作为普通字符,不需要加反斜杠。
/-[a-z]/.test("-a"); // true
2.3 取非匹配
用元字符^对一个字符集合进行取非操作。即匹配字符集合以外的字符。
/[^a-z]/.test("asd"); // fasle
注意:虽然^放在方括号里面,但是是作用于整个字符区间的。
3. 元字符匹配
3.1 匹配元字符自身
用反斜杠(\)转义。
/\./.test("."); // true
3.2 匹配空白字符
正则表达式中用来表示空白字符的元字符如下:
元字符 | 说明 |
---|---|
[\b] | 回退 |
\f | 换页符 |
\n | 换行符 |
\r | 回车符 |
\t | 制表符 |
\v | 垂直制表符 |
注意:不同操作系统中对于文本行结束,文本结束的表示不同。例如,在Windows用\r\n表示文本行结束。Unix和Linxu系统用一个换行符来结束文本行。
3.3 匹配特定字符类型
3.3.1 匹配数字,非数字
元字符 | 说明 |
---|---|
\d | 任何一个数字字符(等价于[0-9]) |
\D | 任何一个非数字字符(等价于[^0-9]) |
/\d/.test("1") ; // true
/\D/.test("1") ; // false
可以看到用小写d匹配数字,大写D匹配相反的非数字,后面的其他类元字符也是如此。
3.3.2 匹配字母、数字和下划线,非字母、数字和下划线
元字符 | 说明 |
---|---|
\w | 任何一个字母,数字,下划线(等价于[a-zA-Z0-9_]) |
\W | 任何一个非字母,数字,下划线(等价于[^a-zA-Z0-9_]) |
/\w/.test("a"); \\ true
/\W/.test("a"); \\ false
3.3.3 匹配空白字符,非空白字符
元字符 | 说明 |
---|---|
\s | 任何一个空白字符(等价于[\f\n\r\t\v]) |
\S | 任何一个非空白字符(等价于[^\f\n\r\t\v]) |
/\s/.test(" "); // true
/\S/.test("a"); // true
注意:退格字符[\b]元字符不在类元字符\s的覆盖范围内。
3.3.4 匹配十六进制或者八进制数值
1. 使用十六进制匹配
正则表达式中用前缀\x来表示十六进制数值。
例如,\x0A对应于ASCⅡ字符10(换行符),等价于\n 。
2.使用八进制匹配
正则表达式用用前缀\0表示八进制数值。
例如,\011表示ASCⅡ字符9(制表符),等价于\t。
3.4 POSIX字符类
很多语言的正则表达式支持POSIX表达式。
注意:JavaScript不支持。
字符类 | 说明 |
---|---|
[:alnum:] | 任何一个字母或数字(等价于[a-zA-Z0-9]) |
[:alpha:] | 任何一个字母(等价于[a-zA-Z]) |
[:blank:] | 空格或者制表符(等价于[ \t]) |
[:cntrl:] | ASCⅡ控制字符(ASCⅡ0到31,再加上ASCⅡ127 |
[:digit:] | 任何一个数字(等价于[0-9]) |
[:graph:] | 任何一个可打印字符,不包括空格 |
[:lower:] | 任何一个小写字母(等价于[a-z]) |
[:print:] | 任何一个可打印字符 |
[:punct:] | 既不属于[:alnum:]也不属于[:cntrl:]的任何一个字符 |
[:space:] | 任何一个空白字符,包括空格(等价于[ \t\r\n\v\f]) |
[:upper:] | 任何一个大写字母(等价于[A-Z]) |
[:xdigit:] | 任何一个十六进制数字(等价于[a-fA-F0-9]) |
下一篇:重复匹配