正则表达式-1.字符匹配

1. 匹配单个字符

1.1 匹配纯文本

在原始文本中查找目标文本

/as/.test("asd"); // true
/ad/.test("asd"); // false
多个匹配结果

一般正则表达式默认匹配第一个结果,提供不同的匹配模式供选择。

"asdasd".match(/as/g); // ["as", "as"]
大小写

一般正则表达式会提供一个机制,选择区分或者不区分大小写。

/A/.test("asd"); // false
/A/i.test("asd"); // true

1.2 匹配任意字符

点号(.)可以匹配任何一个单个字符。

/a.d/.test("asd"); // true
/a.d/.test("afd"); // true

1.3 匹配特殊字符

对于点号,星号等在正则表达式中有特殊含义的字符,需要在前面加一个反斜杠(\)来进行转移。
“\“本身就是”\“

/a\.d/.test("asd"); // false
/a\.d/.test("a.d"); // true

2.匹配一组字符

字符集合用来匹配特定的字符和字符区间。

2.1 匹配一组字符中的一个

用中括号([])来定义字符集合,中括号间的字符都是该集合的组成部分,字符集和的匹配结果是能够和集合中的任意一个成员相匹配的文本。

/[abc]/.test("asd"); // true
/[abc]/.test("qsd"); // /false

2.2 字符集合区间

用连字符(-)来定义字符区间。

/[0-9]a/.test("2a"); // true
/[a-z]a/.test("aa"); // true

字符区间的首尾字符可以使ASCⅡ字符表里的任意字符,且匹配是按照字符表编码的决定的。需要注意连字符两边的字符顺序。

/[9-1]a/.test("2a"); // error

连字符只在中括号之间有效,在其他地方作为普通字符,不需要加反斜杠。

/-[a-z]/.test("-a"); // true

2.3 取非匹配

用元字符^对一个字符集合进行取非操作。即匹配字符集合以外的字符。

/[^a-z]/.test("asd"); // fasle

注意:虽然^放在方括号里面,但是是作用于整个字符区间的。

3. 元字符匹配

3.1 匹配元字符自身

用反斜杠(\)转义。

/\./.test("."); // true

3.2 匹配空白字符

正则表达式中用来表示空白字符的元字符如下:

元字符 说明
[\b] 回退
\f 换页符
\n 换行符
\r 回车符
\t 制表符
\v 垂直制表符

注意:不同操作系统中对于文本行结束,文本结束的表示不同。例如,在Windows用\r\n表示文本行结束。Unix和Linxu系统用一个换行符来结束文本行。

3.3 匹配特定字符类型

3.3.1 匹配数字,非数字

元字符 说明
\d 任何一个数字字符(等价于[0-9])
\D 任何一个非数字字符(等价于[^0-9])
/\d/.test("1") ; // true
/\D/.test("1") ; // false

可以看到用小写d匹配数字,大写D匹配相反的非数字,后面的其他类元字符也是如此。

3.3.2 匹配字母、数字和下划线,非字母、数字和下划线

元字符 说明
\w 任何一个字母,数字,下划线(等价于[a-zA-Z0-9_])
\W 任何一个非字母,数字,下划线(等价于[^a-zA-Z0-9_])
/\w/.test("a"); \\ true
/\W/.test("a"); \\ false

3.3.3 匹配空白字符,非空白字符

元字符 说明
\s 任何一个空白字符(等价于[\f\n\r\t\v])
\S 任何一个非空白字符(等价于[^\f\n\r\t\v])
/\s/.test(" "); // true
/\S/.test("a"); // true

注意:退格字符[\b]元字符不在类元字符\s的覆盖范围内。

3.3.4 匹配十六进制或者八进制数值

1. 使用十六进制匹配

正则表达式中用前缀\x来表示十六进制数值。
例如,\x0A对应于ASCⅡ字符10(换行符),等价于\n 。

2.使用八进制匹配

正则表达式用用前缀\0表示八进制数值。
例如,\011表示ASCⅡ字符9(制表符),等价于\t。

3.4 POSIX字符类

很多语言的正则表达式支持POSIX表达式。
注意:JavaScript不支持。

字符类 说明
[:alnum:] 任何一个字母或数字(等价于[a-zA-Z0-9])
[:alpha:] 任何一个字母(等价于[a-zA-Z])
[:blank:] 空格或者制表符(等价于[ \t])
[:cntrl:] ASCⅡ控制字符(ASCⅡ0到31,再加上ASCⅡ127
[:digit:] 任何一个数字(等价于[0-9])
[:graph:] 任何一个可打印字符,不包括空格
[:lower:] 任何一个小写字母(等价于[a-z])
[:print:] 任何一个可打印字符
[:punct:] 既不属于[:alnum:]也不属于[:cntrl:]的任何一个字符
[:space:] 任何一个空白字符,包括空格(等价于[ \t\r\n\v\f])
[:upper:] 任何一个大写字母(等价于[A-Z])
[:xdigit:] 任何一个十六进制数字(等价于[a-fA-F0-9])

下一篇:重复匹配

你可能感兴趣的:(正则表达式-1.字符匹配)