正则表达式

正则表达式是一个描述字符模式的对象。

定义

JavaScript 中的正则表达式用RegExp对象表示,可以通过 RegExp()构造函数定义,也可以直接通过引号包裹字符的方式来定义,例如:

var pattern = /s$/

用来匹配所有以字母s 结尾的字符串。
与下面定义等价。

var pattern = new RegExp("s$")
字符类定义
字符 匹配
[...] 方括号内任意字符
[^...] 不在括号内的任意字符
. 除换行符和其他Unicode行终止符之外任意字符
\w 任意ASCII字符组成的单词 等价于 [a-zA-Z0-9]
\W 任意不是ASCII字符组成单词,等级与[^a-zA-Z0-9]
\s 任何Unicode空白符
\S 任何非Unicode 空白字符的字符。
\d 任何数字 等价于 [0-9]
\D 除数字外 任意字符 等价于 [^0-9]
[\b] 退格直接量(特例)
注意:方括号内 可以放特殊的转义,如/[\s\d]/ 匹配 任意空白符或者数字。
表示退格符 /[\b]/
重复
字符 含义
{n,m} 匹配前一项至少至少 n次 不能超过m次
{n,} n次或者更多
{n} n次
? 0次或者1次 等价{0,1}
+ 一次或者多次, 等价于{1,}
* 0次或者多次,等价于{0,}

例子:

/\d{1,2}/ 匹配1-2个数字
/\s+java\s+/ 匹配前后带一个或多个空格的字符串 java

注意: * 和 ? 可以匹配0个字符。 例如 /a*/ 与字符串 'bbb'是匹配的

选择、分组

正则表达式可以包括指定选择项、子表达式和引用前一子表达式的特殊字符。'|'用于分隔。例如 /ab|cd/ 可以匹配字符串 ab 或者cd。
/\d{3}|[a-z]{4}/ 匹配三位数字或者四个小写字母。 | 类似||或操作。

圆括号有多种作用。

1.把单独的项目组合成子表达式,以便可以像处理一个独立的单元那样用| * + 等来对单元内的项进行处理。 例如/java(script)?/可以匹配 字符串java 后面的script可有可无。/(ab|cd)+|ef/可以匹配'ef'也可以匹配 ab 或者 cd 一次或多次。个人感觉作用 类似 运算符() 设置作用域。

  1. 另一个作用是在完整的模式中定义子模式,当一个正则表示式成功和目标字符串匹配时,可以从目标串中抽取出和圆括号中的子模式相匹配的部分。假如检索在一个或多个小写字母后面跟随一位活多个数字,可以用/[a-z]+\d+/ 可以写成(/[a-z]+\d+/ ) 就可以检索到匹配中抽取数字。
指定匹配位置
字符 含义
^ 匹配字符串的开头,在多行检索中,匹配一行的开头
$ 匹配字符串的结尾,在多行检索中,匹配一样的结尾

常用

字符 含义
^ 匹配字符串的开头,在多行检索中,匹配一行的开头
$ 匹配字符串的结尾,在多行检索中,匹配一样的结尾

RegExp对象

用法:
第二个参数可以 g i m

g 只影响于 exec、match 方法。
若不指定 g,则:每次调用 exec 都只返回第一个匹配;match 也是只返回第一个匹配。
若指定 g,则:每次调用 exec 都从上一个匹配之后查找新的匹配;match 则是返回所有的匹配。

参数 i 是指忽略大小写,注意仅是忽略大小写,并不忽略全半角。

m 影响对行首、行尾的解释,也就是影响 ^、$。
若不指定 m,则:^ 只在字符串的最开头,$ 只在字符串的最结尾。
若指定 m,则:^ 在字符串每一行的开头,$ 在字符串第一行的结尾。

全局匹配字符串中的5个数字。

var pattern = new RegExp("\\d{5}","g")

RegExp 对象有 3 个方法:test()、exec() 以及 compile()

test()方法检索字符串中的指定值。返回值是true或false。

exec()方法检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配,则返回null

compile()方法用于改变RegExp。

compile()既可以改变检索模式,也可以添加或删除第二个参数。


1512737307078.jpg

你可能感兴趣的:(正则表达式)