js正则表达式学习笔记

js正则表达
新建正则表达式有两种方法:
(1)使用字面量
var regex = /xyz/;
(2)使用RegExp构造函数
var regex = new RegExp('xyz');
正则的使用
regex.test(string)
string.match(regex)


正则的匹配规则
1.字面量字符和元字符
大部分字符正则表达式,就是字面的含义
/a/匹配a, /b/匹配b
元字符:
(1)点字符.:匹配除回车(\r),换行(\n),行分隔符(\u2028),段分隔符(\u2029),以外的所有字符
/c.t/
(2)位置字符:提示字符所处的位置,主要有两个字符
^字符串的开始位置和$字符串的结束位置
(3)选择符|:表示或关系,cat|dog 11|22
(4)转义符\:对特殊字符的处理\+
正则中需要用到反斜杠的^、.、[、$、(、)、|、*、+、?、{和\\,特别注意:
若使用RegExp方法生成正则对象,转移需要使用两个斜杠,因为字符串内部会先转义一次,
(new RegExp('1\\+1')).test('1+1');
正则表达式对不能打印的特殊字符提供了表达方法:
\cX 表示Ctrl-[X],其中的X是A-Z之中任一个英文字母,用来匹配控制字符。
[\b] 匹配退格键(U+0008),不要与\b混淆。
\n 匹配换行键。
\r 匹配回车键。
\t 匹配制表符tab(U+0009)。
\v 匹配垂直制表符(U+000B)。
\f 匹配换页符(U+000C)。
\0 匹配null字符(U+0000)。
\xhh 匹配一个以两位十六进制数(\x00-\xFF)表示的字符。
\uhhhh 匹配一个以四位十六进制数(\u0000-\uFFFF)表示的unicode字符。


字符类:表示有一系列字符可供选择,只要匹配其中一个就可以,所有可供选择的字符都放在该方括号中
比如:[xyz],表示x,y,z之中任选一个匹配.
/[abc]/.test('hello world') //flase
字符类中两个特殊含义的字符:
(1)脱字符^,[^xyz]表示除了x,y,z之外的都可以匹配
若只有[^]表示匹配一切字符,包括换行符等
(2)连字符-,例如[abc]=>[a-c], [0123456789]=>[0-9], [A-Z]
连字符必须出现在[]中,否则就是普通的字符


预定义模式
预定义模式指的是某些常见模式的简写方式
\d匹配0-9之间的任一数字,相当于[0-9]
\D匹配所有0-9以外的字符,相当于[^0-9]
\w匹配任意的字母,数字和下划线,相当于[A-Za-z0-9_]
\W匹配除所有字母,数字和下划线以外的字符,相当于[^A-Za-z0-9_]
\s匹配空格(包括制表符,空格符,断行符),相当于[\t\r\n\v\f]
\S匹配非空格的字符,相当于[^\t\r\n\v\f]
\b匹配词的边界 词首独立,例如/\bworld/匹配'hello world'或者'hello-world'不匹配'helloworld'
\B匹配非词边界,即在词的内部


重复类
模式的精确匹配次数,使用大括号{}表示,{n}表示恰好重复n次,{n,}表示至少重复n次,{n,m}表示重复不少于n次,不
多于m次


量词符
设定某个模式出现的次数
?表示某个模式出现0或者1次=>{0, 1}
*表示某个模式出现0次或者多次,等同于{0,}
+表示某个模式出现1次或多次,等同于{1,}


贪婪模式
例如/a+/.match('aaa') => ["aaa"],因为不知道到底是多少个匹配,所以会一直匹配下去,直到匹配不到
非贪婪模式,即阻止贪婪模式的出现
/a+?/.match('aaa') => ["a"]
非贪婪模式还有*?和+?


修饰服
表示模式的附加规则,放在正则表达是的最尾部.
可以单个使用,也可以多个一起使用
//单个修饰符
var regex = /test/i;
//多个修饰符
var regex = /test/ig;
修饰符
(1)g修饰符
默认情况,正则第一次匹配到之后,就不会往下继续匹配,g修饰符表示全局匹配,加上之后,正则对象将匹配
全部符合条件的结果.
(2)i修饰符
默认情况下,正则区分字母的大小写,加上i修饰符,可以忽略大小写.
/abc/.test('ABC') //false
/abc/i.test('ABC') //true
(3)m修饰符
m修饰符表示多行模式(multiline),可以识别换行符(\n)
例:/world$/.test('hello world\n') //false
  /world$/m.test('hello world\n') //true
   /^b/m.test('a\nb') //true


组匹配
正则表达式括号表示分组匹配,货号中的模式可以用来匹配分组的内容
/fred+/.test('fredd') //true
/(fred)+/.test('fredfred') //true


'abcabc'.match(/(.)b(.)/); => ['abc', 'a', 'c']
非捕获组
场景:假定匹配foo或者foofoo,正则表达式:/(foo){1, 2}/,这样的话占用了一个组匹配,组匹配中的(括号中)
的内容也会单独输出,这个时候,可以使用非捕获组/(?:foo){1,2}/不会单独输出括号中的内容.
'abc'.match(/(?:.)b(.)/); => ['abc', 'c']


先行断言
x(?=y),x只有在y前面才匹配,y不会被计入返回结果.
例:/\d+(?=%)/ => 后面跟着%号的数字
'abc'.match(/b(?=c)/); => ["b"]
先行否定断言
x(?!y),x只有不再y前面的情况才匹配,y不会被计入返回结果.
例:/\d+(?!%)/ => 后面不是%的数字
/\d+(?!\.)/.exec('3.14'); => ['14']

你可能感兴趣的:(js正则表达式学习笔记)