正则表达式(regular expression)是一个描述字符模式的对象。ECMAScript的RegExp类表示正则表达式,而String和RegExp都定义了使用正则表达式进行强大的模式匹配和文本检索与替换的函数。
创建正则表达式和创建字符串类似,创建正则表达式提供了两种方法,一种是采用new运算符,另一个是采用字面量方式。
var r = new RegExp('reg'); //第一个参数字符串 var r = new RegExp('reg', 'ig'); //第二个参数可选模式修饰符 //i 忽略大小写;g 全局匹配;m 多行匹配; var r = /reg/; //直接用两个反斜杠 var r = /reg/ig; //在第二个斜杠后面加上模式修饰
RegExp对象包含两个方法:test()和exec(),功能基本相似,用于测试字符串匹配。test()方法在字符串中查找是否存在指定的正则表达式并返回布尔值,如果存在则返回true,不存在则返回false。exec()方法也用于在字符串中查找指定正则表达式,如果exec()方法执行成功,则返回包含该查找字符串的相关信息数组。如果执行失败,则返回null。
test方法 在字符串中测试模式匹配,返回true或false; exec方法 在字符串中执行匹配搜索,返回结果数组;
//使用new运算符的test方法 var pattern = new RegExp('test', 'i'); //创建正则模式,不区分大小写 var str = 'This is test!'; //创建要比对的字符串 alert(pattern.test(str)); //通过test()方法验证是否匹配 //使用字面量方式的test方法 var pattern = /test/i; //创建正则模式,不区分大小写 var str = 'This is test!'; alert(pattern.test(str)); //使用一条语句实现正则匹配 alert(/test/i.test('This is test!')); //模式和字符串替换掉了两个变量 //使用exec返回匹配数组 var pattern = /test/i; var str = 'This is test!'; alert(pattern.exec(str)); //匹配了返回数组,否则返回null
String对象提供了4个使用正则表达式的方法 |
|
match(pattern) |
返回pattern中的子串或null |
replace(pattern, replacement) |
用replacement替换pattern |
search(pattern) |
返回字符串中pattern开始位置 |
split(pattern) |
返回字符串按指定pattern拆分的数组 |
//使用match方法获取获取匹配数组 var pattern = /desk/ig; //全局搜索 var str = 'This is a Desk!,That is a Desk too'; alert(str.match(pattern)); //匹配到两个Desk ,Desk alert(str.match(pattern).length); //获取数组的长度 //使用search来查找匹配数据 var pattern = /desk/ig; var str = 'This is a Desk !,That is a Desk too'; alert(str.search(pattern)); //查找到返回位置,否则返回-1 //search方法查找到即返回,也就是说无需g全局 //使用replace替换匹配到的数据 var pattern = /desk/ig; var str = 'This is a Desk !,That is a Desk too'; alert(str.replace(pattern, 'Book')); //将Desk 替换成了Book //使用split拆分成字符串数组 var pattern = / /ig; var str = 'This is a Desk !,That is a Desk too'; alert(str.split(pattern)); //以空格拆开分组成数组
RegExp对象的静态属性 |
||
属 性 |
短 名 |
含 义 |
input |
$_ |
当前被匹配的字符串 |
lastMatch |
$& |
最后一个匹配字符串 |
lastParen |
$+ |
最后一对圆括号内的匹配子串 |
leftContext |
$`(反引号) |
最后一次匹配前的子串 |
multiline |
$* |
用于指定是否所有的表达式都用于多行的布尔值 |
rightContext |
$'(单引号) |
在上次匹配之后的子串 |
//Opera不支持input、lastMatch、lastParen和multiline属性。IE不支持multiline属性。 var pattern = /(g)oogle/; var str = 'This is google!'; pattern.test(str); //执行一下 alert(RegExp.input); //Thisis google! alert(RegExp.leftContext); //This is alert(RegExp.rightContext); //! alert(RegExp.lastMatch); //google alert(RegExp.lastParen); //g alert(RegExp.multiline); //false //RegExp.input可以改写成RegExp['$_'],依此类推。RegExp.input可以写成RegExp.$_。
RegExp对象的实例属性 | |
global |
Boolean值,表示 g 是否已设置 |
ignoreCase |
Boolean值,表示 i 是否已设置 |
lastIndex |
整数,代表下次匹配将从哪里字符位置开始 |
multiline |
Boolean值,表示 m 是否已设置 |
Source |
正则表达式的源字符串形式 |
//使用实例属性 var pattern = /google/ig; alert(pattern.global); //true,是否全局了 alert(pattern.ignoreCase); //true,是否忽略大小写 alert(pattern.multiline); //false,是否支持换行 alert(pattern.lastIndex); //0,下次的匹配位置 alert(pattern.source); //google,正则表达式的源字符串 var pattern = /google/g; var str = 'google google google'; pattern.test(str); //google,匹配第一次 alert(pattern.lastIndex); //6,第二次匹配的位
元字符/元符号 |
匹配范围 |
. |
除换行符外的任意字符 |
[a-z0-9] |
括号中的字符集中的任意字符 |
[^a-z0-9] |
任意不在括号中的字符集中的字符 |
\d |
数字 |
\D |
非数字,同[^0-9]相同 |
\w |
字母和数字及_ |
\W |
非字母和数字及_ |
\0 |
null字符 |
\b |
空格字符 |
\f |
进纸字符 |
\n |
换行符 |
\r |
回车字符 |
\t |
制表符 |
\s |
空白字符、空格、制表符和换行符 |
\S |
非空白字符 |
^ |
行首匹配 |
$ |
行尾匹配 |
\A |
仅字符串开始处 |
\b |
单词边界,词在[]内时无效 |
\B |
非单词边界 |
\G |
当前搜索的开始位置 |
\Z |
字符串结束处或行尾 |
\z |
仅字符串结束处 |
x? |
0个或1个x |
x* |
0个或任意多个x |
x+ |
至少一个x |
(xyz)+ |
至少一个(xyz) |
x{m,n} |
最少m个x、最多n个x |
a|b|c |
a或b或c中任意一个 |
(string) |
用于反向引用的分组 |
\1或$1 |
第一个分组中的内容 |
\2或$2 |
第二个分组中的内容 |
\3或$3 |
第三个分组中的内容 |
//使用点元字符 var pattern = /g..gle/; //.匹配一个任意字符 var str = 'google'; alert(pattern.test(str)); //重复匹配 var pattern = /g.*gle/; //.匹配0个一个或多个 var str = 'google'; //*,?,+,{n,m} alert(pattern.test(str)); //使用字符类匹配 var pattern = /g[a-zA-Z_]*gle/; //[a-z]*表示任意个a-z中的字符 var str = 'google'; alert(pattern.test(str)); var pattern = /g[^0-9]*gle/; //[^0-9]*表示任意个非0-9的字符 var str = 'google'; alert(pattern.test(str)); var pattern = /[a-z][A-Z]+/; //[A-Z]+表示A-Z一次或多次 var str = 'gOOGLE'; alert(pattern.test(str)); /*使用元符号匹配*/ var pattern = /g\w*gle/; //\w*匹配任意多个所有字母数字_ var str = 'google'; alert(pattern.test(str)); var pattern = /google\d*/; //\d*匹配任意多个数字 var str = 'google444'; alert(pattern.test(str)); var pattern = /\D{7,}/; //\D{7,}匹配至少7个非数字 var str = 'google8'; alert(pattern.test(str)); /*使用锚元字符匹配*/ var pattern = /^google$/; //^从开头匹配,$从结尾开始匹配 var str = 'google'; alert(pattern.test(str)); var pattern = /goo\sgle/; //\s可以匹配到空格 var str = 'google'; alert(pattern.test(str)); var pattern =/google\b/; //\b可以匹配是否到了边界 var str ='google'; alert(pattern.test(str)); /*使用或模式匹配*/ var pattern = /google|baidu|bing/; //匹配三种其中一种字符串 var str = 'google'; alert(pattern.test(str)); /*使用分组模式匹配*/ var pattern = /(google){4,8}/; //匹配分组里的字符串4-8次 var str = 'googlegoogle'; alert(pattern.test(str)); var pattern = /8(.*)8/; //获取8..8之间的任意字符 var str = 'This is 8google8'; str.match(pattern); alert(RegExp.$1); //得到第一个分组里的字符串内容 var pattern = /8(.*)8/; var str = 'This is 8google8'; var result =str.replace(pattern,'<strong>$1</strong>'); //得到替换的字符串输出 document.write(result); var pattern = /(.*)\s(.*)/; var str = 'google baidu'; var result = str.replace(pattern, '$2 $1'); //将两个分组的值替换输出 document.write(result);
//贪 婪 + , ? , * , {n} , {n,} , {n,m} //惰 性 +? , ?? , *? , {n}? , {n,}? , {n,m}? //关于贪婪和惰性 var pattern = /[a-z]+?/; //?号关闭了贪婪匹配,只替换第一个 var str = 'abcdefjhijklmnopqrstuvwxyz'; var result = str.replace(pattern, 'xxx'); alert(result); var pattern = /8(.+?)8/g; //禁止了贪婪,开启的全局 var str = 'This is 8google8, That is 8google8,There is 8google8'; var result =str.replace(pattern,'<strong>$1</strong>'); document.write(result); var pattern = /8([^8]*)8/g; //另一种禁止贪婪 var str = 'This is 8google8, That is 8google8,There is 8google8'; var result =str.replace(pattern,'<strong>$1</strong>'); document.write(result); //使用exec返回数组 var pattern = /^[a-z]+\s[0-9]{4}$/i; var str = 'google 2012'; alert(pattern.exec(str)); //返回整个字符串 var pattern = /^[a-z]+/i; //只匹配字母 var str = 'google 2012'; alert(pattern.exec(str)); //返回google var pattern = /^([a-z]+)\s([0-9]{4})$/i; //使用分组 var str = 'google 2012'; alert(pattern.exec(str)[0]); //google2012 alert(pattern.exec(str)[1]); //google alert(pattern.exec(str)[2]); //2012 //捕获性分组和非捕获性分组 var pattern = /(\d+)([a-z])/; //捕获性分组 var str = '123abc'; alert(pattern.exec(str)); var pattern = /(\d+)(?:[a-z])/; //非捕获性分组 var str = '123abc'; alert(pattern.exec(str)); //使用分组嵌套 var pattern = /(A?(B?(C?)))/; //从外往内获取 var str = 'ABC'; alert(pattern.exec(str)); //使用前瞻捕获 var pattern = /(goo(?=gle))/; //goo后面必须跟着gle才能捕获 var str = 'google'; alert(pattern.exec(str)); //使用特殊字符匹配 var pattern = /\.\[\/b\]/; //特殊字符,用\符号转义即可 var str = '.[/b]'; alert(pattern.test(str)); //使用换行模式 var pattern = /^\d+/mg; //启用了换行模式 var str = '1.baidu\n2.google\n3.bing'; var result = str.replace(pattern, '#'); alert(result);
//常用的正则 //邮政编码 var pattern = /[1-9][0-9]{5}/; //共6位数字,第一位不能为0 var str = '224000'; alert(pattern.test(str)); //文件压缩包 var pattern = /[\w]+\.zip|rar|gz/; //\w表示所有数字和字母加下划线 var str = '123.zip'; //\.表示匹配.,后面是一个选择 alert(pattern.test(str)); //删除多余空格 var pattern = /\s/g; //g必须全局,才能全部匹配 var str = '111 222 333'; var result = str.replace(pattern,''); //把空格匹配成无空格 alert(result); //删除首尾空格 var pattern = /^\s+/; //强制首 var str = ' goo gle '; var result = str.replace(pattern, ''); pattern = /\s+$/; //强制尾 result = result.replace(pattern, ''); alert('|' + result + '|'); var pattern = /^\s*(.+?)\s*$/; //使用了非贪婪捕获 var str = ' google '; alert('|' + pattern.exec(str)[1] + '|'); var pattern = /^\s*(.+?)\s*$/; var str = ' google '; alert('|' + str.replace(pattern, '$1') + '|'); //使用了分组获取 //简单的电子邮件验证 var pattern = /^([a-zA-Z0-9_\.\-]+)@([a-zA-Z0-9_\.\-]+)\.([a-zA-Z]{2,4})$/; var str = '[email protected]'; alert(pattern.test(str)); var pattern =/^([\w\.\-]+)@([\w\.\-]+)\.([\w]{2,4})$/; var str = '[email protected]'; alert(pattern.test(str));