昨天说了几个RegExp的几个实例属性
- global 标示正则表达式是否指定了全局模式g(只读)
- ignoreCase 标示正则表达式是否指定了不区分大小写模式i(只读)
- mutiline 标示正则表达式是否指定了多行模式m(只读)
- lastIndex 如果使用了全局模式,这个变量保存的是在字符串中尝试下次的匹配的偏移值,在test()和exec()中会用到这个值(可写)
- source 返回创建RegExp对象实例时指定的表达式文本字符串。(只读)
虽然有那么多属性,但是基本用不到,为什么呢?因为这些信息都包含在模式声明中了:
字面量创建的正则
var reg = /\[abc\]de/i
console.log(reg.global);//=>false
console.log(reg.ignoreCase);//=>true
console.log(reg.multiline);//=>false
console.log(reg.lastIndex);//=>0
console.log(reg.source);//=>\[abc\]de
通过RegExp构造函数创建的也是一样的结果
var reg2 = new RegExp("\\[bc\\]at","i")
console.log(reg2.global);//=>false
console.log(reg2.ignoreCase);//=>true
console.log(reg2.multiline);//=>false
console.log(reg2.lastIndex);//=>0
console.log(reg2.source);//=>\[abc\]de
replace
说到正则表达式,不得不提replace
stringObject.replace(regexp/substr,replacement)
- 参数1:可以是字符串,也可以是正则表达式
- 参数2:可以是字符串,也可以是函数。如果它是字符串,那么每个匹配都将由字符串替换。但是 replacement 中的 $ 字符具有特定的含义。如下表所示,它说明从模式匹配得到的字符串将用于替换。
返回一个新的字符串,是用 参数2 替换了 参数1 的第一次匹配或所有匹配之后得到的。
- 2、...、$99 与 regexp 中的第 1 到第 99 个子表达式相匹配的文本。
- $& 与 regexp 相匹配的子串。
- $` 位于匹配子串左侧的文本。
- $' 位于匹配子串右侧的文本。
- $$ 直接量符号。
replace例一:匹配一次,区分大小写
var aStr = "Hello 陌上寒!"
var bStr = aStr.replace("陌上寒", "正则表达式")
console.log( bStr)//=>Hello 正则表达式!
replace例二:全局匹配
var cStr =`你好 陌上寒! 我是陌上寒,我们一起来交流讨论前端,每天更新,欢迎关注`
var dStr = cStr.replace(/陌上寒/g, "moshanghan")
console.log(dStr)//=>你好 moshanghan!
//=>我是moshanghan,我们一起来交流讨论前端,每天更新,欢迎关注
replace例三:忽略大小写,匹配一次
var cStr ="我是 Moshanghan! moshanghan是我"
var dStr = cStr.replace(/moshanghan/i, "陌上寒")
console.log(dStr)//=>我是 陌上寒! moshanghan是我
replace例四:忽略大小写,全局匹配
var cStr ="我是 Moshanghan! moshanghan是我"
var dStr = cStr.replace(/moshanghan/ig, "陌上寒")
console.log(dStr)//=>我是 陌上寒! 陌上寒是我
加点难度
replace例五:hello, moshanghan转换为moshanghan hello
以下的输出是相同的
var name = "hello, moshanghan";
var a = name.replace(/(\w+)\s*,\s*(\w+)/, "$2 $1");
console.log(a);//=>moshanghan hello
var b = name.replace(/(\w+)\s*, (\w+)\s*/, "$2 $1");
console.log(b);//=>moshanghan hello
var c = name.replace(/(\w+), (\w+)/, "$2 $1");
console.log(c);//=>moshanghan hello
var d = name.replace(/(\w*), (\w*)/, "$2 $1");
console.log(d);//=>moshanghan hello
replace例六:
var name = `"a", "b"," dd"`;
var aa = name.replace(/"([^"]*)"/, "'$1'");
console.log(aa); //=>'a', "b"," dd"
console.log(/"([^"]*)"/g.test(name));
replace例七:
var name = 'aaa bbb ccc';
var uw = name.replace(/\b\w+\b/g, function (word) {
return word.substring(0, 1).toUpperCase() + word.substring(1);
});
console.log(uw); //Aaa Bbb Ccc
要理解上面的,有几个关于正则的概念需要知道
分组
下面的正则表达式可以匹配kidkidkid:
var b =/kidkidkid/
console.log(b.test('kidkidkid')); //=>true
而另一种更优雅的写法是:
var b =/(kid){3}/
console.log(b.test('kidkidkid')); //=>true
这里由圆括号包裹的一个小整体称为分组。
候选
一个分组中,可以有多个候选表达式,用|分隔:
var reg = /I love (him|her|it)/;
console.log(reg.test('I love him'));//=>true
console.log(reg.test('I love her'));//=>true
console.log(reg.test('I love it'));//=>true
console.log(reg.test('I love them'));//=>false
捕获与引用
被正则表达式匹配(捕获)到的字符串会被暂存起来。其中,由分组捕获的串会从1开始编号,于是我们可以引用这些串
var reg = /(\d{4})-(\d{2})-(\d{2})/
var date = '2010-04-12'
reg.test(date)
console.log(RegExp.$1);//=>2010
console.log(RegExp.$2);//=>04
console.log(RegExp.$3);//=>12
2是第二个,依次类推。
嵌套分组的捕获
如果碰到类似/((我) 就 (是 (陌上寒)))/的嵌套分组,捕获的顺序是什么?来试试:
var reg = /((我) 就 (是 (陌上寒)))/
var str = "我 就 是 陌上寒"
reg.test( str ) // true
console.log(RegExp.$1);//=>我 就 是 陌上寒
console.log(RegExp.$2);//=>我
console.log(RegExp.$3);//=>是 陌上寒
console.log(RegExp.$4);//=>陌上寒
规则是以左括号“(”出现的顺序进行捕获。
昨日回顾
从今天起开启对正则表达式的学习
参考链接
JavaScript正则表达式的分组匹配详解
JavaScript replace() 方法