为什么要用正则表达式
简单的说:我们与字符串接触的频率非常之高,正则表达式可以极大的提高复杂文本分析的效率,快速匹配出复杂的字符串。
创建一个正则表达式
-
直接量语法(字面量)
var expression = /pattern/flags ; //pattern 是要匹配的字符串模式 //flags用来标记正则表达式的行为: i 不区分大小写;g 表示全局搜索 ;m 表示多行模式 var reg = /ab/i ,表示匹配 字符串 'ab' 不区分大小写
-
调用
RegExp
对象的构造函数//RegExp 是js中一个内置的对象,是正则表达式的缩写 var expression = new RegExp(pattern,flags) //flags 和直接量语法一致 //pattern 可以是字符串模式,也可以是一个标准的正则表达式,后者必须省略 flags //可以写成var reg = new RegExp('ab','i') 或者var reg = new RegExp(/ab/i) //不能写成 var reg = new RegExp(/ab/,'i')
在ES5
中规定:使用直接量必须像直接调用RegExp
构造函数一样,每次都创建一个新的RegExp实例
,所以
上面2
种方式创建正则表达式,除了过程不一样,效果是一样的。
RegExp
每个实例都有如下属性:
global
:布尔值,表示实例是否设置了g
标志ignoreCase
:布尔值,表示是否设置了i
标志multiLine
:布尔值,表示是否设置了m
标志source
:返回创建RegExp
对象实例时指定的表达式纯文本字符串。不包含后面的标志lastIndex
:整数,表示实例在接下来的一次搜索匹配项的开始位置
,默认从0
开始
使用正则表达式的实例方法
RegExp.prototype.exec()
exec()
方法为指定的一段字符串执行搜索匹配操作,返回包含第一个匹配项
的数组,regexObj.exec(str)
,没有匹配到则返回 null,返回的数组是Array的实例,而且
返回值还包含另外2个属性:
index: 匹配到的字符位于原始字符串的基于0的索引值 和
input: 原始字符串`
var myRe = /ab*/g;
var str = 'abbcdefabh';
var oo = myRe.exec(str)
// oo ==> ["abb"]
// oo.index ==> 0
// myRe.lastIndex ==> 0
// 从返回结果可以看出来,即使我们设置了全局的g,exec也不会一次性返回所有的匹配结果
// 因为其定义就是 返回包含`第一个匹配项`的数组,只要第一次匹配到,后面就不继续执行
// 我们再执行一次
oo = myRe.exec(str)
// oo ==> ["ab"]
// oo.index ==> 3
// myRe.lastIndex ==> 3
// 再次执行之后可以看到 匹配项和一些属性值都发生了变化,说明 这次并不是从头开始
官方说明:当正则表达式使用 "g
" 标志时,可以多次执行 exec
方法来查找同一个字符串中的成功匹配。当你这样做时,查找将从正则表达式的 lastIndex
属性指定的位置开始(也就是说下次的查询将在上次匹配成功后面开始匹配,而且会循环,在匹配不到的时候,会从头开始
)。(test()
也会更新 lastIndex
属性)。
不加"g
" 标志的时候,每次都是从 0 开始,所以各种属性也不会改变
exec()
方法还有一个重要的作用:匹配捕获组
var str= "cat2,hat8" ;
var reg=/c(at)/ ;
console.info(reg.exec(str));//运行返回 ["cat2", "at"]
加了捕获组的时候,结果会把捕获组一起返回,不加则没有,支持多个捕获组
注意
IE
的 javascript
在 lastIndex
设计上存在偏差,没加g
的情况下也会每次发生改变,慎用
RegExp.prototype.test()
接收一个字符串参数,regexObj.exec(str)
,匹配返回true
,否则false
RegExp.prototype.toString() ( RegExp.prototype.toLocaleString())
RegExp
对象覆盖了 Object
对象的 toString()
方法,并没有继承 Object.prototype.toString()
。对于 RegExp
对象,toString
方法返回一个该正则表达式的字面量
。
myExp = new RegExp("a+b+c");
alert(myExp.toString()); // 显示 "/a+b+c/"
foo = new RegExp("bar", "g");
alert(foo.toString()); // 显示 "/bar/g"
正则表达式在 String
的应用
match
一个在字符串中执行查找匹配的String
方法,它返回一个数组或者在未匹配到时返回null
。
var oo = '121212'.match(/1/g)
oo
//["1", "1", "1"]
var oo = '121212'.match(/1/)
oo
//["1"]
replace
一个在字符串中执行查找匹配的String
方法,并且使用替换字符串替换掉匹配到的子字符串。
'121212'.replace(/1/g,',')
//",2,2,2"
split
一个使用正则表达式或者一个固定字符串分隔一个字符串,并将分隔后的子字符串存储到数组中的String
方法。
//以数字分割字符串
'a1b2c33d4'.split(/\d*/)
//["a", "b", "c", "d", ""]
search
一个在字符串中测试匹配的String
方法,它返回匹配到的位置索引
,或者在失败时返回-1。
//查找连续2个数字的位置
'a1b2c33d4'.search(/(\d){2}/)
// 5
小练习
把一串数字字符串千分位方式(逗号)转化成金额符号
分析要点:
金额的千分位是从右往左,每
3
位加一个逗号,但是正则表达式里面从右往左不是很方便,所以第一步要把数字颠倒过来,字符串并没有直接的颠倒方法,数组有,Array.prototype.reverse.call([1,2,3,4])
==>[4, 3, 2, 1],字符串转数组也是很方便的,String.prototype.split.call('1234','')
==>["1", "2", "3", "4"]
再把颠倒的数组拼接成字符串
Array.prototype.join.call([4,3,2,1],'')
==>4321
小数点后面的不需要处理,所以我们要获取
String.prototype.split.call('12345.678','.')[1]
==>12345
因为我们这里已经反转了,所以真正要转化的数字在第二个-
前面都是准备工作,现在需要用正则表达式处理字符串,匹配连续的3位数字分割成数组 \d{3} 表示连续3个数字 String.prototype.match.call('1234',/\d{3}/) ==>
["123"]
,这里把后面的一位数字和2位数字直接忽略了,并且没有全局匹配,所以我们要补充一下。String.prototype.match.call('1234567891',/\d{3}|\d{2}|\d{1}/g) //["123", "456", "789", "1"]
最后就把数组用逗号连接,在用小数点和之前的小数位加在一起,再像第一步那样反转一下顺序就可以了。
例子代码
function money_thousandth (str){
//先检查是不是符合数字类型
if(isNaN(str)){
return '必须传入数字或者数字字符串'
}
str = str.toString();
//反转顺序并分割小数点
var arr = str.split('').reverse().join('').split('.');
//全局优先匹配连续的3位数字,或者2位,或者1位
var reg = /\d{3}|\d{2}|\d{1}/g;
//有小数点取第二位,没有则取第一位
var thousand = arr[1] || arr[0] ;
//分割数组
var result_arr = thousand.match(reg);
//逗号拼接分割好的金额
var result_str = result_arr.join(",");
//与小数点前面加起来
var result = arr[1] ? arr[0] + '.'+ result_str : result_str
//返回颠倒的数字字符串
return result.split('').reverse().join('')
}
money_thousandth(1234567898.12)
//"1,234,567,898.12"
money_thousandth('1234567898.12')
//"1,234,567,898.12"
点击查看正则表达式常用语法