JavaScript 正则表达式(4)


在JavaScript正则表达式(3)中,我们一起学习了正则表达式的基本操作,还引出了一些常见的使用技巧。下面我们将更加深入了解正则表达式的实用技巧


匹配()引起的问题:
首先,需要明确一点,正则表达式在匹配的时候,不是万能的,不是什么字符串都能匹配的。
下面进入正题,如何匹配()。先来一个简单的例子,如何匹配1+2*(3+5)中的()?,想了一下,并不难不是吗,我们可以这样做:

var text = '1+2*(3+5)';
var reg = /^.*\(.*\)/ig;
reg.test(text);//true

顺便来捕获一下()内部的内容:

var text = '1+2*(3+5)';
var reg = /^.*\((.*)\)/ig;
reg.test(text);//true
RegExp.$1;//"3+5"

没问题,通过之前所说的,尽量不要使用.*避免回溯,所以第一个.*需要匹配不是(的部分,第二个.*需要匹配不是)的部分,修改一下正则,得到下面的代码:

var text = '1+2*(3+5)';
var reg = /^[^\(]*\(([^\)]*)\)/ig;
reg.test(text);//true
RegExp.$1;//"3+5"

感觉还不错?下面,我们进一步深入,如果有2个括号呢?比如:

var text = '1+2*(3+5*(2+3))';
var reg = /^[^\(]*\(([^\)]*)\)/ig;
reg.test(text);//true
RegExp.$1;//"3+5*(2+3"

很明显,这不是我们想要的答案,也许我们想要第一个括号内部的所有内容,那不难 ,只需要:

var text = '1+2*(3+5*(2+3))';
var reg = /^[^\(]*\((.*)\)/ig;
reg.test(text);//true
RegExp.$1;//"3+5*(2+3)"

[^\)]*换回.*即可。我们多想一步,如果是想拿到第二个括号里面的2+3,我们应该怎么做?这就有点复杂了,也许需要这样做:

var text = '1+2*(3+5*(2+3))';
var reg = /^[^\(]*\((?:[^\(]*\(([^\)]*)\))\)/ig;
reg.test(text);//true
RegExp.$1;//"2+3"

我的天,太复杂了,这是第二层,如果加入第3层呢?第4层呢?···第n层呢,直接这样写正则表达式,根本解决不了问题不是吗?所以可以得出一个结论:正则表达式无法匹配任意深度的嵌套结构
那么,是不是真的没办法了呢?也不是,还记得以前讲环视的时候使用的while循环吗?这里可以用它来一层一层的解析括号内部的内容。当然,使用环视也是不可取的,因为我们并不知道一共有多少层括号。


JavaScript 正则表达式(1)
JavaScript 正则表达式(2)
JavaScript 正则表达式(3)
JavaScript 正则表达式(4)

你可能感兴趣的:(JavaScript 正则表达式(4))