正则表达式之最短匹配模式

当我们用正则表达式去匹配一个标签的首尾的时候,比如匹配

hello world

中的 h1 的开始和闭合标签

可能很多人会这样写

/<.*h1>/g

但是这样真的可以吗?

因为 * 匹配符是匹配前面一个字符的零到多个,而且它是贪婪匹配的
所以你得到的就会是下面的结果了。

正则表达式之最短匹配模式_第1张图片
image.png

显然这并不是我们想要的,那么怎么把贪婪匹配换成最小匹配呢,

/<.*?h1>/g

上面的写法就可以了,如下图:

正则表达式之最短匹配模式_第2张图片
image.png

其实原理应该很简单,因为 ? 也是贪婪匹配,并且只能匹配0到1个,
所以它会匹配到第一个的时候就结束了,从而阻止了 * 的匹配多个的贪婪。

你可能感兴趣的:(正则表达式之最短匹配模式)