正则表达式的或(|)(一个烂正则表达式引发的博客)

Email:longsu2010 at yeah dot net

如题,我很荣幸的宣布,这个烂正则表达式的作者是我。

起源于Unix的正则表达式一直是字符串处理的瑞士军刀,今天用这刀写了一段程序,结果与预期的不相符。如下

/^Task0|Task1|Task10$/

这个正则表达式我期待的结果是只匹配Task0、Task1、Task10三者之一,然而它却能匹配Task11、Task12等任何以Task1开头的字符串。

同事说这个正则表达式匹配的应该是TaskTaskTask10这样的字符串,显然是不对的,不要再糊涂了。|(或)的含义是匹配其左侧或者右侧的表达式,不是字符。

而如下的正则表达式却能得到预期的结果

/^(Task0|Task1|Task10)$/

这两个正则表达式什么区别?

咋一看,一样吧?

先说|(或)的定义,如下:

|(或)代表左右表达式任意匹配一个。它总是先尝试匹配左边的表达式,一旦成功则跳过匹配右边的表达式。如果|没有被包括在小括号括号()中,则它的范围是整个正则表达式。

现在看看/^Task0|Task1|Task10$/是如何匹配的,假如测试的字符串是Task11。

1、先用^Task0测试,看Task11是否满足以Task0作为开始,测试结果为不满足。

2、用Task1测试Task11,看Task11中是否包含Task1,测试结果为满足,测试结束,测试的最终结果的匹配。

看看/^(Task0|Task1|Task10)$/是如何匹配的,仍假设测试字符串为Task11。

1、测试Task11是否以Task0、Task1、Task10三者之一开头,测试结果为满足以Task1开头。

2、之后是一个$符号,要求字符串结束。也就是说仅仅匹配Task0、Task1、Task10三者之一,所以测试结果是不匹配。

一不留神写错了,在这里做个简单的记述,算是给大家提个醒,更是给自己提个醒。

你可能感兴趣的:(正则表达式)