Python正则表达式-一些小的知识点(一)

闲话少说,直接开整

括号分组:

上一篇文章内已经写过了一个例子,用()来分组,group()来提取不同分组的内容。group()或者group(0)是等效的,提取的是全部分组的内容。group(1),提取的是第一个规则括号内的分组,group(2),提取的是第二个规则括号内的分组,以此类推。如果需要加深理解,请阅读上一篇。

“管道”匹配

“|”被称为“管道”。希望匹配多个表达式中的一个的时候可以使用。看例子:


20161215Python正则表达式-一些小的知识点(一)1.png

如果管道分割的对象在字符串中出现多次,那么group()只会匹配管道匹配的第一个文本,例如:


20161215Python正则表达式-一些小的知识点(一)2.png

管道还可以匹配一个字符串的前一部分,然后指定多个后一部分或者多部分组成的文本。例如:我希望匹配lilei,limei,lixiaolei,lixiaomei中的一个,这些文本相同之处在于前面都是用li开头的,因此代码可以编写如下:
20161215Python正则表达式-一些小的知识点(一)3.png
问号‘?’实现可选匹配

例如:name = re.compile(‘li(xiao)?lei’),xiao在这个语句中是可选的,因此匹配的选项为lixiaolei 或者 lilei。看例子:


Python正则表达式-一些小的知识点(一)_第1张图片
20161215Python正则表达式-一些小的知识点(一)4.png

()?中的内容表示可选,可以出现,也可以不出现。PS:如果需要用到真正的?,需要使用转义字符?。

用“*”匹配零次或者多次

在正则表达式中,*之前的文本可以在匹配的文本中出现零次或者多次。用同样的例子,看代码:


20161215Python正则表达式-一些小的知识点(一)5.png

如果出现零次,那么代码显示的结果如下:


20161215Python正则表达式-一些小的知识点(一)6.png
用“+”表示匹配一次或多次
Python正则表达式-一些小的知识点(一)_第2张图片
20161215Python正则表达式-一些小的知识点(一)7.png

很显然,重复多次没有问题,但是如果零次,就回报错,实际上,i是空,因此注意区分*和+的区别。

用花括号“{}”匹配特定次数

很容易理解以下的代码


20161215Python正则表达式-一些小的知识点(一)8.png

但是花括号中可以有另外一种表现方式 (lei){3,5},表示匹配出现的第三次、四次和五次的结果。这就涉及到了所谓的贪心和非贪心匹配,哈哈,这个词是照书抄的,我也不知道怎么来的。

贪心和非贪心匹配

上面讲了,匹配特定范围内的次数的时候会有次数的问题。但是如果默认情况下输出会提取的数值是哪些呢?


Python正则表达式-一些小的知识点(一)_第3张图片
20161215Python正则表达式-一些小的知识点(一)9.png

可以看出,“?”在这种语句中是用来声明选择匹配最多还是最少的,在默认情况下,就像标题一样,Python的正则表达式总是“贪心”的,总是匹配最多内容,“?”可以触发匹配最少的内容,称为“非贪心”模式。

注意区别:

“?”以上的知识点中总共出现了两次,一次是表示可选的,出现一次或者零次;另外一次就是以上的声明贪心和非贪心。

欢迎关注公众号:


Python正则表达式-一些小的知识点(一)_第4张图片
qrcode_for_gh_26ef5be84aa6_344.jpg

或者加我微信,WeChat ID:34244636,互相学习交流!

你可能感兴趣的:(Python正则表达式-一些小的知识点(一))