正则表达式二 :贪婪与非贪婪

元字符

. ^ $ * + ? {} [] \ | ()
关于正则表达式特殊符号的详细介绍可以点击这个链接:正则表达式特殊符号用法

注意

写正则表达式时不要随意加空格或者换行符以及Tab

贪婪与非贪婪

正则表达式默认开启贪婪模式,就是当条件符合的情况下会尽可能多的去匹配。比如说要匹配
这个字符

s="I Love FishC.com"
# "."表示要消耗掉一些字符。"+"表示匹配"."(任意字符)一次或多次
re.search(r'<.+>',s)
>>> <_sre.SRE_Match object; span=(0, 44), match='I Love FishC.com'>

之所以会出现这样的结果就是因为“贪婪”,正则表达式会尽可能多的找匹配字符,一直找到最后。发现没有匹配的字符了,会倒着向前找,刚好最后满足要求,于是匹配了所有结果

表示重复的字符串后加个”?”就开启了非贪婪模式

re.search(r'<.+?>',s)
>>> <_sre.SRE_Match object; span=(0, 6), match=''>

这样匹配到第一个右>后就停止了

你可能感兴趣的:(python学习)