最近刚学习了Python3 的re模块,对正则表达式有了初步的了解,试着写了个代码发现正则表达式怎么一直不起作用。
结果发现是自己没搞清楚re.match()、re.search()和re.findall()的区别。
re.match() 总是从字符串“开头”去匹配,并返回匹配的字符串的match对象。所以当我用re.match()函数去匹配字符串非开头部分的字符串时,会返回NONE。
str1 = 'Hello World!'
print(re.match(r'e',str1))
结果为:NONE
如果想查找字符串任意部分的模式出现位置请用re.search()或re.findall().
re.search()函数将对整个字符串进行搜索,并返回第一个匹配的字符串的match对象。
str1 = 'Hello World!'
print(re.search(r'e',str1))
输出结果:
<_sre.SRE_Match object; span=(1, 2), match='e'>
re.findall()函数将返回一个所有匹配的字符串的字符串列表。
str1 = 'Hello World!'
re.findall(r'e',str1)
输出结果将是:
['e']
如果你想以迭代方式返回匹配,可以使用 finditer() 方法来代替。
PS:
re.search()和re.match()函数返回match对象包括分组时,group(0)返回【完整匹配】的字符串,group(1)及以上分别返回各分组字符串。groups()函数返回各分组组成的元组对象。