python2、re模块、findall函数
使用findall时候,如果使用到了“括号”()分组匹配,则默认只匹配分组中的
如下代码:
import re
pattern = re.compile('([1-4]{4}|[5-8]{4})[a,b]')
s = '1234a5678b'
result = re.findall(pattern, s)
print result
按照常理来说,匹配结果应该是:
['1234a','5678b']
但真实运行的结果是:
['1234','5678']
看一下正则:'([1-4]{4}|[5-8]{4})[a,b]',因为用到了( ) 分组,所以只匹配了分组中的结果。
如果想让正常匹配,解决方法是,在分组括号开始位置,加上问号冒号来启用“不捕捉模式”
import re
pattern = re.compile('(?:[1-4]{4}|[5-8]{4})[a,b]')
s = '1234a5678b'
result = re.findall(pattern, s)
print result
正则为:'(?:[1-4]{4}|[5-8]{4})[a,b]'
这样得到的结果是:
['1234a','5678b']