issue: http://bugs.python.org/file16563/regex_test-20100316
html = """<li><a href='javascript:location.href="page4.html"'>page 4</a></li>"""
reg = 'href=([\"|\']{0,1})(.*?)([\"|\'|>])'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
print imglist
结果:
[(“’”, ‘javascript:location.href=’, ‘”’)]
期望结果
有两个href的匹配结果
page4.html
这是python的一个bug