Python 使用正则表达式匹配URL网址

(?<=href=\").+?(?=\")|(?<=href=\').+?(?=\')
In [1]: import re

In [2]: str = "http://www.baidu.com/"

In [3]: regular = re.compile(r'[a-zA-Z]+://[^\s]*[.com|.cn]')

In [4]: re.findall(regular, str)                             
Out[4]: ['http://www.baidu.com']

很好用感谢作者
https://www.cnblogs.com/pzk7788/p/10498128.html

import re
f = open('test.txt')
F = f.read()
f.close()
r = r'[^\.\x20\r\n\f\t]*\.apk'
s = re.findall(r, F)
print '\n'.join(s)

正则表达式匹配详解网站

你可能感兴趣的:(网络安全测试工具)