Python 正则表达式 | 菜鸟教程
a|b
匹配a或b
compile 编译正则表达式生成模式对象(Pattern Object),供 match() 和 search() 等函数使用。
re.compile(pattern[, flags])
参数:
pattern
一个字符串形式的正则表达式
flags
可选,表示匹配模式(比如忽略大小写,多行模式等), 具体参数为
re.I
忽略大小写re.M
多行模式re.S
通配符 .
并且匹配换行符(.
不匹配换行符)re.U
表示特殊字符集 \w
\W
\b
\B
\d
\D
\s
\S
依赖于 Unicode 字符属性数据库re.L
表示特殊字符集 \w
\W
\b
\B
\s
\S
依赖于当前环境re.X
忽略空格和 #
后面的注释match()
从头开始匹配 match(‘规则’,html,re.S)
search()
扫描整个字符串,可不从头匹配 ,但只匹配到第一个符合规则的,search(‘规则’,html,re.S)
findall()
扫描整个字符串,可不从头匹配 ,匹配到所有符合规则的 findall(‘规则’,html,re.S)
sub()
替换/去除某些元素 sub.(‘规则’,要去替换的元素,html)
compile()
将正则表达式编译成正则表达式对象,以便后面匹配中复用 compile(规则)