[Python][RegExp]RegularExpression正则表达式

Python 正则表达式 | 菜鸟教程

a|b 匹配a或b

re.compile

compile 编译正则表达式生成模式对象(Pattern Object),供 match() 和 search() 等函数使用。

re.compile(pattern[, flags])
参数:

pattern 一个字符串形式的正则表达式
flags 可选,表示匹配模式(比如忽略大小写,多行模式等), 具体参数为

  • re.I 忽略大小写
  • re.M 多行模式
  • re.S 通配符 . 并且匹配换行符(.不匹配换行符)
  • re.U 表示特殊字符集 \w \W \b \B \d \D \s \S依赖于 Unicode 字符属性数据库
  • re.L 表示特殊字符集 \w \W \b \B \s \S依赖于当前环境
  • re.X 忽略空格和 # 后面的注释

match() 从头开始匹配 match(‘规则’,html,re.S)
search() 扫描整个字符串,可不从头匹配 ,但只匹配到第一个符合规则的,search(‘规则’,html,re.S)
findall() 扫描整个字符串,可不从头匹配 ,匹配到所有符合规则的 findall(‘规则’,html,re.S)
sub() 替换/去除某些元素 sub.(‘规则’,要去替换的元素,html)
compile() 将正则表达式编译成正则表达式对象,以便后面匹配中复用 compile(规则)

你可能感兴趣的:(Python)