re 模块
提供了正则表达式的支持。大小写的字母和数字
,只能匹配自身. \ [...]、预定义字符集、数量词、边界匹配、逻辑分组等
,具有特殊的含义p = re.compile(pattern, flags=0) # 预编译
: p.findall(string) or re.findall(pattern, string, flags=0) # 按照模式搜索
import re
p = re.compile(r'\d+')
p.findall('one11 two2three333 four4five55')
> ['11', '2', '333', '4', '55']
# 对于 * 和 + 这种默认贪婪的匹配可以加上 ? 使之变为非贪婪匹配
p = re.compile(r'\d+?')
p.findall('one11 two2three333 four4five55')
> ['1', '1', '2', '3', '3', '3', '4', '5', '5']
# 匹配子串,用()表示:要提取的分组
p = re.compile(r'(\w+)@([\w.]+)')
str = 'purple [email protected], blah monkey [email protected] blah dishwasher'
p.findall(str)
> [('alice', 'jisuanke.com'), ('bob', 'abc.com')]
# 匹配字符串
p = re.compile(r'\w+@[\w.]+')
re.findall(str)
> ['[email protected]', '[email protected]']
1、正则表达式官方文档
2、Python 正则表达式指南
3、廖雪峰 re 模块介绍