小爬虫实践项目-正则表达式

^ 

以什么开始

.

任意字符

*

出现次数

非贪婪匹配
贪婪匹配:自右往左开始匹配
非贪婪匹配:自左往右开始匹配

()

代表提取子串

+

匹配前面的子表达式一次或多次

line = 'guimadao'
apr = "(gu.+d)"
输出:guimad
{2}  # 匹配确定的2次
{2,}  # 匹配确定的 2次
{2,5}  # 最少匹配 2次且最多匹配 5次
x|y  # 匹配 x 或 y
[.*]  # 必须存在 .  或 * 字符
[4567]  # 存在4 或 5 或 6 或 7
[0-9]  # 存在0 至 9 的字符
[^1]  # 存在不为1的字符
\w  # 等同于[A-Za-z0-9_]
\W  # 与小写相反,不存在此情况会匹配
[\u4E00-\u9FA5]  # 匹配中文
\d  # 匹配数字

你可能感兴趣的:(小爬虫实践项目-正则表达式)