Python常用模块之re模块

完整版30分钟掌握正则表达式下载

作用:模糊匹配
实质:在字符串中匹配你构造的自定义的字符串

元字符

代码 说明
. 除了换行符外的任意字符
^ 必须以该字符为开头
\w 匹配字母,汉字,下划线,数字
\d 匹配数字
\s 匹配任意的空白符
$ 必须以该字符为结尾
#\b
虽然通常英文的单词是由空格,标点符号或者换行来分隔的,
但是\b并不匹配这些单词分隔字符中的任何一个,它**只匹配一个位置**
比如你要匹配hi后面不远处跟着一个Lucy,你应该用\bhi\b.*\bLucy\b
\b\w{6}\b 匹配刚好6个字符的单词
#^$
匹配必须5位到12位的QQ号
^\d{5,12}$

分组

匹配ip地址
((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)

字符集

# 字符集中,只有^,-,\可以使用,^代表除去
]+>匹配用尖括号括起来的以a开头的字符串

后向引用

用于重复搜索前面某个分组匹配的文本

#这个式子可以捕获可以相同的连续的单词
\b(\w+)\b\s+\b\1\b
最后分组1所代表的内容就是刚开始捕获的单词

上面的内容也可以自定义组名

\b(?\w+)\b\s+\b\k\b

你可能感兴趣的:(Python常用模块之re模块)