正则表达式

1.正则表达式

正则表达式:用来做字符串查找,匹配,切割相关的一种工具

python对正则表达式的支持:提供re模块(python内置模块),包含字符串匹配,查找,切割等相关的方法

fullmatch(正则表达式, 字符串):用正则表达式来和字符串进行匹配,看是否能匹配成功

正则表达式是一个符合正则规范的字符串

2.正则表达式符号

. \w \d \s \b
表示一个任意字符 表示一个数字或字母,下划线 表示一个数字字符 表示一个空白字符 边界检测(边界包括空格,普通符号等)
| \W \D \S \B
分支 匹配非字母,下划线和数字字符 匹配非数字字符 匹配非空字符串 检测非边界
^ & * + ?
检测字符串开始 检测字符串结束 匹配零次或者多次 匹配一次或者多次 匹配零次或者一次
[] () [^] {N}和{N,} {N,M}
匹配[]中任意字符 将()内的正则条件变成整体 匹配不在[]中的任意字符 匹配N次;匹配至少N次 匹配至少N次,最多M次

3.re模块方法

(1)compile(正则表达式)
作用:将正则表达式转换为正则表达式对象,判断一个字符串是符合某个字符串标准
特点:装换成正则表达式对象后通过对象调用
(2)fullmatch(正则表达式,字符串)
作用:判断一个字符串是否完全符合正则表达式标准
特点:完全匹配,从字符串开头到结结尾连续匹配,返回值是匹配对象,当匹配对象不存在时返回None
(3)match(正则表达式,字符串)
作用:判断某个字符串是否以正则表达式标准开头
特点:不完全匹配,从字符串开头开始匹配,匹配到符合正则表达式标准后停止,并返回相应子串若整个字符串都没有匹配到相应标准的子串,返回None
(4)search(正则表达式,字符串)
作用:在指定字符串中判断是否存在按正则表达式所标准的字符串
特点:返回值是匹配对象,如过有多个符合标准的匹配对象,只返回第一个;如果没有符合标准的匹配对象,则返回None
(5)findall(正则表达式,字符串)
作用:判断字符串中是否存在符合正则表达式标准的字符串,并将所有符合标准的子串返回
特点:返回值是列表,因此可以返回所有符合标准的子串,如果没有符合标准的子串,则返回空[]

注意:在findall方法中通过正则表达式获取子串的时候,可以通过在正则表达式中添加括号来约束获取的内容(此时只获取括号中匹配到的内内查找时仍按原正则表达式取查找)

(6)split(正则表达式,字符串)
作用:按照正则表达式规定的标准对字符串进行切割
特点:可塑性强,返回值是一个列表,列表中的元素是切割后的子串
(7).sub(正则表达式,新字符串,原字符串)
作用:在原字符串中查找符合正则的子串,替换成新的字符串

你可能感兴趣的:(正则表达式)