re模块

re模块中的常用函数:

1、search(): 

在整个字符串中查找,返回第一个匹配内容,如果找到返回match对象,没找到返回None

2、match():

从字符串的第一个字符开始匹配,如果找到返回match对象,没找到返回None

3、findall():

在字符串中匹配,如果成功返回match对象,如果失败返回None

4、finditer():

在字符串中匹配,如果成功返回match可迭代对象,如果失败返回None

5、split():

按照匹配的字符串进行分割

6、sub():

替换匹配的子字符串,返回替换之后的字符串

---------------------------------------------------

举例说明:


ret = re.findall('a','eva egon yuan')# 返回所有满足匹配条件的结果,放在列表里print(ret)   #结果 : ['a', 'a']

ret = re.search('a','eva egon yuan').group()                                                          print(ret)#结果 : 'a'# 函数会在字符串内查找模式匹配,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以# 通过调用group()方法得到匹配的字符串,如果字符串没有匹配,则返回None。

ret = re.match('a','abc').group()# 同search,不过尽在字符串开始处进行匹配print(ret)#结果 : 'a'ret = re.split('[ab]','abcd')# 先按'a'分割得到''和'bcd',在对''和'bcd'分别按'b'分割print(ret)# ['', '', 'cd']

ret = re.sub('\d','H','eva3egon4yuan4', 1)#将数字替换成'H',参数1表示只替换1个print(ret)#evaHegon4yuan4

ret = re.subn('\d','H','eva3egon4yuan4')#将数字替换成'H',返回元组(替换的结果,替换了多少次)print(ret)

obj = re.compile('\d{3}')#将正则表达式编译成为一个 正则表达式对象,规则要匹配的是3个数字

ret = obj.search('abc123eeee')#正则表达式对象调用search,参数为待匹配的字符串print(ret.group())#结果 : 123import re

ret = re.finditer('\d','ds3sy4784a')#finditer返回一个存放匹配结果的迭代器print(ret)# print(next(ret).group())#查看第一个结果print(next(ret).group())#查看第二个结果print([i.group()foriinret])#查看剩余的左右结果

'.' 默认匹配除\n之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行

'^' 匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)

'$' 匹配字符结尾, 若指定flags MULTILINE ,re.search('foo.$','foo1\nfoo2\n',re.MULTILINE).group() 会匹配到foo1

'*' 匹配*号前的字符0次或多次, re.search('a*','aaaabac')  结果'aaaa'

'+' 匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']

'?' 匹配前一个字符1次或0次 ,re.search('b?','alex').group() 匹配b 0次

'{m}' 匹配前一个字符m次 ,re.search('b{3}','alexbbbs').group()  匹配到'bbb'

'{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']

'|' 匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'

'(...)' 分组匹配, re.search("(abc){2}a(123|45)", "abcabca456c").group() 结果为'abcabca45'

'\A' 只从字符开头匹配,re.search("\Aabc","alexabc") 是匹配不到的,相当于re.match('abc',"alexabc") 或^

'\Z' 匹配字符结尾,同$ 

'\d' 匹配数字0-9

'\D' 匹配非数字

'\w' 匹配[A-Za-z0-9],还包括下划线‘_’

'\W' 匹配非[A-Za-z0-9]

's' 匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t'

你可能感兴趣的:(re模块)