在写监控脚本过程中发现会使用到正则表达式以及re模块来匹配相应内容并校验判断,然后在使用过程中对re模块下的一些方法使用场景不是很熟悉,所以对re模块进行一个简单概要的学习和记录,下次即使忘记了也可以参照这篇快速回忆
参考地址:https://www.cnblogs.com/chengege/p/11190782.html
re.compile(string)
就是返回一个pattern对象,参数是原生字符串对象
pattern=re.compile('##(.+?)##')
print(pattern)
#输出
re.compile('##(.+?)##')
特点:
1,会从string的开头开始,尝试匹配pattern,一直向后匹配,如果遇到无法匹配的字符,立即返回None。如果不是开始位置匹配成功的话,match()就返回None
2,匹配未结束已经到达string的末尾,也会返回None
3,匹配到值时会返回一个对象,比如返回对象:<_sre.SRE_Match object; span=(0, 4), match='shjf'>
,返回的对象不能直接使用,需要使用返回对象.group()
获取到匹配的值
4,匹配到值后就会停止继续匹配,不再匹配其它符合条件的值
注意:
只有re.match()方法是从开始位置匹配,其它的方法都是扫描整个string查找匹配
#例子1:这种情况匹配不到值,返回None(因为是从开头开始匹配)
pattern=re.compile('s(.+?)f')
b="3shjf33"
ss=re.match(pattern,b)
print(ss)
#打印:
None
#例子1:匹配到值后就会停止继续匹配,
pattern=re.compile('s(.+?)f')
b="shjf33"
ss=re.match(pattern,b)
print(ss)
print(ss.group())
#打印:
<_sre.SRE_Match object; span=(0, 4), match='shjf'>
shjf
特点:
1,与match方法极其类似,区别在于search()会扫描整个string查找匹配,不是从开始位置匹配
2,其它与match一致:(1)匹配不到值返回None;(2)只返回第一个匹配到的值;(3)使用group()方法获取匹配到的值
pattern = re.compile(r'world')
match = re.search(pattern,'hello, world! ,world!')
print(match)
print(match.group())
#打印
<_sre.SRE_Match object; span=(0, 5), match='world'>
world
特点:
1,扫描整个string查找匹配,无论是否匹配导致,返回对象一定是list列表类型
2,当没有匹配到值时,会将整个字符串作为值返回
3,匹配到值时,将匹配到的string值作为分割线后返回列表,当最开始或者最末尾匹配时,分割成空字符串
4,没有group()方法
#例子1:
pattern = re.compile(r'world')
match = re.split(pattern,'hello,wod') #没有匹配到值
print(match)
#打印:
['hello,wod']
#例子2:
pattern = re.compile(r'world')
match = re.split(pattern,'world,heworld,llo,world') #匹配到多个值
print(match)
#打印:
['', ',he', ',llo,', ''] #当最开始或者最末尾匹配时,会分割成空字符串
特点:
1,扫描整个string查找匹配,无论是否匹配到值,返回对象一定是list列表类型
2,当没有匹配到值时,返回空列表[]
3,匹配到值时,将匹配到的string值作为分割线后返回列表,当最开始或者最末尾匹配时,分割成空字符串
4,没有group()方法
pattern = re.compile(r'w(.+?)d')
match = re.findall(pattern,'hello,world! hello,w11d! hello,wssd! hello,orld')
print(match)
#打印
['orl', '11', 'ss']
特点:
1,扫描整个string查找匹配,无论是否匹配到值,返回对象一定是迭代器,即使没有匹配导致,在for循环中使用group()方法也不会报错,只是没有值
2,匹配到值时,是存在迭代器中,需要使用for循环获取匹配值
4,有group()方法
#例子1
match = re.finditer(pattern,'hello,lo,orld')
print(match)
for i in match:
print(i.group()) #没有匹配到值,使用group()也不会报错
#打印
<callable_iterator object at 0x03473D90>
#例子2
pattern = re.compile(r'w(.+?)d')
match = re.finditer(pattern,'hello,world! hello,w11d! hello,wssd! hello,orld')
print(match)
for i in match:
print(i.group())
#打印
<callable_iterator object at 0x03DE3D90>
world
w11d
wssd