当我们在Python中使用正则表达式时,re模块内部会干两件事情:
编译正则表达式,如果正则表达式的字符串本身不合法,会报错;
用编译后的正则表达式去匹配字符串。
那么如果一个正则表达式要重复使用几千次,出于效率的考虑,我们是不是应该先把这个正则先预编译好,接下来重复使用时就不再需要编译这个步骤了,直接匹配,提高我们的效率
预编译十分的简单,re.compile()即可;演示如下:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# @Time : 2019/1/17 15:55
# @Author : Arrow and Bullet
# @FileName: compile.py
# @Software: PyCharm
# @Blog :https://blog.csdn.net/qq_41800366
import re
re_telephone = re.compile(r'^(\d{3})-(\d{3,8})$') # 编译
A = re_telephone.match('010-12345').groups() # 使用
print(A) # 结果 ('010', '12345')
B = re_telephone.match('010-8086').groups() # 使用
print(B) # 结果 ('010', '8086')
编译后生成Regular Expression对象,由于该对象自己包含了正则表达式,所以调用对应的方法时不用给出正则字符串。
希望能够帮助到大家,有什么问题可以 直接评论即可,喜欢有用的话可以点个赞让更多的人看到,如果不够详细的话也可以说,我会及时回复的。