正则表达式:使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换、某个模式的文本,常用于含有大量字符串处理的工作,比如监测输入的账号、密码等。
在Python中有特定的re模块来进行字符串匹配。
import re
#使用match方法进行匹配
result = re.match(正则表达式,要匹配的字符串)
#如果上一步匹配到数据的话,可以使用group方法来提提取数据,没有就返回None
result.group()
字符规则
字符串前面加上r表示原生字符串,原生字符串很好的解决了漏写反斜杠的问题
正则表达式里使用“\”作为转义字符,假如需要匹配的文本中的“\”,在正则表达式中需要4个反斜杠:前面两个和后面两个分别在编程语言中转义成反斜杠,专车两个反斜杠后再在正则表达式中转义成一个反斜杠。
表示数量
表示边界
^在中括号里代表非的意思
匹配分组
re模块的其他方法 :
search 搜索符合特征的字符串。
findall 找出所有符合特征的字符串,返回一个列表。
sub 将匹配到的数据进行替换。
spilt 根据匹配进行切割,并返回一个列表。
Python默认正则表达式数量词是贪婪的,总是尽可能匹配尽可能多的字符,在“*”,“?”,“+”后加上“?”,是贪婪变成非贪婪。