一前言
本篇文章带大家快速入门正则表达式的使用,正则表达式的规则不仅适用python语言,基本大多数编程语言都适用,在日常使用中极为广泛,读者们有必要学好正则表达式。看完这篇文章,读者们要理解什么是正则表达式,正则表达式的规则,常见的正则表达式示例,如何在python中使用函数进行正则表达式操作;
二 正则表达式的概念
正则表达式是指在一串字符串中使用特殊的模式匹配获得子串,我们可以对获得的子串进行提取,替换等操作;
举个例子zszxz666 这个字符串,现在知识追寻者想要获得子串zszxz, 则需要经过一个模式匹配后获得子串,在正则表达式中这个模式可以很多种格式,知识追寻者在这边使用最简单的模式 [a-z]*,然后经过python正则表达式匹配函数就可以获得子串zszxz;这种方式比平时的字符串函数操作更加简便,适用范围广泛;
三 常用的正则匹配模式
常用的正则表达式模式如下,如果对这些模式有疑惑的可以参照 正则表达式手册 ;手册中还有日常使用的正则示例,比如用户名,密码,邮箱,URL 的匹配模式等;
四 python正则常用修斯符
五 python常用正则行数说明
- pattern 表示正则表达式模式
- string 表示传入待匹配字符串
- flags 标志位,可以用第四节的修饰符限定
- count 表示限定匹配的次数
- repl 表示替换的字符串,也可为一个函数
- pos 起始位置
- endpos 结束位置
- maxsplit 最大分割次数
六 常用函数示例
6.1 match函数
group(num=0) 函数表示提取匹配的表达式,可以使用组号提取对应的匹配结果;知识追寻者想要获得字符串中第一个出现的数字串
import re # 指定模式 至少匹配一个数字 pattern = re.compile(r'\d+') # 输入的字符串 mat = pattern.match("451zszxz666") # 获得第一个匹配到的值 g = mat.group(); # 451 print(g)
6.2search函数
知识追寻者想要获得指定的字符串,第一个匹配的就好;
import re # 想匹配nhzszxz 或者 nh666 或者 nhnh pattern = re.compile(r'nh(zszxz|666|nh)') ser = pattern.search('nhzszxzkkk nh666 llll nhnh') g_0 = ser.group() # zszxz print(g_0) g_1 = ser.group(1) # nhzszxz print(g_1)
6.3 findall函数
知识追寻者想要在字符串中获得所有的数字;
import re pattern = re.compile(r'\d+') # 输入的字符串 mat = pattern.fidall("451zszxz666") # ['451', '666'] print(mat) # 666 print(mat[1])
6.4 sub函数
知识追寻者想要获得所有非数字的子串;
import re str = '8556gfggs5555dfg' # 替换所有数字 result = re.sub(r'\d', '', str) # gfggsdfg print(result)
6.5 split函数
知识追寻者想要获得以,
分割的字符串;
import re str = '123,456,zszxz,666' result = re.split(',',str) # ['123', '456', 'zszxz', '666'] print(result)
6.6 finditer 函数
知识追寻者想要获得数字451,和666;
import re pattern = re.compile(r'\d+') # 输入的字符串 mat = pattern.finditer("451zszxz666") for it in mat: print(it.group())
讨论学习群:887934385 当中分享资料资源,学习途中能有所帮助