Python Re模块 常用函数

Python Re模块 常用函数
#返回pattern对象
re.compile(string[,flag])  
#以下为匹配所用函数
re.match(pattern,string[,flags])
re.search(pattern,string[,flags])
re.split(pattern,string[,maxsplit])
re.findall(pattern,string[,flags])
re.finditer(pattern,string[,flags])
re.sub(pattern,repl,string[,count])
re.subn(pattern,repl,string[,count])
另外大家可能注意到了另一个参数 flags,在这里解释一下这个参数的含义:


参数flag是匹配模式,取值可以使用按位或运算符’|’表示同时生效,比如re.I | re.M。


可选值有:


•re.I(全拼:IGNORECASE):忽略大小写(括号内是完整写法,下同)
•re.M(全拼:MULTILINE):多行模式,改变'^'和'$'的行为(参见上图)
•re.S(全拼:DOTALL):点任意匹配模式,改变'.'的行为
•re.L(全拼:LOCALE):使预定字符类\w\W\b\B\s\S取决于当前区域设定
•re.U(全拼:UNICODE):使预定字符类\w\W\b\B\s\S\d\D取决于unicode定义的字符属性

•re.X(全拼:VERBOSE):详细模式。这个模式下正则表达式可以是多行,忽略空白字符,并可以加入注释。


(2)re.search(pattern, string[, flags])
search方法与match方法极其类似,区别在于match()函数只检测re是不是在string的开始位置匹配,search()会扫描整个string查找匹配,match()只有在0位置匹配成功的话才有返回,如果不是开始位置匹配成功的话,match()就返回None。同样,search方法的返回对象同样match()返回对象的方法和属性。我们用一个例子感受一下
(3)re.split(pattern, string[, maxsplit])
按照能够匹配的子串将string分割后返回列表。maxsplit用于指定最大分割次数,不指定将全部分割。我们通过下面的例子感受一下。
(4)re.findall(pattern, string[, flags])
搜索string,以列表形式返回全部能匹配的子串。我们通过这个例子来感受一下
(5)re.finditer(pattern, string[, flags])
搜索string,返回一个顺序访问每一个匹配结果(Match对象)的迭代器。我们通过下面的例子来感受一下
(6)re.sub(pattern, repl, string[, count])
使用repl替换string中每一个匹配的子串后返回替换后的字符串。
当repl是一个字符串时,可以使用\id或\g、\g引用分组,但不能使用编号0。
当repl是一个方法时,这个方法应当只接受一个参数(Match对象),并返回一个字符串用于替换(返回的字符串中不能再引用分组)。
count用于指定最多替换次数,不指定时全部替换。
(7)re.subn(pattern, repl, string[, count])
返回 (sub(repl, string[, count]), 替换次数)。

你可能感兴趣的:(python,语法知识点收集,爬虫知识点收集)