正则表达式

正则表达式库

 import re

常用符号

.  : 匹配任意字符(一个‘.’ 代表一个占位符,单独使用不包括换行符‘\n’)
*  : 匹配前一个字符0次或无限次
?  : 匹配前一个字符0次或一次
.* :贪心算法
.*?:非贪心算法
() : 括号里面的值作为返回结果

常用方法

findall():匹配所有符合规律的内容,返回包含结果的列表
search(): 匹配并提取第一个符合规律的内容,返回一个正则表达式对象(object)
sub(): 替换符合规律的内容,返回替换后的值

re.S 的功能

使 '.' 能匹配新的一行 包括\n 换行符

匹配纯数字

re.findall('(\d+)',str)

利用正则实现翻页功能

old_url = http://www.string.com/course/?pageNum=2
new_link = re.sub('pageNum=\d+','pageNum=%d'%i,old_url)

你可能感兴趣的:(正则表达式)