一、python正则表达式包含在 ‘re’模块中
1、导入re模块:import re
2、re.match函数
re.match 从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。
match = re.match('www', 'www.runoob.com')
print match.group(0) #匹配结果
print match.span() #匹配结果的起始和结束位置(0, 3)
3、re.search方法
re.search 扫描整个字符串并返回第一个成功的匹配
re.search('com', 'www.runoob.com') #可以匹配任意位置
print match.group(0) #匹配结果
print match.span() #匹配结果的起始和结束位置(0, 3)
4、检索和替换
Python 的 re 模块提供了re.sub用于替换字符串中的匹配项。
re.sub(pattern, repl, string, count=0, flags=0)
参数:
● pattern : 正则中的模式字符串。
● repl : 替换的字符串,也可为一个函数。
● string : 要被查找替换的原始字符串。
● count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
5、中文替换
name = re.sub(u'\u60e0\u5dde\u5b66\u9662', u'清华大学', name);