python中re模块(正则表达式模块)的使用学习

re.match

  • 在字符串的开始位置匹配,如果匹配成功将返回MatchObject(值为True),否则返回None(值为False)。
  • 函数原型
def match(pattern, string, flags=0)
  • 参数说明
    • pattern:正则表达式
    • string:要匹配的字符串
    • flags:控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等

re.search

  • 检测整个字符串,找到第一个匹配项,如果匹配成功将返回MatchObject(值为True),否则返回None(值为False)。
  • 函数原型
def search(pattern, string, flags=0)
  • 参数说明
    • pattern:正则表达式
    • string:要匹配的字符串
    • flags:控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等

re.sub

  • 将字符串中的匹配项替换为其他
  • 函数原型
def sub(pattern, repl, string, count=0, flags=0)
  • 参数说明
    • pattern:正则表达式,匹配被替换的项
    • repl:替换为该项
    • string:要匹配的字符串
    • count:替换的个数,默认为0时表示全部替换

re.split

  • 根据匹配项来分割字符串
  • 函数原型
def split(pattern, string, maxsplit=0, flags=0)
  • 参数说明
    • pattern:正则表达式
    • string:要匹配的字符串
    • maxsplit:最大的分割次数,默认为0时表示全部分割

re.findall

  • 获取字符串中的所有匹配项
  • 函数原型
def findall(pattern, string, flags=0)
  • 参数说明
    • pattern:正则表达式
    • string:要匹配的字符串

re.compile

  • 把正则表达式(以字符串书写的)编译成一个模式对象,提高一定的匹配效率,可用来重复使用
  • 函数原型
def compile(pattern, flags=0)
  • 参数说明
    • pattern:正则表达式

实例展示

#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""
功能:学习re模块
时间:2016年6月1日 18:31:01
"""

import re

text = u"这是一个测试句。这是第二个测试句。这是第三个测试句。"

# re.match
a = re.match(u"这是", text)
print u"match " + a.group(0) if a else u"not match"

# re.search
b = re.search(u"一个", text)
print u"search " + b.group(0) if b else u"not search"

# re.sub
c = re.sub(u"测试", u"【测试】", text)
d = re.sub(u"测试", u"【测试】", text, count=1)  # 替换一个
print c, "\n", d

# re.split
e = re.split(u"。", text)
print "\n".join(e)
f = re.split(u"(。)", text)  # 加括号表示保留
print "\n".join(f)

# re.findall
g = re.findall(u"[\u4e00-\u9fa5]+。", text)  # 匹配中文句子
print "\n".join(g)

你可能感兴趣的:(python中re模块(正则表达式模块)的使用学习)