Re库基本用法

正则表达式的表示类型

  1. raw string原生字符串类型:r’\d{5}’
  2. string类型: ‘\\d{5}’(需要将\的转义消除,即双斜杠表示单斜杠)

Re库主要功能函数

函数 说明
re.search() 在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象
re.match() 从一个字符串的开始位置起匹配正则表达式,返回match对象
re.findall() 搜索字符串,以列表类型返回全不能匹配的子串
re.split() 将一个字符串按照正则表达式匹配结果进行分割,返回列表类型
re.finditer() 搜索字符串,返回一个匹配结果的得带类型,每个得带元素是match对象
re.sub() 在一个字符串中替换所有匹配正则表达式的子串,返回替换后的字符串

  1. re.search(pattern,string,flags=0)
    在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象
    • pattern:正则表达式的字符串或原生字符串表示
    • string: 待匹配字符串
    • flags: 正则表达式使用时的控制标记
      • re.I (re.IGNORECASE):忽略正则表达式的大小写,[A-Z]能够匹配小写字符
      • re.M (re.MULTILINE): 正则表达式中的^操作符能够将给定字符串的每行当做匹配开始
      • re.S (re.DOTALL) :正则表达式中的 . 操作符能够匹配所有字符,默认匹配除了换行符意外的所有字符
  2. re.match(pattern,string,flags=0)
    从一个字符串的开始位置起匹配正则表达式,返回match对象
    • pattern:正则表达式的字符串或原生字符串表示
    • string: 待匹配字符串
    • flags: 正则表达式使用时的控制标记
      • re.I (re.IGNORECASE):忽略正则表达式的大小写,[A-Z]能够匹配小写字符
      • re.M (re.MULTILINE): 正则表达式中的^操作符能够将给定字符串的每行当做匹配开始
      • re.S (re.DOTALL) :正则表达式中的 . 操作符能够匹配所有字符,默认匹配除了换行符意外的所有字符
      • -
  3. re.findall(pattern,string,flags=0)
    搜索字符串,以列表类型返回全不能匹配的子串
    • pattern:正则表达式的字符串或原生字符串表示
    • string: 待匹配字符串
    • flags: 正则表达式使用时的控制标记
      • re.I (re.IGNORECASE):忽略正则表达式的大小写,[A-Z]能够匹配小写字符
      • re.M (re.MULTILINE): 正则表达式中的^操作符能够将给定字符串的每行当做匹配开始
      • re.S (re.DOTALL) :正则表达式中的 . 操作符能够匹配所有字符,默认匹配除了换行符意外的所有字符
      • -
  4. re.split(pattern,string,maxsplit=0,flags=0)
    将一个字符串按照正则表达式匹配结果进行分割,返回列表类型
    • pattern:正则表达式的字符串或原生字符串表示
    • string: 待匹配字符串
    • maxsplit: 最大分割数,剩余部分作为最后一个元素输出
    • flags: 正则表达式使用时的控制标记
      • re.I (re.IGNORECASE):忽略正则表达式的大小写,[A-Z]能够匹配小写字符
      • re.M (re.MULTILINE): 正则表达式中的^操作符能够将给定字符串的每行当做匹配开始
      • re.S (re.DOTALL) :正则表达式中的 . 操作符能够匹配所有字符,默认匹配除了换行符意外的所有字符
  5. re.finditer(pattern, string ,flags=0)
    搜索字符串,返回一个匹配结果的得带类型,每个得带元素是match对象

    • pattern:正则表达式的字符串或原生字符串表示
    • string: 待匹配字符串
    • flags: 正则表达式使用时的控制标记
      • re.I (re.IGNORECASE):忽略正则表达式的大小写,[A-Z]能够匹配小写字符
      • re.M (re.MULTILINE): 正则表达式中的^操作符能够将给定字符串的每行当做匹配开始
      • re.S (re.DOTALL) :正则表达式中的 . 操作符能够匹配所有字符,默认匹配除了换行符意外的所有字符
  6. re.sub(pattern, repl, string ,count = 0 ,flags = 0)
    在一个字符串中替换所有匹配正则表达式的子串,返回替换后的字符串

    • pattern:正则表达式的字符串或原生字符串表示
    • repl: 替换匹配字符串的字符串
    • string: 待匹配字符串
    • count: 匹配的最大替换次数
    • flags: 正则表达式使用时的控制标记
      • re.I (re.IGNORECASE):忽略正则表达式的大小写,[A-Z]能够匹配小写字符
      • re.M (re.MULTILINE): 正则表达式中的^操作符能够将给定字符串的每行当做匹配开始
      • re.S (re.DOTALL) :正则表达式中的 . 操作符能够匹配所有字符,默认匹配除了换行符意外的所有字符

上述方法都是一次性执行操作,我们还可以用编译的方式来操作

regex = re.compile(pattern, flags = 0)

  • 将正则表达式的字符串形式编译成正则表达式对象
    • pattern : 正则表达式的字符串或者原生字符串表示
    • flags : 正则表达式使用时的控制标记
    • -

你可能感兴趣的:(python)