【python学习】基础篇-常用模块-re模块:正则表达式高效操作字符串

在Python中,正则表达式主要通过re模块来实现。以下是一些常用的正则表达式用法:

匹配值:

pattern = r'\d+'  # 匹配一个或多个数字
pattern = r'\b\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}\b' #匹配日期格式
pattern = r'hello'  # 匹配字符串“hello”

  • \d 表示匹配一个数字字符,等价于 [0-9];
  • +表示匹配前面的子表达式一次或多次
  • \d{4}表示匹配四位数字
  • \b 表示单词边界,确保匹配的时间字符串前后没有其他数字或字符,在字符串首尾各一个

1、导入re模块:

import re

2、使用re.search()函数查找字符串中是否包含指定的模式:

import re
pattern = r'\d+'  # 匹配一个或多个数字
string = 'abc123def456'
result = re.search(pattern, string)
if result:
    print('找到匹配项:', result.group())
else:
    print('未找到匹配项')

3、使用re.findall()函数查找字符串中所有符合指定模式的子串

import re
pattern = r'\d+'  # 匹配一个或多个数字
string = 'abc123def456'
result = re.findall(pattern, string)
print('找到的所有匹配项:', result)

4、使用re.sub()函数替换字符串中符合指定模式的子串:

import re
pattern = r'\d+'  # 匹配一个或多个数字
replacement = 'NUM'
string = 'abc123def456'
result = re.sub(pattern, replacement, string)
print('替换后的字符串:', result)

5、使用re.split()函数根据指定模式分割字符串

import re
pattern = r'\d+'  # 匹配一个或多个数字
string = 'abc123def456'
result = re.split(pattern, string)
print('分割后的字符串列表:', result)

6、使用re.compile()函数将正则表达式编译为一个模式对象,以便重复使用:

import re
pattern = re.compile(r'\d+')  # 匹配一个或多个数字

7、使用re.escape()函数对特殊字符进行转义,以便在正则表达式中使用:

import re
string = 'a.b*c?d+e|f{g}h[i]j^k$l'
escaped_string = re.escape(string)
print('转义后的字符串:', escaped_string)

你可能感兴趣的:(【Python学习-基础篇】,python,学习,正则表达式)