正则表达式入门

正则表达式入门_第1张图片
正则表达式的语法1
正则表达式入门_第2张图片
正则表达式的语法2

在sublime中正则匹配中文汉字:\u即可
在python中匹配中文:[\u4e00-\u9fa5],正确与否,待验证

正则表达式入门_第3张图片
主要功能函数

测试代码如下:

import re

# re.search返回第一个match对象,搜索匹配正则表达式的第一个位置
match1 = re.search(r'[1-9]\d{5}', 'BIT 100081')
if match1:
    print(match1.group(0))

# 从字符串的第一个位置开始匹配正则表达式,返回match对象
match2 = re.match(r'[1-9]\d{5}', '100081 BIT')
if match2:
    print(match2.group(0))

# 搜索字符串,以列表形式返回全部能匹配的子串
ls = re.findall(r'[1-9]\d{5}', '100081 BIT BIT 100084 100085')
if ls:
    print(ls)

# 分割字符串,按照正则表达式的形式,返回列表形式,去掉匹配的部分
sp = re.split(r'[1-9]\d{5}', '100081 BIT 100078 TSU100084 ')
print(sp)


sp2 = re.split(r'[1-9]\d{5}', '100081 BIT 100078 TSU100084 ', maxsplit=1)
print(sp2)

# 迭代类型:匹配内容
for m in re.finditer(r'[1-9]\d{5}', "BIT100081 TsU100084"):
    if m:
        print(m.group(0))

# 替换string字符串,用新的字符串repl来替换匹配字符串pattern匹配成功部分
re.sub(r'[1-9]\d{5}', ':zipcode', 'BIT100081 TUS100083')

正则表达式入门_第4张图片
正则表达式的等价使用

regex = re.compiler(r'[1-9]\d{5}')

正则表达式入门_第5张图片
等价使用方法

match对象


正则表达式入门_第6张图片
Re库的match对象的属性

正则表达式入门_第7张图片
Re库的match对象的方法

当匹配结果是多个字符串时,默认匹配最长的,即贪婪匹配
最小字符串匹配:

正则表达式入门_第8张图片

你可能感兴趣的:(正则表达式入门)