Re库(正则表达式)简介

Re(正则表达式简介)

正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。

正则表达式常用操作符

Re库(正则表达式)简介_第1张图片图片来源于网络
Re库(正则表达式)简介_第2张图片图片来源于网络

Re库常用函数

Re库(正则表达式)简介_第3张图片图片来源于网络

常用操作

1、获取查找内容的部分

1)通过定义模式对象匹配字符串

import re
# 获取查找内容的部分
# 通过定义模式对象匹配字符串
pat = re.compile("AA")          # 给出正则表达式,用于验证其他的字符串
m1 = pat.search("CAB")          # search字符串是被检验的内容
m2 = pat.search("ABCAAVVAAA")   # search字符串是被检验的内容
print(m1)       # 无匹配信息,则返回None
print(m2)       # 有匹配信息,默认返回第一个内容,并返回字符串位置[3,5)左闭右开


# 输出结果
None
<re.Match object; span=(3, 5), match='AA'>

2)# 没有模式对象的情况

import re
# 没有模式对象的情况
m = re.search("asd", "Aasd")   # 第一个参数是规则 (模式),第二个参数是被检验的对象
print(m)


# 输出结果
<re.Match object; span=(1, 4), match='asd'>

2、获取所有的查找内容

import re
# 获取所有的查找内容
# 找到字符串中所有的a
print(re.findall("a", "ASDaDFGAa"))    # 第一个参数是规则 (模式),第二个参数是被检验的对象
# 找到字符串中所有的大写字母,依次输出
print(re.findall("[A-Z]", "ASDaDFGAa"))
# 找到字符串中所有的大写字母,组合输出
print(re.findall("[A-Z]+", "ASDaEqDFGAa"))


# 输出结果
['a', 'a']
['A', 'S', 'D', 'D', 'F', 'G', 'A']
['ASD', 'E', 'DFGA']

3、替换操作

import re
# 替换
print(re.sub("a", "A", "ASDaEqDFGAa"))    # 在第三个参数中找到小a用A替换


# 输出结果
ASDAEqDFGAA
# 注:在使用正则表达式时,建议在比较的字符串之前加r,防止转义字符的问题
如:print(r"D\User\Administrator")


# 输出结果
D\User\Administrator

你可能感兴趣的:(python爬虫笔记,字符串,正则表达式,python,爬虫,html)