正则表达式

正则表达式的用途

正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串

在Python中需要通过正则表达式对字符串进行匹配的时候,可以使用一个模块,名字为re

import re #导入re模块来使用正则表达式
result=re.match('正则表达式','要匹配的字符串')
result.group()

下面是一个示范

import re
baidu.com')
res=result.group()
print(res)
输出结果为:baidu

表示字符

字符 用法
. 匹配任意一个字符除了\n
[ ] 匹配[ ]中列举的字符
\d 匹配数字,即0-9
\D 匹配非数字
\s 匹配空白
\S 匹配非空白
\w 匹配单词字符,a-z,A-Z,0-9,_
\W 匹配非单词字符

python中字符串前面加上r表示原生字符串,来解决反斜杠带来的困扰

import re
ab='E:\\a\\b'
ret=re.match('E:\\a',ab).group()#报错不能运行
ret=re.match('E:\\\\a',ab).group()
print(ret)#输出结果为E:\a
  • 每一门语言都有相应的正则表达式,在数据量大的情况下就需要用正则表达式来进行匹配,来获取想要获取的内容

你可能感兴趣的:(正则表达式)