十四、 正则表达式– 单字符匹配
正则表达式和re模块
1、熟悉掌握正则表达式语法
2、熟练使用re模块中的函数
什么是正则表达式:
通俗理解:按照一定规则,从某个字符串中匹配出想要的数据。这个规则就是正则表达式。
标准答案:http://baike.baidu.com/item/正则表达式/1700215?fr=aladdin
正则表达式语法:
单字符匹配规则
匹配多个字符串
开始结束和或语法
转义字符和原生字符串
re模块中常用的函数:
match
search
group分组
findall
sub
split
compile
正则表达式单字符语法:
importre
# 匹配某个字符串:
# text = "abc"
# ret = re.match('a', text)
# match 只能从第一个字符开始匹配,不符则显示none
# print(ret.group())
# 点(.):匹配任意的字符(除了'\n''):
# text = "+bc"
# ret = re.match('.', text)
# 匹配不了换行符\n
# print(ret.group())
# \d:匹配任意数字:
# text = "1ab"
# ret = re.match('\d', text)
# print(ret.group())
# \D:匹配任意非数字:
# text = "+bc"
# ret = re.match('\D', text)
# print(ret.group())
# \s:匹配的是空白字符(包括:\n, \t, \r,和空格):
# text = " abc"
# ret = re.match('\s', text)
# print("="*30)
# 分隔空格
# print(ret.group())
# print("="*30)
# \S:非空白字符:
# text = "+bc"
# ret = re.match('\S', text)
# print("="*30)
# print(ret.group())
# print("="*30)
# \w:匹配的是a-z 和A-Z 以及数字和下划线:
# text = "_1Abc"
# ret = re.match('\w', text)
# print("="*30)
# print(ret.group())
# print("="*30)
# \W:匹配的是和\w相反的:
# text = "\n+bc"
# ret = re.match('\W', text)
# print("="*30)
# print(ret.group())
# print("="*30)
# [] 组合的方式,只要满足中括号中某一项都算匹配成功:
# text = "bc"
# ret = re.match('[1b]', text)
# print("="*30)
# print(ret.group())
# print("="*30)
# 使用组合的方式实现[0-9]\d:
# text = "1bc"
# ret = re.match('[0-9]', text)
# print("="*30)
#print(ret.group())
#print("="*30)
# 使用组合的方式实现[0-9]\D:
# text = "abc"
# ret = re.match('[^0-9]', text)
# 用^托字号表示取反
# print("="*30)
# print(ret.group())
# print("="*30)
# 使用组合的方式实现\w:
# text = "1bc"
# ret = re.match('[a-zA-Z0-9_]', text)
# print("="*30)
# print(ret.group())
# print("="*30)
# 使用组合的方式实现\W:
# text = "+bc"
# ret = re.match('[^a-zA-Z0-9_]', text)
# print("="*30)
# print(ret.group())
# print("="*30)
上一篇文章 第三章 数据解析(十三) 2019-12-24 地址:
https://www.jianshu.com/p/3303a724cd67
下一篇文章 第三章 数据解析(十五) 2019-12-26 地址:
https://www.jianshu.com/p/95020578def4
以上资料内容来源网络,仅供学习交流,侵删请私信我,谢谢。