python爬虫笔记(五):实战(一)re库

re库介绍

python爬虫笔记(五):实战(一)re库_第1张图片

正则表达式(由字符和操作符)的语法:

https://juejin.im/post/5a98ad766fb9a028c5229ee8

re库的基本使用:

主要用来字符匹配。

python爬虫笔记(五):实战(一)re库_第2张图片

python爬虫笔记(五):实战(一)re库_第3张图片

import re
match = re.match(r'[1-9]\d{5}', '471003')
if match:
    print(match.group(0))

python爬虫笔记(五):实战(一)re库_第4张图片

re库的match对象


python爬虫笔记(五):实战(一)re库_第5张图片

import re

m = re.search(r'[1-9]\d{5}', 'BIT471003 BIT247711')

#属性操作
print(m.string)
print(m.re)
print(m.pos)
print(m.endpos)

#方法操作
print(m.group(0))
print(m.start())
print(m.end())

re库的贪婪匹配和最小匹配


import re

m = re.search(r'PY.*N', 'PYANBNCNDN')#默认贪婪匹配
print(m.group(0))
#result
#PYANBNCNDN

import re

m = re.search(r'PY.*?N', 'PYANBNCNDN')#设置为最小匹配
print(m.group(0))
#result
#PYAN

你可能感兴趣的:(python爬虫笔记(五):实战(一)re库)