re模块的高级用法
search:

search 方法用于查找字符串的任何位置，它也是一次匹配，只要找到了一个匹配的结果就返回，而不是查找所有匹配的结果，它的一般使用形式如下：

当匹配成功时，返回一个 Match 对象，如果没有匹配上，则返回 None。

需求：匹配出文章阅读的次数

coding=utf-8

import re

ret = re.search(r"\d+", "阅读次数为 9999")
ret.group()

运行结果：

'9999'

findall

上面的 match 和 search 方法都是一次匹配，只要找到了一个匹配的结果就返回。然而，在大多数时候，我们需要搜索整个字符串，获得所有匹配的结果。

findall 方法的使用形式如下：

findall 以列表形式返回全部能匹配的子串，如果没有匹配，则返回一个空列表。

需求：统计出python、c、c++相应文章阅读的次数

coding=utf-8

import re

ret = re.findall(r"\d+", "python = 9999, c = 7890, c++ = 12345")
print(ret)

运行结果：

['9999', '7890', '12345']

sub

sub 方法用于替换。它的使用形式如下：

需求：将匹配到的阅读次数加1

方法1：

coding=utf-8

import re

ret = re.sub(r"\d+", '998', "python = 997")
print(ret)

运行结果：

python = 998

方法2：

coding=utf-8

import re

def add(temp):
strNum = temp.group()
num = int(strNum) + 1
return str(num)

ret = re.sub(r"\d+", add, "python = 997")
print(ret)

ret = re.sub(r"\d+", add, "python = 99")
print(ret)

运行结果：

python = 998
python = 100

练习

从下面的字符串中取出文本

岗位职责：

完成推荐算法、数据统计、接口、后台等服务器端相关工作

必备要求：

良好的自我驱动力和职业素养，工作积极主动、结果导向

技术要求：

1、一年以上 Python 开发经验，掌握面向对象分析和设计，了解设计模式

2、掌握HTTP协议，熟悉MVC、MVVM等概念以及相关WEB开发框架

3、掌握关系数据库开发设计，掌握 SQL，熟练使用 MySQL/PostgreSQL 中的一种

4、掌握NoSQL、MQ，熟练使用对应技术解决方案

5、熟悉 Javascript/CSS/HTML5，JQuery、React、Vue.js

加分项：

大数据，数理统计，机器学习，sklearn，高性能，大并发。

参考答案:

re.sub(r"<[^>]*>| |\n", "", test_str)

split

根据匹配进行切割字符串，并返回一个列表

需求：切割字符串“info:xiaoZhang 33 shandong”

coding=utf-8

import re

ret = re.split(r":| ","info:xiaoZhang 33 shandong")
print(ret)

运行结果：

['info', 'xiaoZhang', '33', 'shandong']

finditer

finditer方法的行为跟 findall 的行为类似，也是搜索整个字符串，获得所有匹配的结果。但它返回一个顺序访问每一个匹配结果（Match 对象）的迭代

import re
ret = re.finditer('ha',baseStr)
print(type(ret))
print(ret)

for item in ret:
print(type(item))
print(item.group())

结果： ha ha ha ha ha ha

其他函数用法

coding=utf-8

coding=utf-8

coding=utf-8

coding=utf-8

coding=utf-8

你可能感兴趣的:(其他函数用法)