python正则表达式

字符串是编程时涉及到的最多的一种数据结构,对字符串进行操作的需求几乎无处不在。比如判断一个字符串是否是合法的Email地址,虽然可以编程提取@前后的子串,再分别判断是否是单词和域名,但这样做不但麻烦,而且代码难以复用。
正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的。


python正则表达式_第1张图片
>>>import re
>>>re.match('.','abc')
<_sre.SRE_Match object; span=(0, 1), match='a'>
>>>re.match('.','abc').group()
'a'
python正则表达式_第2张图片

python正则表达式_第3张图片

python正则表达式_第4张图片

匹配网址:

import re
addr = input('请输入网址:')
print(re.match('\w{4,20}@163\.com$',addr))

结果如下:



python正则表达式_第5张图片

python正则表达式_第6张图片


search
需求:匹配出文章阅读的次数



findall
需求:统计出python、c、c++相应文章阅读的次数

sub 将匹配到的数据进行替换
需求:将匹配到的阅读次数加1

方案一:



方案二:
import re


def add(temp):
    strNum = temp.group()
    num = int(strNum) + 1
    return str(num)


ret = re.sub(r"\d+", add, "python = 997")
print(ret)

ret = re.sub(r"\d+", add, "python = 99")
print(ret)

结果如下:


python正则表达式_第7张图片

从下面的字符串中取出文本

岗位职责:

完成推荐算法、数据统计、接口、后台等服务器端相关工作


必备要求:

良好的自我驱动力和职业素养,工作积极主动、结果导向

 

技术要求:

1、一年以上 Python 开发经验,掌握面向对象分析和设计,了解设计模式

2、掌握HTTP协议,熟悉MVC、MVVM等概念以及相关WEB开发框架

3、掌握关系数据库开发设计,掌握 SQL,熟练使用 MySQL/PostgreSQL 中的一种

4、掌握NoSQL、MQ,熟练使用对应技术解决方案

5、熟悉 Javascript/CSS/HTML5,JQuery、React、Vue.js

 

加分项:

大数据,数理统计,机器学习,sklearn,高性能,大并发。

python正则表达式_第8张图片

使用划红线的正则表达式可以完成文本的抽取。
有一批网址:
http://www.interoem.com/messageinfo.asp?id=35
http://3995503.com/class/class09/news_show.asp?id=14
http://lib.wzmc.edu.cn/news/onews.asp?id=769
http://www.zy-ls.com/alfx.asp?newsid=377&id=6
http://www.fincm.com/newslist.asp?id=415
需要 正则后为:
http://www.interoem.com/
http://3995503.com/
http://lib.wzmc.edu.cn/
http://www.zy-ls.com/
http://www.fincm.com/

import re

s = '''http://www.interoem.com/messageinfo.asp?id=35
http://3995503.com/class/class09/news_show.asp?id=14
http://lib.wzmc.edu.cn/news/onews.asp?id=769
http://www.zy-ls.com/alfx.asp?newsid=377&id=6
http://www.fincm.com/newslist.asp?id=415'''
ret = re.findall(r'http.+\.[a-z]{2,3}/', s)
for i in ret:
    print(i)
python正则表达式_第9张图片

split
根据匹配进行切割字符串,并返回一个列表
需求:切割字符串“info:xiaoZhang 33 shandong”


你可能感兴趣的:(python正则表达式)