十九、 正则表达式– 分组和re模块常用函数
import re
# 分组:
# text = "apple price is $99, orange price is $88"
# 加()分组
# result = re.search('.+(\$\d+).+(\$\d+)', text)
# print(result.group(0))
# print(result.group(1))
# print(result.group(2))
# print(result.groups())
# group()/group(0):匹配整个分组
# group(1):匹配第一个分组
# group(2):匹配第二个分组
# groups():匹配所有的分组
# findall:查找所有满足条件的
# text = "apple price is $99, orange price is $88"
# result = re.findall(r'\$\d+', text)
# print(result)
# sub:根据规则替换其他字符串
# text = "nihao zhongguo,hello world"
# 方法1
# new_text = text.replace(" ", "\n")
# 方法2
# new_text = re.sub(r' |,', '\n', text)
# print(new_text)
# 举例
# html = """
#
#
1. 3年以上相关开发经验,全日制统招本科以上学历
#
2.精通一门或多门开发语言(Python,C,Java等),其中至少有一门有3年以上使用经验
#
3.熟练使用ES/mysql/mongodb/redis等数据库;
#
4.熟练使用django、tornado等web框架,具备独立开发Python/Java 后端开发经验;
#
5.熟悉 Linux / Unix 操作系统
#
6.熟悉 TCP/IP,http等网络协议
#
福利:
#
1、入职购买六险一金(一档医疗+公司全额购买商业险)+开门红+全额年终奖(1年13薪,一般会比一个月高)
#
2、入职满一年有2次调薪调级机会
#
3、项目稳定、团队稳定性高,团队氛围非常好(汇合员工占招行总员工比例接近50%);
#
4、有机会转为招商银行内部员工;
#
5、团队每月有自己的活动经费,法定节假日放假安排;
#
6、办公环境优良,加班有加班费(全额工资为计算基数,加班不超过晚上10点,平日加班为时薪1.5倍,周末加班为日薪2倍,周末加班也可优先选择调休,管理人性化)。
#
# """
# new_html = re.sub(r'<.+?>', "", html)
# print(new_html)
# split:根据规则分割字符串,列表输出
# text = "nihao zhongguo,hello world"
# result = re.split(r' |,', text)
# print(result)
# compile:编译正则表达式
text= "apple price is 34.56"
# r= re.compile(r'\d+\.?\d*')
# r= re.compile(r"""
# \d+ #整数部分
# \.? #小数点
# \d* #小数部分
# """, re.VERBOSE) # 注释,用re.VERBOSE
# result= re.search(r, text)
result= re.search(r"""
\d+ #整数部分
\.? #小数点
\d* #小数部分
""",text, re.VERBOSE)
print(result.group())
如果想要爱正则表达式中加注释,那么需要在正则表达式的函数最后加一个re.VERBOSE
上一篇文章 第三章 数据解析(十八) 2019-12-29 地址:
https://www.jianshu.com/p/a3e572078b3f
下一篇文章 第三章 数据解析(二十) 2019-12-31 地址:
https://www.jianshu.com/p/1a00d43b2650
以上资料内容来源网络,仅供学习交流,侵删请私信我,谢谢。