第三章 数据解析(十九) 2019-12-30

十九、 正则表达式– 分组和re模块常用函数


import re

 

# 分组:


# text = "apple price is $99, orange price is $88"

# 加()分组

# result = re.search('.+(\$\d+).+(\$\d+)', text)

# print(result.group(0))

# print(result.group(1))

# print(result.group(2))

# print(result.groups())

 

# group()/group(0):匹配整个分组

# group(1):匹配第一个分组

# group(2):匹配第二个分组

# groups():匹配所有的分组

 

 

 

# findall:查找所有满足条件的


# text = "apple price is $99, orange price is $88"

# result = re.findall(r'\$\d+', text)

# print(result)

 

# sub:根据规则替换其他字符串


# text = "nihao zhongguo,hello world"

# 方法1

# new_text = text.replace(" ", "\n")

# 方法2

# new_text = re.sub(r' |,', '\n', text)

# print(new_text)

 

# 举例


# html = """

#

#    

1. 3年以上相关开发经验,全日制统招本科以上学历

#    

2.精通一门或多门开发语言(Python,C,Java等),其中至少有一门有3年以上使用经验

#    

3.熟练使用ES/mysql/mongodb/redis等数据库;

#    

4.熟练使用django、tornado等web框架,具备独立开发Python/Java 后端开发经验;

#    

5.熟悉 Linux / Unix 操作系统

#    

6.熟悉 TCP/IP,http等网络协议

#    

福利:

#    

1、入职购买六险一金(一档医疗+公司全额购买商业险)+开门红+全额年终奖(1年13薪,一般会比一个月高)

#    

2、入职满一年有2次调薪调级机会

#    

3、项目稳定、团队稳定性高,团队氛围非常好(汇合员工占招行总员工比例接近50%);

#    

4、有机会转为招商银行内部员工;

#    

5、团队每月有自己的活动经费,法定节假日放假安排;

#    

6、办公环境优良,加班有加班费(全额工资为计算基数,加班不超过晚上10点,平日加班为时薪1.5倍,周末加班为日薪2倍,周末加班也可优先选择调休,管理人性化)。

#

# """

 

 

# new_html = re.sub(r'<.+?>', "", html)

# print(new_html)

 

 

# split:根据规则分割字符串,列表输出


# text = "nihao zhongguo,hello world"

# result = re.split(r' |,', text)

# print(result)

 

 

# compile:编译正则表达式


text= "apple price is 34.56"

# r= re.compile(r'\d+\.?\d*')

# r= re.compile(r"""

# \d+   #整数部分

# \.?   #小数点

# \d*   #小数部分

# """, re.VERBOSE)   # 注释,用re.VERBOSE

# result= re.search(r, text)

result= re.search(r"""

\d+   #整数部分

\.?   #小数点

\d*   #小数部分

""",text, re.VERBOSE)

print(result.group())

 


如果想要爱正则表达式中加注释,那么需要在正则表达式的函数最后加一个re.VERBOSE



上一篇文章 第三章 数据解析(十八)  2019-12-29 地址:

https://www.jianshu.com/p/a3e572078b3f

下一篇文章 第三章 数据解析(二十) 2019-12-31 地址:

https://www.jianshu.com/p/1a00d43b2650



以上资料内容来源网络,仅供学习交流,侵删请私信我,谢谢。

你可能感兴趣的:(第三章 数据解析(十九) 2019-12-30)