模式匹配与正则表达式7章节

这是Python编程快速上手的第七章节,对于regex,我想说:他可能是文本处理最好的利器了。即使它用了大量的元字符来匹配,各种转义也让其代码晦涩难懂。但并不影响他的光芒,即使你不编码,也应该学学regex。
本书一开始在不使用regex的情况下使用Python代码解析文本发现代码很冗余。然后使用regex,区区几行便解决问题。代码逻辑如下:
虽然在Python 中使用正则表达式有几个步骤,但每一步都相当简单。
1.用import re 导入正则表达式模块。
2.用re.compile()函数创建一个Regex 对象(记得使用原始字符串)。
3.向Regex 对象的search()方法传入想查找的字符串。它返回一个Match 对象。
4.调用Match 对象的group()方法,返回实际匹配文本的字符串。
这就讲了Python用到的compile,search,group,groups,findall,sub方法。
compile参数:re.IGNORECASE re.DOTALL re.VERBOSE
然后引出regex语法:
,?,+,(),|,{},非贪心匹配?,字符分类\d,\D,\w,\W,\s,\S,[], ^,$,.,.,分组\1,\2,\3
这里引出的问题是:

  1. 转义字符
  2. 元字符
  3. []内外的转义情况

你可能感兴趣的:(模式匹配与正则表达式7章节)