正则表达式的章节到此就结束了,老猿现在觉得对我们这些身具程序猿基因特色的人来说,正则表达式应该是蛮可口的开胃小菜。
在写标题时,本来想写“正则表达式小结”,后来想了想,百度了一下,牵强附会用了这个标题。不解释了!
在写Python正则表达式re处理模块之前,老猿其实是心存畏难情绪、摇摆了几次,到底自己要学习到什么程度、又要写到什么程度,才开始想写一个单章、后来想合并到一个老猿构想的《基础篇结束章节》中的一个节、再后来又想暂时先不写以后到中级课程内再写、最后决定分概念、模块、元字符三个维度写三个章节,结果在复习和写的过程中老猿被正则表达式深深的吸引了,最后写成了一个大章节。
正则表达式的详细介绍网上的公开教程老猿没有找到,学习过程主要依赖Python官网公开的文档。在学习的初期和中期,老猿发现了很多问题都难以理解,因此那些问题的案例我都记录下来,沉下心来认真学习、理解,最后在写完之后回过头去看那些问题,所有问题都能得到答案,特别是通过其中的部分问题反过来发现写的内容差了正则表达式运算符优先级关键的内容,这种感觉真的很棒。
在学习过程中,老猿初期疑惑的问题是:什么是组?什么是匹配对象?什么是贪婪模式和非贪婪模式?后期则是各种匹配现象的理解问题。
本章相关问题解决中老猿最得意的是如下几个:
Python妙用re.sub分析正则表达式匹配过程
Python正则表达式re.findall一个有趣的现象
Python正则表达式\W+和\W*匹配过程的深入分析
在本章所有例子介绍中,老猿给出的模式和被搜索的字符串都是Unicode 字符串str类型,但实际上正则表达式处理还可以支持字节串 (bytes)。 但是,需要注意:
Unicode 字符串与8位字节串不能混用:也就是说,你不能用一个字节串模式去匹配 Unicode 字符串,反之亦然;类似地,当进行替换操作时,替换字符串的类型也必须与所用的模式和搜索字符串的类型一致。
除了本章介绍的re模块支持正则表达式外,Python的第三方模块 regex提供了与标准库 re 模块兼容的API接口, 同时还提供了额外的功能和更全面的Unicode支持,有兴趣的同学可以关注。
最后,想文艺一把的老猿想说,对于程序开发人员来说,正则表达式的学习还是很让人有成就感的!
老猿Python,跟老猿学Python!
博客地址:https://blog.csdn.net/LaoYuanPython
请大家多多支持,点赞、评论和加关注!谢谢!