Python快速入门正则表达式!半个小时就够了,最详细的教程系列!

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第1张图片

  • 正则表达式

  • BeautifulSoup

  • Lxml

  • PyQuery

  • CSSselector

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第2张图片

好了,开始我们的解析之旅吧!

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第3张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第4张图片

  • 先用正则语法定义一个规则(pattern)

  • 然后用这个规则与你download的网页字符串进行对比,根据pattern提取你想要的数据。

好了,让我们看看Python正则表达式的语法

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第5张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第6张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第7张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第8张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第9张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第10张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第11张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第12张图片

re模块核心函数

上面简单的介绍了正则表达式的pattern是如何设置的,那么下一步我们就可以开始我们的提取工作了。在Python的re模块中有几个核心的函数专门用来进行匹配和查找。

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第13张图片

使用预编译的代码对象比直接使用字符串要快,因为解释器在执行字符串形式的代码前都必须把字符串编译成代码对象。同样的概念也适用于正则表达式。在模式匹配发生之前,正则表达式模式必须编译成正则表达式对象。由于正则表达式在执行过程中将进行多次比较操作,因此强烈建议使用预编译。而且,既然正则表达式的编译是必需的,那么使用预编译来提升执行性能无疑是明智之举。re.compile()能够提供此功能。

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第14张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第15张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第16张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第17张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第18张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第19张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第20张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第21张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第22张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第23张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第24张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第25张图片
对Python感兴趣或者是正在学习的小伙伴,可以加入我们的Python学习扣qun:784758214,看看前辈们是如何学习的!从基础的python脚本到web开发、爬虫、django、数据挖掘等,零基础到项目实战的资料都有整理。送给每一位python的小伙伴!分享一些学习的方法和需要注意的小细节,教你如何实现边学习边用Python赚钱的学习方式。点击加入我们的 python学习者聚集地

这样匹配字符串就提取出来了,再来看看下面这种情况。

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第26张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第27张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第28张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第29张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第30张图片

Python快速入门正则表达式!半个小时就够了,最详细的教程系列!_第31张图片

你可能感兴趣的:(Python快速入门正则表达式!半个小时就够了,最详细的教程系列!)