催大佬正则表达式讲解

  正则表达式:有些网页用常用的解析库是解析不了的,所以要用正则表达式。非结构化,无规律的网页一般用正则。

 

催大佬正则表达式讲解_第1张图片

 

催大佬正则表达式讲解_第2张图片

催大佬正则表达式讲解_第3张图片

 

催大佬正则表达式讲解_第4张图片

 

催大佬正则表达式讲解_第5张图片

正则表达式出现括号的话,第一个括号就是group(1),第二个就是group(2)。把想匹配的东西用括号括起来,在配置左端点右端点,就可以匹配出来了。

 

催大佬正则表达式讲解_第6张图片

 

催大佬正则表达式讲解_第7张图片

 

催大佬正则表达式讲解_第8张图片

 

催大佬正则表达式讲解_第9张图片

催大佬正则表达式讲解_第10张图片

 

催大佬正则表达式讲解_第11张图片

 

催大佬正则表达式讲解_第12张图片

催大佬正则表达式讲解_第13张图片

催大佬正则表达式讲解_第14张图片

 

催大佬正则表达式讲解_第15张图片

 

催大佬正则表达式讲解_第16张图片

 

催大佬正则表达式讲解_第17张图片

 

催大佬正则表达式讲解_第18张图片

 

催大佬正则表达式讲解_第19张图片

 

pattern = re.compile('(.*?).*?year">(.*?).*?',re.S)
results = re.findall(pattern,content)

 

催大佬正则表达式讲解_第20张图片

 

催大佬正则表达式讲解_第21张图片

 

 

你可能感兴趣的:(python爬虫)