正则里的(.*?)是什么意思

.  是任意字符 可以匹配任何单个字符,

例子:正则表达式r.t 可以匹配这些字符串:rat、rut、r t,但是不匹配root。 

.*?  表示匹配任意字符到下一个符合条件的字符

例子:正则表达式a.*?xxx   可以匹配 abxxx  axxxxx  abbbbbxxx

扩展:

* 匹配0或多个正好在它之前的那个字符。例如正则表达式。*意味着能够匹配任意数量的任何字符。? 匹配0或1个正好在它之前的那个字符。注意:这个元字符不是所有的软件都支持的。.*是指任何字符0个或多个,.?是指任何字符0个或1个.

.*具有贪婪的性质,首先匹配到不能匹配为止,根据后面的正则表达式,会进行回溯。.*?则相反,一个匹配以后,就往下进行,所以不会进行回溯,具有最小匹配的性质。

?表示非贪婪模式,即为匹配最近字符 如果不加?就是贪婪模式a.*bc 可以匹配  abcbcbc

来自:https://baike.baidu.com/item/%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F百度百科

你可能感兴趣的:(爬虫)