Python解析Html的几种方法

Python解析Html:

一、通过正则表达式进行解析:

推荐正则表达式的一篇博客,见blog《Python正则表达式指南》。

二、通过BeautifulSoup进行解析:

写代码时很人性化,但是耗时损失较大。

官方文档。

三、通过PyQuery进行解析:

基于lxml,相对于lxml而言写代码时很人性化,类似于BeautifulSoup,同时耗时损失较小,相比于BeautifulSoup有数倍的改进。

官方文档。推荐一篇博客,见blog《Python Html解析器性能评测”》。


此处再附加一篇不错的blog《python网页解析|飞熊在天》

你可能感兴趣的:(Programming,L)