20170525作业002——对比XPath和BeautifulSoup4

python中解析网页的两个比较好用的工具:XPath和BeautifulSoup4

BeautifulSoup4:是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式。

XPath:是一门在 XML 文档中查找信息的语言,可用来在 XML 文档中对元素和属性进行遍历。

共同点:

1.都用来遍历查找XML中的信息。
2.简单易用。

区别:

1.BeautifulSoup4对html进行了解析得到一个BeautifulSoup对象,以文档的形式导航进行查找、修改;XPath以路径的方式导航查找。

2.BeautifulSoup4提供了过滤器、find_all()以及tag等等方式搜索文档;XPath提供的路径以语法的方式进行搜索。

3.XPath相对于BeautifulSoup4在功能上相对简单点,提供的路径搜索,以语法的形式来搜索,需要记住其部分语法。

4.BeautifulSoup4其语法相对简单粗暴。

5.XPath路径搜索中提供了运算符,便于直接判断。

参考网址:
Xpath教程
Beautiful Soup 4.2.0 文档

你可能感兴趣的:(20170525作业002——对比XPath和BeautifulSoup4)