07、BeautifulSoup库详解

1、什么是BeautifulSoup?

灵活又方便的网页解析库,处理高效、支持多种解析器。利用它不用编写正则表达式即可方便的实现网页信息的提取。

2、安装方式

pip3 install beautifulsoup4

3、用法详解

初识beautifulsoup
基本使用方法
运行结果

3.1、标签选择器

选择特性:只返回匹配的第一个结果

选择元素
获取名称
获取属性
获取内容
嵌套选择

使用contents返回所有子节点的列表

子节点和孙节点

使用children返回子节点的迭代器

子节点

使用descendants获取子孙节点的迭代器

子孙节点
获取父节点

最后会返回整个文档的内容

获取祖先节点
获取兄弟节点

3.2、标准选择器

只使用标签选择器有时候是远远不够的,所以可以使用标准选择器。

标准选择器
第一个参数
嵌套使用
第二个参数
attrs的等价方式

返回text的内容:

第四个参数
find方法
其他类似的方法

3.3、CSS选择器

CSS选择器
嵌套选择
获取属性
获取内容

4、总结

总结

你可能感兴趣的:(07、BeautifulSoup库详解)