Python爬虫之基于bs4库的HTML内容查找方法

find_all的使用方法:
<>.find_all(name, attrs, recursive, string, **kwargs)

  • name : 对标签名称的检索字符串, 返回一个列表类型,存储查找的结果
  • attrs: 对标签属性值的检索字符串,可标注属性检索
  • recursive: 是否对子孙全部检索,默认True
  • string: <>…
(..) 等价于 .find_all(..)
soup(..) 等价于 soup.find_all(..)

扩展方法

方法 说明
<>.find() 搜索且只返回一个结果,同.find_all()参数
<>.find_parents() 在先辈节点中搜索,返回列表类型,同.find_all()参数
<>.find_parent() 在先辈节点中返回一个结果,同.find()参数
<>.find_next_siblings() 在后续平行节点中搜索,返回列表类型,同.find_all()参数
<>.find_next_sibling() 在后续平行节点中返回一个结果,同.find()参数
<>.find_previous_siblings() 在前序平行节点中搜索,返回列表类型,同.find_all()参数
<>.find_previous_sibling() 在前序平行节点中返回一个结果,同.find()参数

Python爬虫之基于bs4库的HTML内容查找方法_第1张图片

你可能感兴趣的:(python)