4.bs4 节点遍历

  1. bs4之标签树的下行遍历
  • soup.tag.contents:返回tag标签的儿子节点,为list列表形式,其中包括换行符
  • soup.tag.children:遍历儿子节点,为迭代类型,通过for循环进行访问
  • soup.tag.descendants:遍历所有子孙节点,为迭代类型,通过for循环进行访问
  1. bs4之标签树的上行遍历
  • soup.title.parent:返回title标签的父节点
  • soup.title.parents:返回title标签的父辈节点,同一分支上的父辈节点
  1. bs4之标签树的平行遍历
  • soup.a.next_sibling:a标签的下一个平行节点
  • soup.a.previous_sibling:a标签的上一个平行节点,不一定是标签
  • soup.a.next_siblings: a标签后面的平行节点,为迭代类型,使用for循环遍历访问
  • soup.a.previous_siblings:a标签前面的平行节点,为迭代类型,使用for循环遍历访问

你可能感兴趣的:(网络爬虫,python,开发语言)