Beautiful库

Beautiful

优点

不用担心编码方式的问题 ,因为已经内置处理好了,会自动将输入文档转换Unicode编码,输出转换UTF-8编码


#基本用法

#选择元素

  • 通过标签选择
  • 通过CSS选择器选择
    • 获取属性attrs
    • 获取文本get_text()
  • 方法选择器
    • find()返回单个元素
    • find_parents()
    • find_parent()
    • find_next_siblings()
    • find_next_siling()

#提取信息

  • 获取标签信息name字符串
  • 获取文本信息string字符串
  • 获取属性信息attrs字典

#嵌套选择

print(soup.head.title)

#关联选择

  • 子节点与子孙节点contents/children | descendants
  • 父节点与祖先节点parent| parents
  • 兄弟节点
    • next_sibling 下一个兄弟节点
    • next_siblings 所有后面的兄弟节点
    • previous_sibling上一个兄弟节点
    • previous_siblings所有前面的兄弟节点

你可能感兴趣的:(Beautiful库)