python3 ---- PyQuery

# pyquery:仿照jquery语法,封装的一个包,和bs4有点类似。

from pyquery import PyQuery

html = """
  • One
  • Two
  • Three
  • Four
  • 第一段

    第2段

    第3段

    第4段
    法大师傅大师傅

    第5段

    第6段

    """

    # 利用PyQuery类,对Html这个文档进行序列化,结果是一个文档对象
    doc_obj = PyQuery(html)
    # print(doc_obj)

    # 查找元素的方法:
    ul = doc_obj( '.list') # 从doc_obj这个对象中根据类名匹配元素
    # print(ul) # ul是一个对象
    # print(type(ul))

    # 从ul中查找a
    # print(ul('a'))

    # 当前元素对象.find(): 在当前对象中查找后代元素
    # 当前元素对象.chrildren(): 在当前对象中查找直接子元素
    # print(ul.find('a'))


    # 父元素查找
    # parent(): 直接父元素
    # parents(): 所有的父元素

    a = ul( 'a')
    # print(a.parent('#inner'))

    # 兄弟元素的查找
    li = doc_obj( '.one')
    # print(li.siblings())
    print(li.siblings( '.two'))

    # 遍历元素
    ul = doc_obj( '.list')

    # generator object
    # res = ul('li').items()
    # # for li in res:
    # # print(li)
    # # # 获取标签对象的文本内容
    # # print(li.text())
    # # # 获取标签属性
    # # print(li.attr('class'))

    inner_div = doc_obj( '#inner')
    p = inner_div( 'p')
    print(p.text())





    你可能感兴趣的:(python3 ---- PyQuery)