PyQuery库简介

html = '''



  • li0

  • li1



    • '''
      from puquery import PyQuery as pq
      doc = pq(html)
      #用字符串初始化pyquery
      doc = pq(url="https://www.baidu.com")
      #用URL初始化pyquery
      doc = pq(filename='demo.html')
      #用本地文件初始化pyquery

      items = doc('.list')
      #获取class为list的节点

      lis = items.find('li')
      #获取其内部的li节点

      lis = items.children()
      #获取其子节点

      lis = items.children('.active')
      #获取其class为active的子节点

      parent = items.parent()
      #获取其父节点

      parents = items.parents()
      #获取其祖先节点

      parent = items.parents('.wrap')
      #获取class为wrap的祖先节点

      li = doc('.list .item-0.active').siblings('.active')
      #选择class为list的节点内部class为item-0和active的节点的class为active兄弟节点

      lis = doc('li').items()
      for li in lis:
      print(li.attr('class'))
      print(li.text())
      print(li.html())
      #获取属性
      #获取文本
      #获取其内部的html文本
      #用items()方法遍历

      li = doc('.item-0 active')
      li.removeClass('active')
      li.addClass('active')
      #动态改变节点的class属性

      li.attr('name','link')
      #修改属性
      li.text('niconiconi')
      #修改文本
      li.html('niconiconi')
      #修改html文本

      doc.find('li').remove()
      #删除li节点

      li = doc('li:first-child')
      li = doc('li:last-child')
      li = doc('li:nth-child(2)')
      li = doc('li:gt(2)')
      li = doc('li:nth-child(2n)')
      li = doc('li:contains(second)')
      #伪类选择器

你可能感兴趣的:(Python)