python lxml库

XPath常用规则
nodename 选取此节点的所有子节点
/ 从当前节点选取直接子节点
// 从当前节点选取子孙节点
. 选取当前节点
… 选取当前节点的父节点
@ 选取属性

  • 通配符,选择所有元素节点与元素名
    @* 选取所有属性
    [@attrib] 选取具有给定属性的所有元素
    [@attrib=‘value’] 选取给定属性具有给定值的所有元素
    [tag] 选取所有具有指定元素的直接子节点
    [tag=‘text’] 选取所有具有指定元素并且文本内容是text节点
    from lxml import etree
    html=etree.parse(‘test’,etree.HTMLParser())
    result=html.xpath(’//*’)

你可能感兴趣的:(xpath,python)