python的lxml模块,

第三方模块安装:pip instll lxml

获取文本内容用:text()

取后代的标签用://

通配符,代表任意标签:/*

from lxml import etree

xml = '''

    1
    中秋节月饼
    9.8元
    博饼
    
        嫦娥
        月兔
        广寒宫
        
            天蓬元帅
        
        
            王刚
        
    

    
        后裔
    

'''

tree = etree.XML(xml)  # 先创建一个etree对象
result1 = tree.xpath('/book/nick/text()')  # text():作用是拿文本
print (result1)  # 输出:['博饼']

result2 = tree.xpath('/book/author/nick/text()') # 取同一层级下的所有nick标签的文本
print(result2) # 输出:['嫦娥', '月兔', '广寒宫']

result3 = tree.xpath('/book/author//nick/text()')  # :"//“取author下所有的nick标签的文本
print(result3)

result4 = tree.xpath('/book/author/*/nick/text()')  #  "*"通配符,代表任意结点,因为有2个nick分别在div,span下面
print(result4)

result5 = tree.xpath('/book//nick/text()')  # 获取book下所有nick的文本
print(result5)




你可能感兴趣的:(python,java,servlet,python)