Python xpath提取不同标签下的文字

最近重新梳理xpath页面提取相关知识时,突然想起来以前发现的一个有趣的内容,记录一下

例子如下:

我左青龙, 右白虎,
    上朱雀,
  • 下玄武.
老牛在当中. 龙头在胸口

1、xpath进行直接提取, // 代表选择所有子孙节点,提取并返回一个列表

import lxml.html

selector = lxml.html.fromstring(html)
data = selector.xpath("//div[@id='test3']//text()")
print(data)

结果如下在这里插入图片描述
2、使用xpath关键字string(.),string(.)会提取子孙节点的全部内容,同时也提取出子孙节点的相对位置

import lxml.html

selector = lxml.html.fromstring(html)
data = selector.xpath("//div[@id='test3']")[0]
info = data.xpath('string(.)')
print(info)

结果如下
Python xpath提取不同标签下的文字_第1张图片

你可能感兴趣的:(Python)