最近重新梳理xpath页面提取相关知识时,突然想起来以前发现的一个有趣的内容,记录一下
例子如下:
1、xpath进行直接提取, // 代表选择所有子孙节点,提取并返回一个列表
import lxml.html
selector = lxml.html.fromstring(html)
data = selector.xpath("//div[@id='test3']//text()")
print(data)
结果如下
2、使用xpath关键字string(.),string(.)会提取子孙节点的全部内容,同时也提取出子孙节点的相对位置
import lxml.html
selector = lxml.html.fromstring(html)
data = selector.xpath("//div[@id='test3']")[0]
info = data.xpath('string(.)')
print(info)