爬虫学习笔记:网页数据的定位相关——XPath

本文目录

    • 运算符
    • 基本方法
    • 通配符
    • 选取多个路径

运算符

爬虫学习笔记:网页数据的定位相关——XPath_第1张图片

基本方法

爬虫学习笔记:网页数据的定位相关——XPath_第2张图片

/A/B[1]	#选取A下的第一个子元素

/A/B[last()]	#选取A下的倒数第二个book元素。

A/B[position()<3]	#选取A下前面两个子元素。

//B[@price]	#选取拥有price属性的B元素

//B[@price=10]	#选取所有属性price等于10的B元素

通配符

" * "匹配任意节点
@* 匹配节点中的任何属性

比如
/A/* 选取A下的所有子元素。

//B[@*] 选取所有带有属性的B元素。

选取多个路径

//A/B | //B/title
# 选取所有B元素以及B元素下所有的title元素

你可能感兴趣的:(爬虫学习笔记,python,html,爬虫,大数据)