XPATH常用知识点整理

xpath相关符号以及意义介绍

屏幕快照 2019-05-02 上午11.38.57.png

XPATH选择器

nodeName 选取此节点的所有节点
/ 从根节点选取
// 从匹配选择的当前节点选择文档中的节点,不考虑它们的位置
. 选择当前节点
.. 选取当前节点的父节点
@ 选取属性

  • 匹配任何元素节点
    @* 匹配任何属性节点
    Node() 匹配任何类型的节点

CSS选择器

“*” 选取所有节点
“#container” #表示取id 取id为container的节点
“.container ” . 表示取类class 取class为container的节点
.class .color 选择class=”color”的所有元素
id #info 选择id=”info”的所有元素
element p 选择所有的p元素
element,element div,p 选择所有div元素和所有p元素
element element div p 选择div标签内部的所有p元素
[attribute] [target] 选择带有targe属性的所有元素
[arrtibute=value] [target=_blank] 选择target=”_blank”的所有元素

一些用法

li a 中间空格 表示取 li 下的所有 a 元素
ul+p 选取ul后面的第一个p元素
div#cntainer>ul 表示 选取id为container的div 的第一个ul子元素
ul~p 选取与ul相邻的所有p元素
a[title] 选取所有有title属性的a元素
a[href="https://www.abc.com"] 选取所有属性为https://www.abc.com的a的元素
a[href*="jobble"] 选取所有href 属性包含jobble的a 元素
a[href^="https"] 选取所有以https开头的a元素
a[href$=".jpg"] 选取所有以.jpg结尾的a元素
input[type=radio]:checked 选取选中的radio元素
div:not(#container) 选取所有id 非 container 的 div属性
li:nth-child(2) 选取第3个li元素
对于scrapy.selector.unified.SelectorList对象,getall()==extract(),get()==extract_first()
对于scrapy.selector.unified.Selector对象,getall()==extract(),get()!=extract_first()

你可能感兴趣的:(XPATH常用知识点整理)