XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。
我们将在下面的例子中使用这个 XML 文档。
<?xml version="1.0" encoding="ISO-8859-1"?> <bookstore> <book> <title lang="eng">Harry Potter</title> <price>29.99</price> </book> <book> <title lang="eng">Learning XML</title> <price>39.95</price> </book> </bookstore>
XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。
下面列出了最有用的路径表达式:
表达式 |
描述 |
nodename |
选取标签名为 nodename的所有 节点的集合 |
/ |
从根节点开始搜索 |
// nodename |
从根节点开始搜索名为 nodename的所有节点的集合 ,而不考虑它们的位置(即深度) |
. |
选取当前节点 |
.. |
选取当前节点的父节点 |
@ |
选取属性 |
在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:
路径表达式 |
结果 |
bookstore |
从当前节点开始(上下文节点)选取 名为 bookstore 所有节点的集合 |
/bookstore |
从根开始选取 名为 bookstore 所有节点的集合
注释:假如路径起始于正斜杠 ( / ) ,则此路径始终代表到某元素的绝对路径! |
bookstore/book |
选取所有属于 bookstore 的子元素的 book 元素集合。 |
//book |
选取所有 book 子元素集合,而不管它们在文档中的位置。 |
bookstore//book |
选择所有属于 bookstore 元素的后代的 book 元素集合,而不管它们位于 bookstore 之下的什么位置。 |
//@lang |
选取所有名为 lang 的属性集合。 |
<script type="text/javascript" src="detect.js"></script> <script type="text/javascript" src="xmldom.js"></script> <script type="text/javascript"> if (isMoz) { Element.prototype.selectNodes = function (sXPath) { var oEvaluator = new XPathEvaluator(); var oResult = oEvaluator.evaluate(sXPath, this, null, XPathResult.ORDERED_NODE_ITERATOR_TYPE, null); var aNodes = new Array; if (oResult != null) { var oElement = oResult.iterateNext(); while (oElement) { aNodes.push(oElement); oElement = oResult.iterateNext(); } } return aNodes; }; Document.prototype.selectNodes = Element.prototype.selectNodes; Element.prototype.selectSingleNode = function (sXPath) { var oEvaluator = new XPathEvaluator(); var oResult = oEvaluator.evaluate(sXPath, this, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null); if (oResult != null) { return oResult.singleNodeValue; } else { return null; } }; Document.prototype.selectSingleNode = Element.prototype.selectSingleNode; } var oXmlDom = new XmlDom(); oXmlDom.onreadystatechange = function () { if (oXmlDom.readyState == 4 || (oXmlDom.getReadyState && oXmlDom.getReadyState() == 4)) { //如果解释XML出错 if (oXmlDom.parseError != 0) { //Mozilla if (oXmlDom.getReadyState) { alert(oXmlDom.xml); } else {//IE var oError = oXmlDom.parseError; alert("An error occurred:\nError Code: " + oError.errorCode + "\n" + "Line: " + oError.line + "\n" + "Line Pos: " + oError.linepos + "\n" + "Reason: " + oError.reason); } } else { //do somethins ... alert("------------XPath = bookstore--------------"); /*oXmlDom为XML DOM,这里的上下文就是文档,这里的 XPath表达式bookstore 意思就是选择文档中bookstore元素,即根节点*/ var lstNodes = oXmlDom.selectNodes("bookstore"); alert(lstNodes.length);//1 for (var i = 0; i < lstNodes.length; i++) { //bookstore alert(lstNodes[i].tagName); } alert("------------XPath = /bookstore--------------"); /*oXmlDom.documentElement为文档的根元素,即这里的上下文节点是文档的根节点, 但XPath还是能正确的运行,因为以反杠开前的不绝对路径,与上下文本节点就没有 关第了,所以与上面的结果是一样的*/ lstNodes = oXmlDom.documentElement.selectNodes("/bookstore"); alert(lstNodes.length);//1 for (var i = 0; i < lstNodes.length; i++) { //bookstore alert(lstNodes[i].tagName); } alert("------------XPath = bookstore/book--------------"); lstNodes = oXmlDom.selectNodes("bookstore/book"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //获取每个book节点的价格 alert(lstNodes[i].selectNodes("price")[0].firstChild.nodeValue); } alert("------------XPath = //book--------------"); //oXmlDom.documentElement.为根元素 lstNodes = oXmlDom.documentElement.selectNodes("//book"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //获取每个book节点的价格 alert(lstNodes[i].selectNodes("price")[0].firstChild.nodeValue); } alert("------------XPath = bookstore//book--------------"); lstNodes = oXmlDom.selectNodes("bookstore//book"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //获取每个book节点的价格 alert(lstNodes[i].selectNodes("price")[0].firstChild.nodeValue); } alert("------------XPath = //@lang--------------"); //返回命为lang的所有属性节点集合 lstNodes = oXmlDom.selectNodes("//@lang"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //第一次打印: lang = eng //第二次打印: lang = eng alert(lstNodes[i].nodeName + " = " + lstNodes[i].nodeValue); } } } }; oXmlDom.load("test.xml"); </script>
谓语用来查找某个特定的节点或者包含某个指定的值的节点。
谓语被嵌在方括号中。
在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:
路径表达式 |
结果 |
/bookstore/book[1] |
选取属于 bookstore 元素的第一个 book 子元素。 |
/bookstore/book[last()] |
选取属于 bookstore 元素的最后一个 book 子 元素。 |
/bookstore/book[last()-1] |
选取属于 bookstore 元素的倒数第二个 book 子元素。 |
/bookstore/book[position()<3] |
选取最前面的两个属于 bookstore 元素的 book 子元素。 |
//title[@lang] |
选取所有拥有名为 lang 的属性的 title 元素。 |
//title[@lang='eng'] |
选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。 |
/bookstore/book[price>35.00] |
选取所有 bookstore 元素的 book 元素,且其中的 price 元素的值须大于 35.00 。 |
/bookstore/book[price>35.00]/title |
选取所有 bookstore 元素中的 book 元素的 title 子元素,且其中的 price 元素的值须大于 35.00 。 |
<script type="text/javascript" src="detect.js"></script> <script type="text/javascript" src="xmldom.js"></script> <script type="text/javascript"> if (isMoz) { Element.prototype.selectNodes = function (sXPath) { var oEvaluator = new XPathEvaluator(); var oResult = oEvaluator.evaluate(sXPath, this, null, XPathResult.ORDERED_NODE_ITERATOR_TYPE, null); var aNodes = new Array; if (oResult != null) { var oElement = oResult.iterateNext(); while (oElement) { aNodes.push(oElement); oElement = oResult.iterateNext(); } } return aNodes; }; Document.prototype.selectNodes = Element.prototype.selectNodes; Element.prototype.selectSingleNode = function (sXPath) { var oEvaluator = new XPathEvaluator(); var oResult = oEvaluator.evaluate(sXPath, this, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null); if (oResult != null) { return oResult.singleNodeValue; } else { return null; } }; Document.prototype.selectSingleNode = Element.prototype.selectSingleNode; } var oXmlDom = new XmlDom(); oXmlDom.onreadystatechange = function () { if (oXmlDom.readyState == 4 || (oXmlDom.getReadyState && oXmlDom.getReadyState() == 4)) { //如果解释XML出错 if (oXmlDom.parseError != 0) { //Mozilla if (oXmlDom.getReadyState) { alert(oXmlDom.xml); } else {//IE var oError = oXmlDom.parseError; alert("An error occurred:\nError Code: " + oError.errorCode + "\n" + "Line: " + oError.line + "\n" + "Line Pos: " + oError.linepos + "\n" + "Reason: " + oError.reason); } } else { //do somethins ... alert("------------XPath = /bookstore/book[1]--------------"); //选取属于 bookstore 元素的第一个 book 子元素。 var lstNodes = oXmlDom.selectSingleNode("/bookstore/book[1]"); //获取每个book节点的价格 29.99 alert(lstNodes.selectSingleNode("price").firstChild.nodeValue); alert("------------XPath = /bookstore/book[last()]-------------"); //选取属于 bookstore 元素的最后一个 book 子 元素。 lstNodes = oXmlDom.selectSingleNode("/bookstore/book[last()]"); //获取每个book节点的价格 39.95 alert(lstNodes.selectSingleNode("price").firstChild.nodeValue); alert("------------XPath = /bookstore/book[last()-1]-------------"); //选取属于 bookstore 元素的倒数第二个 book 子元素。 lstNodes = oXmlDom.selectSingleNode("/bookstore/book[last()-1]"); //获取每个book节点的价格 29.99 alert(lstNodes.selectSingleNode("price").firstChild.nodeValue); alert("------------XPath = /bookstore/book[position()<3]-------------"); //选取最前面的两个属于 bookstore 元素的 book 子元素。 lstNodes = oXmlDom.selectNodes("/bookstore/book[position()<3]"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //第一次输出:29.99 //第二次输出:39.95 alert(lstNodes[i].selectNodes("price")[0].firstChild.nodeValue); } alert("------------XPath = //title[@lang]-------------"); //选取所有拥有名为 lang 的属性的 title 元素。 lstNodes = oXmlDom.selectNodes("//title[@lang]"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //第一次输出:Harry Potter //第二次输出:Learning XML alert(lstNodes[i].firstChild.nodeValue); } alert("------------XPath = //title[@lang='eng']-------------"); //选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。 lstNodes = oXmlDom.selectNodes("//title[@lang='eng']"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //第一次输出:Harry Potter //第二次输出:Learning XML alert(lstNodes[i].firstChild.nodeValue); } alert("------------XPath = /bookstore/book[price>35.00]-------------"); //选取所有bookstore元素的book元素,且其中的price元素的值须大于35.00 lstNodes = oXmlDom.selectNodes("/bookstore/book[price>35.00]"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //第一次输出:39.95 alert(lstNodes[i].selectNodes("price")[0].firstChild.nodeValue); } alert("-------XPath = /bookstore/book[price>35.00]/title---------"); //选取所有bookstore元素中的book元素的title 元素且其中的price元素的值须大于35.00 lstNodes = oXmlDom.selectNodes("/bookstore/book[price>35.00]/title"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //第一次输出:Learning XML alert(lstNodes[i].firstChild.nodeValue); } } } }; oXmlDom.load("test.xml"); </script>
XPath 通配符可用来选取未知的 XML 元素。
通配符 |
描述 |
* |
匹配任何元素节点 |
@* |
匹配任何属性节点 |
node() |
匹配任何类型的节点 |
在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:
路径表达式 |
结果 |
/bookstore/* |
选取 bookstore 元素的所有子节点 |
//* |
选取文档中的所有元素 |
//title[@*] |
选取所有带有属性的 title 元素。 |
alert("------------XPath = /bookstore/*-------------"); //选取bookstore元素的所有子节点 var lstNodes = oXmlDom.selectNodes("/bookstore/*"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //第一次输出:29.99 //第二次输出:39.95 alert(lstNodes[i].selectNodes("price")[0].firstChild.nodeValue); } alert("------------XPath = //*-------------"); //选取文档中的所有元素 lstNodes = oXmlDom.selectNodes("//*"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //第一次:bookstore //第二次:book //第三次:title //第四次:price //第五次:book //第六次:title //第七次:price alert(lstNodes[i].tagName); } alert("------------XPath = //title[@*]-------------"); //选取所有带有属性的title 元素 lstNodes = oXmlDom.selectNodes("//title[@*]"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //第一次:Harry Potter //第二次:Learning XML alert(lstNodes[i].firstChild.nodeValue); }
通过在路径表达式中使用 “|” 运算符,您可以选取若干个路径。
在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:
路径表达式 |
结果 |
//book/title|//book/price |
选取所有 book 元素的 title 和 price 元素。 |
//title|//price |
选取所有文档中的 title 和 price 元素。 |
/bookstore/book/title|//price |
选取所有属于 bookstore 元素的 book 元素的 title 元素,以及文档中所有的 price 元素。 |
alert("------------XPath = //book/title|//book/price-------------"); //选取所有book元素的title和price 元素 var lstNodes = oXmlDom.selectNodes("//book/title|//book/price"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //第一次:title //第二次:price //第三次:title //第四次:price alert(lstNodes[i].tagName); } alert("------------XPath = //title|//price-------------"); //选取所有文档中的title和price元素 lstNodes = oXmlDom.selectNodes("//title|//price"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //第一次:title //第二次:price //第三次:title //第四次:price alert(lstNodes[i].tagName); } alert("------------XPath = /bookstore/book/title|//price-------------"); //选取所有属于bookstore元素的book元素的title 元素,以及文档中所有的price元素 lstNodes = oXmlDom.selectNodes("/bookstore/book/title|//price"); alert(lstNodes.length);//2 for (var i = 0; i < lstNodes.length; i++) { //第一次:title //第二次:price //第三次:title //第四次:price alert(lstNodes[i].tagName); }