htmlcleaner 有用表达式

原文地址:http://hi.baidu.com/yuweiming/blog/item/ac2bc817ad598f04c83d6d46.html

 

/                    获取当前节点的下一级节点,只包括儿子
//                   获取当前节点的所有子节点,包括孙子等。
//table[@class]      获取所有含有class属性的table标签
//table[span[@class]] 获取含有span,有class属性作为子节点的节点。
//a[text()]    <a>a<b>b</b></a> 用来获取a
//a//text()    <a>a<b>b</b></a> 用来获取ab

contains

//a[/d[@class='class1']]/text() 获取含有d子节点并且d节点含有class,值为class1
//a[//d[@class='class1']]/text() 获取含有d子节点,包含孙子等,并且d节点含有class,值为class1


等值查询:
String xPath = "users/user[username='huo' and password='123']";
模糊查询:
String xPath = "users/user[contains(username,'huo') and contains(password,'123')]";

//table[@width][@border][@cellpadding][@cellspacing]//span[@class='posttopic']/../../..   ..是获取当前节点的父节点

你可能感兴趣的:(html,Blog)