JAVA中利用Htmlparse解析HTM…

原文地址:JAVA中利用Htmlparse解析HTML文档,利用htmlparse遍历出HTML文档的所有超链接(符号). 作者:zangoz

实例代码如下:

import java.util.HashMap;

import java.util.Map;

import org.htmlparser.Node;

import org.htmlparser.NodeFilter;

import org.htmlparser.Parser;

import org.htmlparser.tags.LinkTag;

import org.htmlparser.util.NodeList;

import com.yao.http.HttpRequester;

import com.yao.http.HttpRespons;

public class Test {

public static void main(String[] args) {

try {

Map<String, String> map = new HashMap<String, String>();

// 率先我们先利用HttpRequester类和HttpRespons类获得一个HTTP哀求中的数据(HTML文档)。

// 能够从材料库中下载htmlloader,该库中有上述类;或从我的《JAVA发送HTTP哀求,归来HTTP响应内容,实例及利用》一文中摘取上述两JAVA类的代码

HttpRequester request = new HttpRequester();

HttpRespons hr = request.sendGet("http://om");

Parser parser = Parser.createParser(hr.getContent(), hr

.getContentEncoding());

try {

// 穿越过滤器过滤出<A>标签

NodeList nodeList = parser

.extractAllNodesThatMatch(new NodeFilter() {

public boolean accept(Node node) {

if (node instanceof LinkTag)

return true;

return false;

}

});

// 打印

for (int i = 0; i < nodeList.size(); i++) {

LinkTag n = (LinkTag) nodeList.elementAt(i);

System.out.print(n.getStringText() + " ==>> ");

System.out.println(n.extractLink());

}

} catch (Exception e) {

e.printStackTrace();

}

} catch (Exception e) {

e.printStackTrace();

}

}

}并且,代码审查对肃清一些尤其细节的讹谬大有裨益,

jquery之博览器的事件模型(DOM 0级事件模型).

STRATEGY(计策)——对象行动形式.

你可能感兴趣的:(JAVA中利用Htmlparse解析HTM…)