用HTMLParser解析网页时,有一部分网页节点无法解析

今天在用HTMLParser解析学校团委的网页时发现一个问题,无法解析我所需的节点,经过几次尝试后依然不行。这令我很困惑,在反复查看了节点过滤设置后也没发现什么问题。这令我万分不解,于是我把整张网页的所有节点都打印了出来,发现只得到部分节点还有不少节点没有解析出来,而我需要的节点正是在无法解析的节点中。在查了百度之后没有在网上发现相关的资料,特发此文,希望有达人可以解惑!!!

 

PS:

      网址:http://www.tw.tzc.edu.cn/

 

      解析代码:

try {
		 Parser parser = new Parser("http://www.tw.tzc.edu.cn");
		 parser.setEncoding("gb2312");
		 NodeIterator it = parser.elements();
		 while (it.hasMoreNodes()) {
		 System.out.println(it.nextNode());
		 }
		 } catch (ParserException e) {
		 // TODO Auto-generated catch block
		 e.printStackTrace();
		 }

 

你可能感兴趣的:(百度)