使用jsoup解析html的table中的文本信息

  jsoup是一个非常好用的html解析工具。使用时需要下载相应的jar包。下面就是我使用jsoup解析html的表格的java源代码。亲测可用

public void parse(){
	String htmlStr = ""
			+ " "
				+ ""
				+ "	"
			+ ""
			+ "
" + "
这里是要获取的数据1
" + "
这里是要获取的数据2
" + "
" + "
这里是要获取的数据3
" + "
这里是要获取的数据4
" + "
"; Document doc = Jsoup.parse(htmlStr); // 根据id获取table Element table = doc.getElementById("kbtable"); // 使用选择器选择该table内所有的 Elements trs = table.select("tr"); //遍历该表格内的所有的 for (int i = 0; i < trs.size(); ++i) { // 获取一个tr Element tr = trs.get(i); // 获取该行的所有td节点 Elements tds = tr.select("td"); // 选择某一个td节点 for (int j = 0; j < tds.size(); ++j) { Element td = tds.get(j); // 获取td节点的所有div Elements divs = td.select("div"); // 选择一个div for (int k = 0; k < divs.size(); k++) { Element div = divs.get(k); //获取文本信息 String text = div.text(); //输出到控制台 System.out.println(text); } } } }


你可能感兴趣的:(jsoup解析html)