【Jsoup】Java使用Jsoup的jar包将下载的html文件table表格输后台输出

1.    导入第三方jar,3个都要下载
【Jsoup】Java使用Jsoup的jar包将下载的html文件table表格输后台输出_第1张图片
2.    引入jar,右键项目Build Path
【Jsoup】Java使用Jsoup的jar包将下载的html文件table表格输后台输出_第2张图片
3.    导入jar
【Jsoup】Java使用Jsoup的jar包将下载的html文件table表格输后台输出_第3张图片
4.    代码编写
使用File类加载文件,我使用的是绝对路径(完整代码如下)
package com.test.demo;

import java.io.File;
import java.util.ArrayList;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

public class testDemoH4 {
	public static void main(String[] args) throws Exception {
		parseHtmlH4();
	}
	
	private static void parseHtmlH4() throws Exception {
		//读取文件中的panel.html
				File file = new File("D:/html/panel.html");
				String fileName = file.getName();
				//文件名前缀
				String firstName = fileName.substring(0,fileName.lastIndexOf("."));
				if(!file.exists()){
					return;
				}
				System.out.println(firstName+": ");
				System.out.println("{");
				//获取文件
				Document doc = Jsoup.parse(file, "UTF-8");
				//获取html文件中的标签
				Elements elements = doc.getElementsByClass("doc-table");
				
				Elements h = doc.select("h4");
				//有多个标签,所以遍历
				//System.out.println(h.size());
				ArrayList index = new ArrayList(); 
				for(int q = 0;qUsage Example后边
				int indexofH4 = index.indexOf("Usage Example");
				
				//有多个标签,所以遍历h4标签
				for(int i=0;i thIndex = new ArrayList();
					for(int j=0;j

5.    下载的网页:
【Jsoup】Java使用Jsoup的jar包将下载的html文件table表格输后台输出_第4张图片
6.    最后成果
【Jsoup】Java使用Jsoup的jar包将下载的html文件table表格输后台输出_第5张图片

你可能感兴趣的:(Jsoup)