Java使用POI读取Word中的表格


个人博客 地址:https://www.wenhaofan.com/a/20190627135921

代码

package live.autu.word;

import java.io.FileInputStream;

import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.usermodel.Paragraph;
import org.apache.poi.hwpf.usermodel.Range;
import org.apache.poi.hwpf.usermodel.Table;
import org.apache.poi.hwpf.usermodel.TableCell;
import org.apache.poi.hwpf.usermodel.TableIterator;
import org.apache.poi.hwpf.usermodel.TableRow;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;

/**
 * Hello world!
 *
 */

public class App {
	public static void main(String[] args) {
		//doc文档路径
		String filePath = "C:\\Users\\autu\\Desktop\\test.doc";
		//test.print(filePath,"第一个表");
		
		System.out.println(App.read(filePath,"第一个表"));;
	}

	/**
	 * 读取文档中表格
	 * @param filePath doc路径
	 * @param set 第几个表格
	 */
	public static String read(String filePath,String tableName) {

		StringBuilder sb=new StringBuilder();
		
		
		try (FileInputStream in = new FileInputStream(filePath); // 载入文档
				POIFSFileSystem pfs = new POIFSFileSystem(in);
				HWPFDocument hwpf = new HWPFDocument(pfs);) {
		 
			Range range = hwpf.getRange();// 得到文档的读取范围
			TableIterator it = new TableIterator(range);
			// 迭代文档中的表格
	 
			while (it.hasNext()) {
				Table tb = (Table) it.next();
			 
				// 迭代行,默认从0开始,可以依据需要设置i的值,改变起始行数,也可设置读取到那行,只需修改循环的判断条件即可
				outer:for (int i = 0; i < tb.numRows(); i++) {
					TableRow tr = tb.getRow(i);
					// 迭代列,默认从0开始
					for (int j = 0; j < tr.numCells(); j++) {
						TableCell td = tr.getCell(j);// 取得单元格
						// 取得单元格的内容
						for (int k = 0; k < td.numParagraphs(); k++) {
							Paragraph para = td.getParagraph(k);
							String s = para.text();
							// 去除后面的特殊符号
							if (null != s && !"".equals(s)) {
								s = s.substring(0, s.length() - 1);
							}
							s=s.trim();
							if(tableName.trim().equals(s)||i!=0) {
								sb.append(s + "\t");
							} else {
								break outer;
							}	
						}
					}
					sb.append( "\n");
				}
			}

		} catch (Exception e) {
			e.printStackTrace();
		}
		
		return sb.toString();
	}

}

依赖


    org.apache.poi
    poi
    4.0.1


    org.apache.poi
    poi-scratchpad
    4.0.1

效果图

        test.doc

        Java使用POI读取Word中的表格_第1张图片

         控制台打印
        Java使用POI读取Word中的表格_第2张图片


转载于:https://www.cnblogs.com/fanwenhao/p/11096596.html

你可能感兴趣的:(Java使用POI读取Word中的表格)