java代码读取excel文件,同时兼容2003和2007

后台服务器需要一个读取excel文件的工具,查了些资料,很多不能同时兼容2003和2007,整理了一下,加了一个判断,现在能同时兼容2003和2007,并且可以选择从表格的第几行开始读取。主要用到了apache的jar包,用到的包有(jar包官网下载地址:http://poi.apache.org/download.html):

dom4j-1.6.1.jar

xmlbeans-2.3.0.jar

poi-3.8-beta3-20110606.jar

poi-ooxml-3.8-beta3-20110606.jar

poi-examples-3.8-beta3-20110606.jar

poi-excelant-3.8-beta3-20110606.jar

poi-ooxml-schemas-3.8-beta3-20110606.jar

poi-scratchpad-3.8-beta3-20110606.jar

下面上代码:

package com.iris.readexcel;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.text.DecimalFormat;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;

import org.apache.poi.hssf.usermodel.HSSFCell;
import org.apache.poi.hssf.usermodel.HSSFDataFormat;
import org.apache.poi.hssf.usermodel.HSSFDateUtil;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.CellStyle;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;

/**
 * 读取 excel表格,兼容2003和2007
 * @author ChuanJing
 */
public class ReadExcel {

	/** 总行数 */
	private int totalRows = 0;

	/** 总列数 */
	private int totalCells = 0;

	/** 错误信息 */
	private String errorInfo;

	/** 构造方法 */
	public ReadExcel() {}

	/**
	 * 得到总行数
	 */
	public int getTotalRows() {
		return totalRows;
	}

	/**
	 * 得到总列数
	 */
	public int getTotalCells() {
		return totalCells;
	}

	/**
	 * 得到错误信息
	 */
	public String getErrorInfo() {
		return errorInfo;
	}

	/**
	 * 
	 * 验证excel文件
	 * 
	 * @param:filePath 文件完整路径
	 * @return 返回 true 表示文件没有问题
	 */
	public boolean validateExcel(String filePath) {
		/** 检查文件名是否为空或者是否是Excel格式的文件 */
		if (filePath == null || !(isExcel2003(filePath) || isExcel2007(filePath))) {
			errorInfo = "文件不是excel格式";
			return false;
		}

		/** 检查文件是否存在 */
		File file = new File(filePath);

		if (file == null || !file.exists()) {
			errorInfo = "文件不存在";
			return false;
		}

		return true;
	}

	/**
	 * 根据文件名读取excel文件
	 * 
	 * @param filePath 文件完整路径
	 * @param ignoreRows 读取数据忽略的行数,比喻第一行不需要读入,忽略的行数为1
	 * @return:List  最后读取的结果,数据结构:List>
	 */
	public List> read(String filePath, int ignoreRows) {

		List> dataLst = new ArrayList>();
		InputStream is = null;

		try {
			/** 验证文件是否合法 */
			if (!validateExcel(filePath)) {
				System.out.println(errorInfo);
				return null;
			}

			/** 判断文件的类型,是2003还是2007 */
			boolean isExcel2003 = true;
			if (isExcel2007(filePath)) {
				isExcel2003 = false;
			}

			/** 调用本类提供的根据流读取的方法 */
			File file = new File(filePath);
			is = new FileInputStream(file);
			dataLst = read(is, isExcel2003, ignoreRows);
			is.close();

		} catch (Exception ex) {
			ex.printStackTrace();
		} finally {
			if (is != null) {

				try {
					is.close();
				} catch (IOException e) {
					is = null;
					e.printStackTrace();
				}

			}
		}

		/** 返回最后读取的结果 */
		return dataLst;
	}

	/**
	 * 根据流读取Excel文件
	 * 
	 * @param inputStream
	 * @param isExcel2003  是否是2003的表格(xls格式)
	 * @param ignoreRows 读取数据忽略的行数,比喻第一行不需要读入,忽略的行数为1
	 * @return:List
	 */
	public List> read(InputStream inputStream, boolean isExcel2003, int ignoreRows) {
		List> dataLst = null;
		try {

			/** 根据版本选择创建Workbook的方式 */
			Workbook wb = null;

			if (isExcel2003) {
				wb = new HSSFWorkbook(inputStream);
			} else {
				wb = new XSSFWorkbook(inputStream);
			}
			dataLst = read(wb, ignoreRows);

		} catch (IOException e) {
			e.printStackTrace();
		}

		return dataLst;
	}

	/**
	 * 读取数据
	 * 
	 * @param Workbook
	 * @param ignoreRows 读取数据忽略的行数,比喻第一行不需要读入,忽略的行数为1
	 * @reture:List>
	 */
	private List> read(Workbook wb, int ignoreRows) {
		List> dataLst = new ArrayList>();

		/** 得到第一个shell */
		Sheet sheet = wb.getSheetAt(0);

		/** 得到Excel的行数 */
		this.totalRows = sheet.getPhysicalNumberOfRows();

		/** 得到Excel的列数,不从表格的第一行得到列数,从忽略之后的,要读取的第一行 获取列数*/
		if (this.totalRows >= 1 && sheet.getRow(ignoreRows) != null) {
			this.totalCells = sheet.getRow(ignoreRows).getPhysicalNumberOfCells();
		}

		/** 循环Excel的行,不从表格的第一行循环,去掉忽略的行数*/
		for (int r = ignoreRows; r < this.totalRows; r++) {
			Row row = sheet.getRow(r);

			if (row == null) {
				continue;
			}

			List rowLst = new ArrayList();

			/** 循环Excel的列 */
			for (int c = 0; c <= this.getTotalCells(); c++) {
				Cell cell = row.getCell(c);
				String cellValue = "";

				if (null != cell) {
					// 以下是判断数据的类型
					switch (cell.getCellType()) {
					case HSSFCell.CELL_TYPE_NUMERIC: // 数字
						
						// 如果数字是日期类型,就转换成日期
						if (HSSFDateUtil.isCellDateFormatted(cell)) {// 处理日期格式、时间格式  
			                SimpleDateFormat sdf = null;  
			                if (cell.getCellStyle().getDataFormat() == HSSFDataFormat.getBuiltinFormat("h:mm")) {  
			                    sdf = new SimpleDateFormat("HH:mm");  
			                } else {// 日期  
			                    sdf = new SimpleDateFormat("yyyy年MM月dd日");  
			                }  
			                Date date = cell.getDateCellValue();  
			                cellValue = sdf.format(date);  
			            } else if (cell.getCellStyle().getDataFormat() == 31) {  
			                // 处理自定义日期格式:yyyy年m月d日(通过判断单元格的格式id解决,id的值是31)  
			                SimpleDateFormat sdf = new SimpleDateFormat("yyyy年MM月dd日");  
			                double value = cell.getNumericCellValue();  
			                Date date = org.apache.poi.ss.usermodel.DateUtil.getJavaDate(value);  
			                cellValue = sdf.format(date);  
			            } else {  
			                double value = cell.getNumericCellValue();  
			                CellStyle style = cell.getCellStyle();  
			                DecimalFormat format = new DecimalFormat();  
			                String temp = style.getDataFormatString();  
			                // 单元格设置成常规  
			                if (temp.equals("General")) {  
			                    format.applyPattern("#");  
			                }  
			                cellValue = format.format(value);
			            }  
						break;

					case HSSFCell.CELL_TYPE_STRING: // 字符串
						cellValue = cell.getStringCellValue();
						break;

					case HSSFCell.CELL_TYPE_BOOLEAN: // Boolean
						cellValue = cell.getBooleanCellValue() + "";
						break;

					case HSSFCell.CELL_TYPE_FORMULA: // 公式
						cellValue = cell.getCellFormula() + "";
						break;

					case HSSFCell.CELL_TYPE_BLANK: // 空值
						cellValue = "";
						break;

					case HSSFCell.CELL_TYPE_ERROR: // 故障
						cellValue = "非法字符";
						break;

					default:
						cellValue = "未知类型";
						break;
					}
				}
				rowLst.add(cellValue);
			}

			/** 保存第r行的第c列 */
			dataLst.add(rowLst);
		}
		return dataLst;
	}

	/**
	 * 是否是2003的excel,返回true是2003
	 * 
	 * @param filePath 文件完整路径
	 * @return boolean true代表是2003
	 */
	public static boolean isExcel2003(String filePath) {
		return filePath.matches("^.+\\.(?i)(xls)$");
	}

	/**
	 * 是否是2007的excel,返回true是2007
	 * 
	 * @param filePath 文件完整路径
	 * @return boolean true代表是2007
	 */
	public static boolean isExcel2007(String filePath) {
		return filePath.matches("^.+\\.(?i)(xlsx)$");
	}
}


下面是测试类:

package com.iris.readexcel;

import java.util.List;

/**
 * 测试类
 * 
 * @author ChuanJing
 *
 */
public class TestReadExcel {

	public static void main(String[] args) throws Exception {

		ReadExcel re = new ReadExcel();
		List> list = re.read("C:\\Users\\Iris004\\Desktop\\测试表格.xls", 5);//忽略前5行

		// 遍历读取结果
		if (list != null) {
			for (int i = 0; i < list.size(); i++) {
				System.out.print("第" + (6+i) + "行");
 			
				List cellList = list.get(i);
				for (int j = 0; j < cellList.size(); j++) {
					System.out.print(" 第" + (j + 1) + "列值:");
					System.out.print(" " + cellList.get(j));
				}
				System.out.println();
			}
		}
	}
}


上面是简单的测试一下,就不上图了。

最后我开了4条线程,每条线程单独读取一个表格,然后把读取的数据写入到单独的一个txt文本中,每个表格都是13000多行,在我机器上大概15秒跑完(CPU:Intel Pentium G645 2.9G,内存:4G)。下面是第4条线程读取表格写入文件的部分截图  和 表格截图:

java代码读取excel文件,同时兼容2003和2007_第1张图片


java代码读取excel文件,同时兼容2003和2007_第2张图片


最后附上源码下载地址:http://download.csdn.net/detail/chuan_jing/9586676

你可能感兴趣的:(小工具)