Java采用POI优化实现导出excel百万级数据量

1.目前导出excel的几种格式:Excel 2003、Excel 2007

在POI中使用HSSF对象时,excel 2003最多只允许存储65536条数据,一般用来处理较少的数据量,这时对于百万级别数据,在计算机性能稍低的机器上测试,就很容易导致堆溢出

Excel 2003:POI中使用HSSF对象时,excel 2003最多只允许存储65536条数据,一般用来处理较少的数据量。这时对于百万级别数据,Excel肯定容纳不了。

 Excel 2007:当POI升级到XSSF对象时,它可以直接支持excel2007以上版本,因为它采用ooxml格式。这时excel可以支持1048576条数据,单个sheet表就支持近104万条数据了,虽然这时导出100万数据能满足要求,但使用XSSF测试后发现偶尔还是会发生堆溢出,所以也不适合百万数据的导出。

excel2007及以上版本可以轻松实现存储百万级别的数据,在POI3.8之后新增加了一个类,SXSSFWorkbook,采用当数据加工时不是类似前面版本的对象,它可以控制excel数据占用的内存,他通过控制在内存中的行数来实现资源管理,即当创建对象超过了设定的行数,它会自动刷新内存,将数据写入文件,这样导致打印时,占用的CPU,和内存很少。

Java代码如下:

import java.io.FileOutputStream;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.ResultSetMetaData;
import java.sql.SQLException;
import java.sql.Statement;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.xssf.streaming.SXSSFWorkbook;
 
/**
 * @Description: 处理百万级别的excel导出操作工具类
 * @author : sunhui
 * @date : 2019-01-17 下午10:55:31
 */
public class BigDataExcelOutWrite {
	/**
	 * 数据库连接操作
	 * 
	 * @throws Exception
	 */
	public Connection getConnection() throws Exception {
 
		// 使用jdbc链接数据库
		Class.forName("com.mysql.jdbc.Driver").newInstance();
		String url = "jdbc:mysql://localhost:3306/bigdata?characterEncoding=UTF-8";
		String username = "root";
		String password = "root";
 
		// 获取数据库连接
		Connection conn = DriverManager.getConnection(url, username, password);
		return conn;
	}
 
	/**
	 * 
	 * @Title: WriteExcel
	 * @Description: 执行导出Excel操作
	 * @param
	 * @return boolean
	 * @throws
	 */
	public boolean WriteExcel(boolean isClose) {
 
		String excelFile = "D:/sunhui/bigData.xlsx";
		// 内存中只创建100个对象,写临时文件,当超过100条,就将内存中不用的对象释放。
		SXSSFWorkbook wb = new SXSSFWorkbook(100);
		Sheet sheet = null; // 工作表对象
		Row nRow = null; // 行对象
		Cell nCell = null; // 列对象
 
		try {
 
			Connection conn = getConnection();
			Statement stmt = conn.createStatement();
			String sql = "select * from hpa_normal_tissue limit 1000000";
			ResultSet rs = stmt.executeQuery(sql); // 获取执行结果
			ResultSetMetaData rsmd = rs.getMetaData(); // 获取执行结果的结构(rs.getMetaData().getTableName(1))就可以返回表名,rs.getMetaData().getColumnCount())
 
			long startTime = System.currentTimeMillis();
			System.out.println("开始执行时间 : " + startTime / 1000 + "m");
			int rowNo = 0; // 总行号
			int pageRowNo = 0; // 页行号
 
			while (rs.next()) {
				// 打印300000条后切换到下个工作表,可根据需要自行拓展,2百万,3百万...数据一样操作,只要不超过1048576就可以
				if (rowNo % 300000 == 0) {
					System.out.println("当前sheet页为:" + rowNo / 300000 );
					sheet = wb.createSheet("我的第" + (rowNo / 300000 + 1) + "个工作簿");// 建立新的sheet对象
					sheet = wb.getSheetAt(rowNo / 300000); // 动态指定当前的工作表
					pageRowNo = 1; // 每当新建了工作表就将当前工作表的行号重置为1
					
				    //定义表头
				    nRow = sheet.createRow(0);
				    Cell cel0 = nRow.createCell(0);  
				    cel0.setCellValue("第一行");
				    Cell cel2 = nRow.createCell(1);  
				    cel2.setCellValue("第二行");  
				    Cell cel3 = nRow.createCell(2);  
				    cel3.setCellValue("第三行");  
				    Cell cel4 = nRow.createCell(3); 
				    cel4.setCellValue("第四行");
				    Cell cel5 = nRow.createCell(4); 
				    cel5.setCellValue("第五行");
				    Cell cel6 = nRow.createCell(5); 
				    cel6.setCellValue("第六行");
				}
				rowNo++;
				nRow = sheet.createRow(pageRowNo++); // 新建行对象
 
				// 打印每行,每行有6列数据 rsmd.getColumnCount()==6 --- 列属性的个数
				for (int i = 0; i < rsmd.getColumnCount(); i++) {
					nCell = nRow.createCell(i);
					nCell.setCellValue(rs.getString(i + 1));
				}
 
				if (rowNo % 10000 == 0) {
					System.out.println("row no: " + rowNo);
				}
			}
 
			long finishedTime = System.currentTimeMillis(); // 处理完成时间
			System.out.println("数据读取完成耗时 : " + (finishedTime - startTime) / 1000 + "m");
			
			FileOutputStream fOut = new FileOutputStream(excelFile);//将数据写入Excel
			wb.write(fOut);
			fOut.flush(); // 刷新缓冲区
			fOut.close();
 
			long stopTime = System.currentTimeMillis(); // 写文件时间
			System.out.println("数据写入Excel表格中耗时 : " + (stopTime - startTime) / 1000 + "m");
 
			if (isClose) {
				this.close(rs, stmt, conn);
			}
 
		} catch (Exception e) {
			e.printStackTrace();
		}
		return false;
	}
 
	// 执行关闭流的操作
	private void close(ResultSet rs, Statement stmt, Connection conn)throws SQLException {
		rs.close();
		stmt.close();
		conn.close();
	}
	//测试方法
	public static void main(String[] args) {
		BigDataExcelOutWrite bdeo = new BigDataExcelOutWrite();
		bdeo.WriteExcel(true);
	}
}

执行结果如下:

Java采用POI优化实现导出excel百万级数据量_第1张图片
3.sql文件以及所需要的jar包

链接:https://pan.baidu.com/s/1tgUbexR-IAjgN0ehgE0PaA

提取码:r8ya

你可能感兴趣的:(springBoot)