关于java代码解析excel,使用sax解析

关于excel解析:
目前网上大多数方法都是利用 apache.poi来解析。
但是上个星期由于一些问题导致内存溢出,原因是poi解析会读取所有的单元格,每一个单元格作为一个对象,而excel中的一些操作会导致没有数据的单元格也被读取,最终导致系统GG。

这是我用于测试的excel:关于java代码解析excel,使用sax解析_第1张图片
关于java代码解析excel,使用sax解析_第2张图片

将文件重命名后(加后缀.zip):
关于java代码解析excel,使用sax解析_第3张图片
再打开:关于java代码解析excel,使用sax解析_第4张图片
关于java代码解析excel,使用sax解析_第5张图片关于java代码解析excel,使用sax解析_第6张图片

xl中包含了excel中的绝大数内容,worksheets中的sheet.xml包含了大部分的数据,sharedString.xml
则包含了sheet.xml中的某些单元格对应的字符串。
目前博主对于excel的了解仅限于此,所以写的代码不是很好,请谅解。

在找了许多资料后和试了几种方法,最终写出来的代码,目前能解析出对应的数据,但是还不知道有什么问题
博主实力不济,仅供参考,有错误请指正,谢谢

ps:关于sheet文件与sharedString文件如何一起读取赋值,还有终止sax解析目前没有解决,希望大家能指点指点

代码



import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;
import java.util.zip.ZipEntry;
import java.util.zip.ZipFile;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

/**
 * 读取Excel文件--- 不稳定
 */
public class ExcelIO {
   
    /**
     * @param 文件地址,列数,行数 无法控制行数,当文件数据过多超过所传参数,报错,终止读取 将所读取的数据以字符串的形式存储
     * @return 返回一个字符串数组列表
     */
    static List<String[]> readExcelIo(String url, int proNum, int rowNum)
            throws IOException, ParserConfigurationException, SAXException {
   
        // 读取Excel文件
        ZipFile file = new ZipFile(url);
        
        // 压缩文件读取,可以读取到压缩文件中的具体文件
        // 这里只读第一个Sheet,在workbook.xml中有sheet的记录,读取workbook文件可以获得
        ZipEntry sheet1File = file.getEntry("xl/worksheets/sheet1.xml");
        
        ZipEntry sharedStringFile = file.getEntry("xl/sharedStrings.xml");

        // sheet输入流
        InputStream sheet1In = file.getInputStream(sheet1File);

        // sharedString输入流
        InputStream sharedStringIn = file.getInputStream(sharedStringFile);

        // sax解析
        SAXParserFactory sax = SAXParserFactory.newInstance();
        SAXParser parser = sax.newSAXParser();

        // 创建sheet文件t处理对象
        SheetHandler sheet1Handler = new SheetHandler(proNum, rowNum);
        parser.parse(sheet1In, sheet1Handler);

        // 创建sharedString文件处理对象
        SharedStringHandler sharedStringHandler = new SharedStringHandler();
        parser.parse

你可能感兴趣的:(学习java中遇到的问题,java代码解析Excel)