个人笔记-java解析文本并转换生成Excel文件


本篇要点:
1、文件读写的基本操作
2、字符串分割
3、POI生成Excel文件(.xlsx)

需求:
将csv格式的数据文件的内容导入到表格中,生成xlsx格式的文件。
(这是个很简单的任务,这里记录一下,以便以后复用代码。)
转换前:

个人笔记-java解析文本并转换生成Excel文件_第1张图片
csv格式文件样例

转换后:

个人笔记-java解析文本并转换生成Excel文件_第2张图片
转换后的xlsx文件

起因:

个人笔记-java解析文本并转换生成Excel文件_第3张图片

思路:

整体思路

1、按行读取文件数据,过滤掉不必要的行。
2、有效行进行数据分割。
3、分割好的数据存入表格的单元格。
4、输出生成xlsx文件。

用记事本打开csv文件分析一下,发现需要解决的问题主要有:

1、开头有多余代码


个人笔记-java解析文本并转换生成Excel文件_第4张图片
开头多余代码

2、有重复的标题行,每行末尾有无效数据(,,,,)

个人笔记-java解析文本并转换生成Excel文件_第5张图片
无效数据

读取行的详细思路

1、正则匹配“+”开头的行(称为“+”行)并计数,只有读取“+”行计数为1时,置布尔值title_read为true,表示下一行可以读取为标题行。
2、当“+”行计数>=1时,读取的非“+”行才是有效行,这样就可以忽略开头代码。
3、当“+”行计数!=1时,置title_read为false,表示之后不再读取标题行。无效标题行的判断条件为title_read为false时“+”行计数为基数(因为每个标题行前后都有一行“+”行)。这样就可以忽略掉多余标题行。
4、进行字符串切割后,不输出第一个(第一个“|”前是空字符串)和最后一个切割数据(“,,,,,”无效数据)。

完整代码

因为这是个人笔记,就不细讲每一步的实现了,代码比较简单,细节见注释。

package excelOP;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;

import org.apache.poi.xssf.streaming.SXSSFRow;
import org.apache.poi.xssf.streaming.SXSSFSheet;
import org.apache.poi.xssf.streaming.SXSSFWorkbook;

public class ExcelOp {
    
    public void trans(String file_in,String file_out//参数file_in,file_out分别为输入文件路径和输出文件路径
            ){
        /*实例化输入、输出流*/
        File f_in=new File(file_in);//输入文件
        FileInputStream ips=null;
        InputStreamReader ipsr=null;
        
        File f_out=new File(file_out);//输出文件
        FileOutputStream ops=null;
        try {
            ips=new FileInputStream(f_in);
            ipsr=new InputStreamReader(ips);
            
            ops=new FileOutputStream(f_out);
        } catch (FileNotFoundException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        
        /*创建excel表格文件并输出*/
        //创建工作薄
        SXSSFWorkbook wb = new SXSSFWorkbook();
        try {
            //创建新的一页
            SXSSFSheet sheet = wb.createSheet("new sheet");
            
            BufferedReader br=new BufferedReader(ipsr);
            int count_title_framelines=0;
            boolean title_read=false;
            String valueString = null;
            
            int count_line=0;//表格的有效行计数
            
            while ((valueString=br.readLine())!=null){//循环处理每一行
                if(valueString.matches("\\+.+")){//正则匹配标题前后行“+”开头的行
                    count_title_framelines++;
                    if(count_title_framelines==1)title_read=true;
                    else title_read=false;
                }
                else{//非“+”开头的行
                    if(!(title_read==false&&count_title_framelines%2==1)//忽略重复标题行
                            &&count_title_framelines>=1){//忽略开头代码
                        
                        //分解每一行有效行
                        String[] strs_cell=valueString.split("\\|");//用“|”切割每一行作为一个单元格数据
                        SXSSFRow row = sheet.createRow((short)count_line);
                        for(int i=1;i

参考:

POI操作Excel常用方法总结
注:这篇主要讲的是用HSSF生成xls格式的文件(Excel2003版之前用的格式),生成xlsx用的是SXSSF,如上个部分的代码。不过相应的操作大同小异,把所有的“HSSF”改成“SXSSF”即可,相应的包可以到Apache官网下载,给个链接:Apache POI - Download Release Artifacts

你可能感兴趣的:(个人笔记-java解析文本并转换生成Excel文件)