java使用poi工具读取word文档并将数据存储到数据库中

因为是项目收尾阶段,需要帮客户录入数据,产品小姐姐发过来的是一个word文档,以前呐,都是解析excel文档然后保存到数据库,这次来个新花样是word文档。
java使用poi工具读取word文档并将数据存储到数据库中_第1张图片
只好发挥我一年多面向百度编程的经验一顿查,踩了好多坑最后确定了还是使用Apache poi工具,咱程序员呐,可以当时写不出来但是一定得会面向百度编程。
从网上找了一些POI工具介绍

   Apache poi的hwpf模块是专门用来对word doc文件进行读写操作的。在hwpf里面我们使用HWPFDocument来表示一个word doc文档。在HWPFDocument里面有这么几个概念:

使用POI读写Word doc文件
① Range:它表示一个范围,这个范围可以是整个文档,也可以是里面的某一小节(Section),也可以是某一个段落(Paragraph),还可以是拥有共同属性的一段文本(CharacterRun)。

② Section:word文档的一个小节,一个word文档可以由多个小节构成。

③ Paragraph:word文档的一个段落,一个小节可以由多个段落构成。

④ CharacterRun:具有相同属性的一段文本,一个段落可以由多个CharacterRun组成。

⑤ Table:一个表格。

⑥ TableRow:表格对应的行。

⑦ TableCell:表格对应的单元格。

Section、Paragraph、CharacterRun和Table都继承自Range
废不多说,上代码
常规操作先引入依赖:

        <dependency>
            <groupId>org.apache.poigroupId>
            <artifactId>poi-scratchpadartifactId>
            <version>3.8version>
        dependency>

一、解析word文档表格的方法

这是需要解析的word文档
java使用poi工具读取word文档并将数据存储到数据库中_第2张图片
因为是获取所有单元格内容,前面是对应的需要插入数据库的字段名,后面是插入的值,所以要从考场管理分为两个List,前面只需要去1、3、5、7…位置的值就可以,如果不太了解的可以debug然后一点点打印看看。

// 这是controller,其实解析word文档的代码都在这儿,service只是对数据进行处理
    @GetMapping("/parsingWord")
    public AjaxResult parsingWord() throws Exception {
     
        FileInputStream in = new FileInputStream("C:\\考试点0101\\(双鸭山)考试点信息表(2020.12.30).doc");// 载入文档
        POIFSFileSystem pfs = new POIFSFileSystem(in);
        HWPFDocument hwpf = new HWPFDocument(pfs);
        Range range = hwpf.getRange();// 得到文档的读取范围
        TableIterator it = new TableIterator(range);
        List<String> list = new ArrayList<>();
        StringBuffer errMsg = new StringBuffer();
        while (it.hasNext()) {
     
            Table tb = it.next();
            // 迭代行,默认从0开始
            for (int i = 0; i < tb.numRows(); i++) {
     
                TableRow tr = tb.getRow(i);
                // 迭代列,默认从0开始
                for (int j = 0; j < tr.numCells(); j++) {
     
                    TableCell td = tr.getCell(j);// 取得单元格
                    // 取得单元格的内容
                    String s = "";
                    for (int k = 0; k < td.numParagraphs(); k++) {
     
                        Paragraph para = td.getParagraph(k);// 获取第k个段落
                        s += para.text().trim();
//                        System.out.println(s);
                    }
                    s = s.replace("•", "");
                    list.add(s);
                }
            }
        }
        for (int i = 0; i < list.size(); i++) {
     
            if (list.get(i).equals("")) {
     
                errMsg.append(list.get(i - 1) + "的下一个数值为空
"
); } } if (errMsg.toString().equals("")) { String isSuccess = examCenterService.insertInfo(list); return AjaxResult.success(isSuccess); } else { return AjaxResult.error(errMsg.toString()); } }
    @Override
    public String insertInfo(List<String> list) {
     
        List<String> exam_center = new ArrayList<>();
        List<String> exam_center_site = new ArrayList<>();
        int f = 0;
        for (int i = 0; i < list.size(); i++) {
     
            String s = list.get(i);
            if (s.equals("考场管理")) {
     
                f = i;
            }
        }
        for (int i = 0; i < f; i++) {
     
            exam_center.add(list.get(i));
        }
        for (int i = f + 5; i < list.size(); i++) {
     
            exam_center_site.add(list.get(i));
        }
        System.out.println(exam_center);
        System.out.println(exam_center_site);
        ExamCenter examCenter = new ExamCenter();
        examCenter.setCenterName(exam_center.get(1)); // 市中心名称
        examCenter.setCenterUid(1L); // 考点的uid  这个先设置默认
        examCenter.setName(exam_center.get(3)); // 考点名称
        examCenter.setAddrDetail(exam_center.get(5)); // 考点详细地址
        examCenter.setLeader(exam_center.get(7)); // 考点负责人
        examCenter.setPhone(exam_center.get(9)); // 联系电话
        examCenter.setArea(exam_center.get(11)); // 考点面积
        examCenter.setAccount(exam_center.get(13)); // 登录账号
        examCenter.setPassword(exam_center.get(15)); // 密码
        examCenter.setCreateTime(DateUtils.getNowDate());
        examCenter.setCreateDept(102);
        Integer insert = examCenterMapper.insertExamCenter(examCenter);
        if (insert > 0) {
     
            StringBuffer sb = new StringBuffer();
            // 根据插入最新Id返回一直有问题 先这样查
            Integer id = examCenterMapper.selectLastId();
            int l = 0;
            if (exam_center_site.size() % 4 == 0) {
     
                l = exam_center_site.size() / 4;
            } else {
     
                return "考点信息关键数据缺失";
            }
            for (int i = 0; i < l; i++) {
     
                List<String> exam_center_site_list = new ArrayList<>();
                exam_center_site_list.add(exam_center_site.get(i * 4));
                exam_center_site_list.add(exam_center_site.get((i * 4) + 1));
                exam_center_site_list.add(exam_center_site.get((i * 4) + 2));
                exam_center_site_list.add(exam_center_site.get((i * 4) + 3));
                Integer isSuccess = iExamCenterSiteService.insertInfo(exam_center_site_list, id);
                if (isSuccess < 1) {
     
                    int a = i + 1;
                    sb.append("考场信息第" + a + "条数据插入失败
"
); } } return sb.toString(); } else { return "考点信息插入失败"; } }

二、解析word文档段落的方法

    public static void main(String[] args) throws IOException {
     
            InputStream is;
            try {
     
                is = new FileInputStream(new File("E:\\考点信息.doc"));                                
            POIFSFileSystem fs = new POIFSFileSystem(is);
            HWPFDocument document = new HWPFDocument(fs);
            Range range = document.getRange();
            String title = null;int item=0;
            for(int i=0;i<range.numParagraphs();i++) {
     //通过循环读取每一段
                Paragraph para1 = range.getParagraph(i);    
                CharacterRun run1=para1.getCharacterRun(0);  //获取每一段的属性     
                item = i;//item用来记录当前位置             
                if(run1.getFontSize()==26) {
     //如果字体符合,说明该段落是小标题
                     String context = "";
                    title = para1.text().trim().replaceAll("\r\n", "");//取这一段为当前的title值                    
                      for(int j=item+1;j<range.numParagraphs();j++) {
     //从当前段的下一段开始,查找所有解释段落,                         
                          Paragraph para2 = range.getParagraph(j);
                          CharacterRun run2=para2.getCharacterRun(0);
                         
                          if(run2.getFontSize()==18) {
     //如果字体符合,说明该段落是解释段落之一
                              
                              context = context+para2.text().trim().replaceAll("\r\n", "");//把解释段落合并成一个字符串
                            
                          }
                          if(run2.getFontSize()==26) {
     //如果字体为26,说明到了下一个小标题,则退出循环
                              break;
                          }
                      }
                      //以下为插入数据库方法
                     WordDao worddao = new WordDao();
                     worddao.addData(title, context);                     
                }                             
            }                   
            } catch (FileNotFoundException e) {
     
                // TODO Auto-generated catch block
                e.printStackTrace();
            }
        
    }

你可能感兴趣的:(笔记,java,poi)