Java中实现word文档生成(Apache POI实现)

Java中实现word文档生成(Apache POI实现)


  Apache POI(Poor Obfuscation Implementation)是一个用于处理Microsoft Office格式文档(如Word、Excel和PowerPoint等)的Java库。为Java开发者提供了处理Microsoft Office文档的强大工具,使他们能够在Java应用程序中实现对Office文档的读写和操作,可用于Microsoft Office集成、自动化报告生成等场景。其主要作用如下:

  1. 读写Microsoft Office文档: Apache POI允许Java开发者读取和写入Microsoft Office文档,包括Word文档(.doc和.docx)、Excel电子表格(.xls和.xlsx)、PowerPoint演示文稿(.ppt和.pptx)等。
  2. 文档内容的编辑和创建: 开发者可以使用Apache POI库编辑和创建Word文档、Excel电子表格、PowerPoint演示文稿,这包括添加文本、表格、图表、图片等元素。
  3. 格式处理: Apache POI提供了对文档格式的支持,包括字体、颜色、样式、表格布局等,你可以通过POI来设置和修改文档的外观和格式。
  4. 公式计算: 对于Excel文档,Apache POI支持公式的计算和生成,这意味着你可以在Excel中使用公式,并在Java中使用POI进行计算。
  5. 图表支持: POI支持在Excel中创建和修改图表,允许开发者通过Java代码操作电子表格中的图表。

本文主要演示java实现word文档的生成,其余操作可看官方文档(https://poi.apache.org/)

一、实现步骤(将markdown格式转化为word文档)

  • 导入依赖
  • 格式处理工具类
  • 创建文档进行内容处理并保存文档传输

二、代码实现

1.导入poi-tl相关依赖

<dependency>
      <groupId>com.deepoove</groupId>
      <artifactId>poi-tl</artifactId>
      <version>1.12.1</version>
</dependency>

2.文档内容格式处理

public class ParseMarkdownUtil {
    // 定义一个表计数器(位置),让每一行添加进对应表中
    private int currentTableIndex = 0;
    public void parseMarkdown(XWPFDocument document, String text1){
        String[] lines = text1.split("\n");
        // 当为ture时就表示还在转换表
        boolean inTable = false;
        boolean center1 = false;

        // 将每一行文字进行文本检查和格式设置
        for (String line : lines) {
            // 创建段落对象paragraph,在该段落中创建一个run对象用于插入文本内容
            XWPFParagraph paragraph = document.createParagraph();
            XWPFRun run = paragraph.createRun();
            // 检查文本是否有加粗,如果包含,则处理加粗
            if (line.contains("**")) {
                int startIndex = line.indexOf("**");
                int endIndex = line.lastIndexOf("**");

                // 确保startIndex在endIndex之前
                if (startIndex < endIndex) {
                    run.setBold(true);

                    // 截取并设置为加粗的部分
                    String boldText = line.substring(startIndex + 2, endIndex);
                    run.setText(boldText, 0);

                    // 截取剩余的文本
                    String remainingText = line.substring(0, startIndex) + line.substring(endIndex + 2);
                    if (!remainingText.isEmpty()) {
                        XWPFRun remainingRun = paragraph.createRun();
                        remainingRun.setText(remainingText);
                    }

                    // 继续下一行的处理
                    continue;
                }
            }

            // 检查标题
            if (line.startsWith("# ")) {
                run.setText(line.substring(2));
                // 设置字体大小
                run.setFontSize(18);
                run.setBold(true);
                // 设置标题居中
                paragraph.setAlignment(ParagraphAlignment.CENTER);
                center1 = true;

                paragraph.setStyle("Heading1");
                continue; // 跳过为标题创建新段落
            } else if (line.startsWith("## ")) {
                run.setText(line.substring(3));
                run.setFontSize(16);
                run.setBold(true);
                if(center1 = false){
                    // 设置标题居中
                    paragraph.setAlignment(ParagraphAlignment.CENTER);
                    center1 = true;
                }
                paragraph.setStyle("Heading2");
                continue; // 跳过为标题创建新段落
            } else if (line.startsWith("### ")) {
                run.setText(line.substring(4));
                run.setFontSize(14);
                run.setBold(true);
                paragraph.setStyle("Heading3");
                continue; // 跳过为标题创建新段落
            }else if (line.startsWith("#### ")) {
                run.setText(line.substring(5));
                run.setFontSize(12); // 设置适当的字体大小
                run.setBold(true);
                paragraph.setStyle("Heading4");
                continue; // 跳过为标题创建新段落
            }

            // 检查表格
            if (line.contains("|")) {
                if (!inTable) {
                    inTable = true;
                    processTableLine(document, line);
                    continue;
                } else {
                    processTableLine(document, line);
                    continue;
                }
            } else if (inTable && line.trim().equals("-----")) {
                // 继续处理当前表格
                continue;
            } else if (inTable && (line.trim().isEmpty() || line.startsWith("####"))) {
                // 在遇到非表格行时退出表格,并将表格计数器+1,表示下一次扫描到的表算做表2.行内容都添加到表二里面
                currentTableIndex++;
                inTable = false;
            }

            run.setText(line);
        }
    }

    private enum TableRowType {
        HEADER, DATA, TOTAL
    }

    private void processTableLine(XWPFDocument document, String line) {
        // 假设表格中使用"|"作为分隔符
        String[] cells = line.split("\\|");

        // 删除数组开头和结尾的空单元格
        List<String> cellList = new ArrayList<>(Arrays.asList(cells));
        cellList.removeAll(Collections.singleton(""));

        // 根据内容确定表格行的类型
        TableRowType rowType = determineRowType(cellList);


        // 仅在表格不存在时创建新表格,表数量小于等于计数器时,就代表新表没有创建。
        if (document.getTables().size() <= currentTableIndex) {
            XWPFTable table = document.createTable(1, cellList.size());
            // 填充内容
            for (int i = 0; i < cellList.size(); i++) {
                table.getRow(0).getCell(i).setText(cellList.get(i).trim());
            }

        } else {
            // 如果表格已存在,添加新行,添加进对应表里面
            XWPFTable table = document.getTables().get(currentTableIndex);
            XWPFTableRow newRow = table.createRow();
            for (int i = 0; i < cellList.size(); i++) {
                newRow.getCell(i).setText(cellList.get(i).trim());
            }
            // 根据行类型应用特定的格式
            applyFormatting(newRow, rowType);
        }


    }

    private static TableRowType determineRowType(List<String> cells) {
        // 根据内容确定行的类型
        if (cells.stream().allMatch(String::isEmpty)) {
            return TableRowType.HEADER; // 所有单元格为空,是标题行
        } else if (cells.size() == 1 && cells.get(0).trim().equalsIgnoreCase("合计:")) {
            return TableRowType.TOTAL; // 只有一个单元格包含"合计:",是合计行
        } else {
            return TableRowType.DATA; // 否则是数据行
        }
    }

    private static void applyFormatting(XWPFTableRow row, TableRowType rowType) {
        // 根据行类型应用特定的格式
        if (rowType == TableRowType.HEADER) {
            // 如果需要,为标题行应用格式
            for (XWPFTableCell cell : row.getTableCells()) {
                cell.setColor("AAAAAA"); // 为标题单元格设置灰色背景色
            }
        } else if (rowType == TableRowType.TOTAL) {
            // 如果需要,为合计行应用格式
            for (XWPFTableCell cell : row.getTableCells()) {
                cell.setColor("FFFF00"); // 为合计单元格设置黄色背景色
            }
        }
    }
}

3.创建word文档,并在文档中进行一系列格式操作后传输

public void pageWord() throws IOException {
        // 创建Word文档
        XWPFDocument document = new XWPFDocument();
        // 实例化文档内容格式处理工具类
        ParseMarkdownUtil parse = new ParseMarkdownUtil();
        parse.parseMarkdown(document,text1);
        // 保存文档new FileOutputStream("C:/Users/LMQ/Desktop/out.docx")
        document.write(new FileOutputStream("C:/Users/LMQ/Desktop/out.docx"));
    }

三、说明

  markdown格式转换为word格式中逻辑只处理了常用的部分,其余部分可根据自己需要去处理,逻辑都是一样的,先分段,然后去识别标志性东西,最后引用api接口方法去进行样式的设置。

你可能感兴趣的:(java,word,apache)