Apache POI(Poor Obfuscation Implementation)是一个用于处理Microsoft Office格式文档(如Word、Excel和PowerPoint等)的Java库。为Java开发者提供了处理Microsoft Office文档的强大工具,使他们能够在Java应用程序中实现对Office文档的读写和操作,可用于Microsoft Office集成、自动化报告生成等场景。其主要作用如下:
- 读写Microsoft Office文档: Apache POI允许Java开发者读取和写入Microsoft Office文档,包括Word文档(.doc和.docx)、Excel电子表格(.xls和.xlsx)、PowerPoint演示文稿(.ppt和.pptx)等。
- 文档内容的编辑和创建: 开发者可以使用Apache POI库编辑和创建Word文档、Excel电子表格、PowerPoint演示文稿,这包括添加文本、表格、图表、图片等元素。
- 格式处理: Apache POI提供了对文档格式的支持,包括字体、颜色、样式、表格布局等,你可以通过POI来设置和修改文档的外观和格式。
- 公式计算: 对于Excel文档,Apache POI支持公式的计算和生成,这意味着你可以在Excel中使用公式,并在Java中使用POI进行计算。
- 图表支持: POI支持在Excel中创建和修改图表,允许开发者通过Java代码操作电子表格中的图表。
1.导入poi-tl相关依赖
<dependency>
<groupId>com.deepoove</groupId>
<artifactId>poi-tl</artifactId>
<version>1.12.1</version>
</dependency>
2.文档内容格式处理
public class ParseMarkdownUtil {
// 定义一个表计数器(位置),让每一行添加进对应表中
private int currentTableIndex = 0;
public void parseMarkdown(XWPFDocument document, String text1){
String[] lines = text1.split("\n");
// 当为ture时就表示还在转换表
boolean inTable = false;
boolean center1 = false;
// 将每一行文字进行文本检查和格式设置
for (String line : lines) {
// 创建段落对象paragraph,在该段落中创建一个run对象用于插入文本内容
XWPFParagraph paragraph = document.createParagraph();
XWPFRun run = paragraph.createRun();
// 检查文本是否有加粗,如果包含,则处理加粗
if (line.contains("**")) {
int startIndex = line.indexOf("**");
int endIndex = line.lastIndexOf("**");
// 确保startIndex在endIndex之前
if (startIndex < endIndex) {
run.setBold(true);
// 截取并设置为加粗的部分
String boldText = line.substring(startIndex + 2, endIndex);
run.setText(boldText, 0);
// 截取剩余的文本
String remainingText = line.substring(0, startIndex) + line.substring(endIndex + 2);
if (!remainingText.isEmpty()) {
XWPFRun remainingRun = paragraph.createRun();
remainingRun.setText(remainingText);
}
// 继续下一行的处理
continue;
}
}
// 检查标题
if (line.startsWith("# ")) {
run.setText(line.substring(2));
// 设置字体大小
run.setFontSize(18);
run.setBold(true);
// 设置标题居中
paragraph.setAlignment(ParagraphAlignment.CENTER);
center1 = true;
paragraph.setStyle("Heading1");
continue; // 跳过为标题创建新段落
} else if (line.startsWith("## ")) {
run.setText(line.substring(3));
run.setFontSize(16);
run.setBold(true);
if(center1 = false){
// 设置标题居中
paragraph.setAlignment(ParagraphAlignment.CENTER);
center1 = true;
}
paragraph.setStyle("Heading2");
continue; // 跳过为标题创建新段落
} else if (line.startsWith("### ")) {
run.setText(line.substring(4));
run.setFontSize(14);
run.setBold(true);
paragraph.setStyle("Heading3");
continue; // 跳过为标题创建新段落
}else if (line.startsWith("#### ")) {
run.setText(line.substring(5));
run.setFontSize(12); // 设置适当的字体大小
run.setBold(true);
paragraph.setStyle("Heading4");
continue; // 跳过为标题创建新段落
}
// 检查表格
if (line.contains("|")) {
if (!inTable) {
inTable = true;
processTableLine(document, line);
continue;
} else {
processTableLine(document, line);
continue;
}
} else if (inTable && line.trim().equals("-----")) {
// 继续处理当前表格
continue;
} else if (inTable && (line.trim().isEmpty() || line.startsWith("####"))) {
// 在遇到非表格行时退出表格,并将表格计数器+1,表示下一次扫描到的表算做表2.行内容都添加到表二里面
currentTableIndex++;
inTable = false;
}
run.setText(line);
}
}
private enum TableRowType {
HEADER, DATA, TOTAL
}
private void processTableLine(XWPFDocument document, String line) {
// 假设表格中使用"|"作为分隔符
String[] cells = line.split("\\|");
// 删除数组开头和结尾的空单元格
List<String> cellList = new ArrayList<>(Arrays.asList(cells));
cellList.removeAll(Collections.singleton(""));
// 根据内容确定表格行的类型
TableRowType rowType = determineRowType(cellList);
// 仅在表格不存在时创建新表格,表数量小于等于计数器时,就代表新表没有创建。
if (document.getTables().size() <= currentTableIndex) {
XWPFTable table = document.createTable(1, cellList.size());
// 填充内容
for (int i = 0; i < cellList.size(); i++) {
table.getRow(0).getCell(i).setText(cellList.get(i).trim());
}
} else {
// 如果表格已存在,添加新行,添加进对应表里面
XWPFTable table = document.getTables().get(currentTableIndex);
XWPFTableRow newRow = table.createRow();
for (int i = 0; i < cellList.size(); i++) {
newRow.getCell(i).setText(cellList.get(i).trim());
}
// 根据行类型应用特定的格式
applyFormatting(newRow, rowType);
}
}
private static TableRowType determineRowType(List<String> cells) {
// 根据内容确定行的类型
if (cells.stream().allMatch(String::isEmpty)) {
return TableRowType.HEADER; // 所有单元格为空,是标题行
} else if (cells.size() == 1 && cells.get(0).trim().equalsIgnoreCase("合计:")) {
return TableRowType.TOTAL; // 只有一个单元格包含"合计:",是合计行
} else {
return TableRowType.DATA; // 否则是数据行
}
}
private static void applyFormatting(XWPFTableRow row, TableRowType rowType) {
// 根据行类型应用特定的格式
if (rowType == TableRowType.HEADER) {
// 如果需要,为标题行应用格式
for (XWPFTableCell cell : row.getTableCells()) {
cell.setColor("AAAAAA"); // 为标题单元格设置灰色背景色
}
} else if (rowType == TableRowType.TOTAL) {
// 如果需要,为合计行应用格式
for (XWPFTableCell cell : row.getTableCells()) {
cell.setColor("FFFF00"); // 为合计单元格设置黄色背景色
}
}
}
}
3.创建word文档,并在文档中进行一系列格式操作后传输
public void pageWord() throws IOException {
// 创建Word文档
XWPFDocument document = new XWPFDocument();
// 实例化文档内容格式处理工具类
ParseMarkdownUtil parse = new ParseMarkdownUtil();
parse.parseMarkdown(document,text1);
// 保存文档new FileOutputStream("C:/Users/LMQ/Desktop/out.docx")
document.write(new FileOutputStream("C:/Users/LMQ/Desktop/out.docx"));
}
markdown格式转换为word格式中逻辑只处理了常用的部分,其余部分可根据自己需要去处理,逻辑都是一样的,先分段,然后去识别标志性东西,最后引用api接口方法去进行样式的设置。