Java:删除Word文档中的空白行

我们在处理Word文档时,经常会遇到Word文档中有大量空白行的情况,不仅影响文档美观,还会降低文档的可读性。本文为大家介绍一种免费高效的方法,快速删除Word文档中的空白行、空白段落。具体操作步骤如下。

引入JAR文件

1. 通过Maven安装

如果你使用Maven,复制以下代码到项目文件夹下的“pom.xml“文件中,即可引入JAR文件。


        
            com.e-iceblue
            e-iceblue
         https://repo.e-iceblue.com/nexus/content/groups/public/



    
        e-iceblue
        spire.doc.free
        5.2.0
    

2. 手动添加JAR文件

可在Spire.Doc for Java官网下载免费版,解压后,在“Project Structure“中,找到”Modules“,然后在其中的“Dependencies”中,添加解压出的“lib”文件夹下的Spire.Doc.jar文件。

主要代码步骤解析

  1. 创建Document的对象。
  2. 用Document.loadFromFile()方法从磁盘中载入Word文档。
  3. 判断文档中各段落是否为空白行,并用Section.getBody().getChildObjects().remove()方法删除空白行。
  4. 用Document.saveToFile()方法保存文档到文件。

代码示例:

import com.spire.doc.Document;
import com.spire.doc.FileFormat;
import com.spire.doc.Section;
import com.spire.doc.documents.Paragraph;

public class removeEmptyLine {
    public static void main(String[] args) {
        //创建Document的对象。
        Document document = new Document();

        //从磁盘中载入Word文档。
        document.loadFromFile("D:/testp/示例1.docx");

        //在文档中查找空白行并删除。
        for (Object sectionObj : document.getSections()) {
            Section section = (Section) sectionObj;
            for (int i = 0; i < section.getBody().getChildObjects().getCount(); i++){
                String s = ((Paragraph)(section.getBody().getChildObjects().get(i))).getText().trim();
                if (s.isEmpty()) {
                    section.getBody().getChildObjects().remove(section.getBody().getChildObjects().get(i));
                    i--;
                }
            }
        }
        String result = "D:/javaOutput/removeEmptyLines.docx";

        //保存文档到文件。
        document.saveToFile(result, FileFormat.Docx_2013);
    }
}

效果示意图

Java:删除Word文档中的空白行_第1张图片

你可能感兴趣的:(Java:删除Word文档中的空白行)