C#实现将PDF转为Excel的方法详解

通常,PDF格式的文档能支持的编辑功能不如office文档多,针对PDF文档里面有表格数据的,如果想要编辑表格里面的数据,可以将该PDF文档转为Excel格式,然后编辑。本文,将以C#代码为例,介绍如何实现由PDF格式到Excel文档格式的转换。下面是具体步骤。

dll引用方法

方法1

在程序中引入Spire.Pdf.dll文件;将 Spire.PDF for .NET 下载到本地,解压,安装。安装完成后,找到安装路径下BIN文件夹中的Spire.Pdf.dll。然后在Visual Studio中打开“解决方案资源管理器”,鼠标右键点击“引用”,“添加引用”,将本地路径BIN文件夹下的dll文件添加引用至程序。

方法2

通过 NuGet 安装。可通过以下2种方法安装:

1.可以在Visual Studio中打开“解决方案资源管理器”,鼠标右键点击“引用”,“管理NuGet包”,然后搜索“Spire.PDF”,点击“安装”。等待程序安装完成。

  2.将以下内容复制到PM控制台安装:Install-Package Spire.PDF -Version 8.3.9

PDF转Excel

转换时,可通过以下步骤来实现,仅需要三行代码:

  • 创建PdfDocument类的对象。
  • 调用PdfDocument.LoadFromFile(string filename)方法加载PDF文档。
  • 通过PdfDocument.SaveToFile(string filename, FileFormat fileFormat)方法将文件保存为Excel格式到指定路径。

C#

using Spire.Pdf;

namespace PDFtoExcel
{
    class Program
    {
        static void Main(string[] args)
        {
            //加载PDF文档
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("test.pdf");

            //保存为Excel文档
            pdf.SaveToFile("ToExcel.xlsx",FileFormat.XLSX);
        }
    }
}

VB.NET

Imports Spire.Pdf

Namespace PDFtoExcel
    Class Program
        Private Shared Sub Main(args As String())
            '加载PDF文档
            Dim pdf As New PdfDocument()
            pdf.LoadFromFile("test.pdf")

            '保存为Excel文档
            pdf.SaveToFile("ToExcel.xlsx", FileFormat.XLSX)
        End Sub
    End Class
End Namespace

用于转换的PDF文档,包含9页内容:

C#实现将PDF转为Excel的方法详解_第1张图片

转换时,是将原有PDF每页单独转换为一个sheet页,如图,转换后的Excel文档包含9个sheet页:

C#实现将PDF转为Excel的方法详解_第2张图片

到此这篇关于C#实现将PDF转为Excel的方法详解的文章就介绍到这了,更多相关C# PDF转Excel内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

你可能感兴趣的:(C#实现将PDF转为Excel的方法详解)