你知道如何在C ++中以编程方式将PDF转换为HTML吗?

PDF 是一种标准文档格式,广泛用于个人和不同组织之间的文档交换。即使它很流行,它也不一定总是显示内容的理想选择。例如,在网页上, HTML 是获得更令人满意的用户体验的更好选择。如果想在网站上显示PDF内容,那么将其转换为HTML可能会有所帮助。因此,本文将介绍如何使用C ++将PDF文档转换为HTML格式。

  • 使用C ++将PDF文档转换为HTML格式
  • 使用C ++使用其他选项将PDF文档转换为HTML格式

Aspose.PDF for C++是一个C ++库,您可以使用它创建,阅读和更新PDF文档。此外,API支持将PDF文件转换为HTML格式。下载新版

你知道如何在C ++中以编程方式将PDF转换为HTML吗?_第1张图片

使用C ++将PDF文档转换为HTML格式

使用Aspose.PDF for C ++ API,轻松地将PDF文档转换为HTML格式。您只需两行代码即可执行转换。要将PDF文档转换为HTML格式,请按照以下步骤操作。

  • 使用Document类加载PDF文档。
  • 使用Document-> Save(System :: String outputFileName,SaveFormat format)方法保存HTML输出。

以下示例代码显示了如何使用C ++将PDF文档转换为HTML格式。

// Open the source PDF document
auto pdfDocument = MakeObject(u"SourceDirectory\\Sample 1.pdf");

// Save the HTML file
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);

PDF源文件

你知道如何在C ++中以编程方式将PDF转换为HTML吗?_第2张图片

输出的HTML文件

你知道如何在C ++中以编程方式将PDF转换为HTML吗?_第3张图片

使用C ++使用其他选项将PDF文档转换为HTML格式

Aspose.PDF for C ++ API使您能够自定义转换过程生成的HTML。为此,API提供了HtmlSaveOptions类。以下是HtmlSaveOptions类提供的一些选项。

  • FontSavingMode:用于设置转换期间使用的字体保存模式。该FontSavingModes枚举用于设置它的值。
  • RasterImagesSavingMode:用于设置在转换过程中应如何处理光栅图像。该RasterImagesSavingModes枚举用于设置它的值。
  • LettersPositioningMethod:设置单词中字母的位置。该LettersPositioningMethods枚举用于设置它的值。
  • SpecialFolderForAllImages:用于设置保存图像的路径。
  • SplitIntoPages:它设置是将PDF的每个页面转换为单独的HTML页面,还是将整个文档转换为单个HTML文件。
  • SplitCssIntoPages:当SplitIntoPages设置为true时, SplitCssIntoPages设置CSS是应保存为单个文件还是每个HTML页面的单独文件。

以下是使用其他选项将PDF文档转换为HTML格式的步骤。

  • 使用Document类加载PDF文档。
  • 创建HtmlSaveOptions类的实例。
  • 设置所需的选项。
  • 使用Document-> Save(System :: String outputFileName,System :: SharedPtr选项)方法保存HTML输出。

以下是C ++示例代码,演示了如何使用HtmlSaveOptions类来自定义HTML输出。

// Open the source PDF document
auto pdfDocument = MakeObject(u"SourceDirectory\\Sample 1.pdf");

// Create an instance of the HtmlSaveOptions class
SharedPtroptions = MakeObject();

// Set the desired options
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;

// Save the HTML file
pdfDocument->Save(u"OutputDirectory\\output.html", options);
 

如果您有任何疑问或需求,请随时加入Aspose技术交流群(761297826),我们很高兴为您提供查询和咨询。

你可能感兴趣的:(Aspose,文档开发,文档格式转换,aspose,c++,文档开发,文档格式转换)