Word控件Spire.Doc 转换教程(五):在 C#、VB.NET 中将 Word与HTML互相转换

Word 与 html 的转换使程序员和开发人员能够通过编辑和定义 word 来创建 html,最后实现word与html转换。本节将介绍一种通过使用 C#、VB.NET 的 .NET Word 组件将 word 与 html相互转换 的解决方案。

Spire.Doc for.NET 最新下载

(一)在 C#、VB.NET 中将 Word 转换为 HTML

Spire.Doc for .NET是一个专业的word组件,无需安装MS Word,两行关键代码即可将word转为html。一种是Document.LoadFromFile(string fileName)方法,用于从系统加载您的 word 文件。另一个是Document.SaveToFile(string fileName, FileFormat fileFormat)负责将 word 保存为 html 文件。

在这里可以查看word到html转换任务的效果。请随时下载 Spire.Doc for .NET并查看上图后的详细代码。

Word控件Spire.Doc 转换教程(五):在 C#、VB.NET 中将 Word与HTML互相转换_第1张图片

[C#]

using System;
using Spire.Doc;
using Spire.Doc.Documents;

namespace Html2Doc
{
class Program
{
static void Main(string[] args)
{
Document document = new Document();
document.LoadFromFile(@"D:\test.html",FileFormat.Html,XHTMLValidationType.None);
document.SaveToFile("test.doc", FileFormat.Doc);
}
}
}

[VB.NET]

Imports Spire.Doc
Imports Spire.Doc.Documents

Namespace Word_to_HTML

Public Class Form1
Inherits Form

Public Sub New()
MyBase.New
InitializeComponent
End Sub

Private Sub button1_Click(ByVal sender As Object, ByVal e As EventArgs)
'Create word document
Dim document As Document = New Document
document.LoadFromFile("..\wordtohtml.doc")
'Save doc file to html
document.SaveToFile("toHTML.html", FileFormat.Html)
WordDocViewer("toHTML.html")
End Sub

Private Sub WordDocViewer(ByVal fileName As String)
Try
System.Diagnostics.Process.Start(fileName)
Catch As System.Exception

End Try
End Sub
End Class
End Namespace

(二)如何将 HTML 转换为 Word

为什么使用 C#/VB.NET 将 HTML 转换为 Word?

仅通过复制和粘贴即可将 HTML 文件内容保存到 Word 文档中非常容易。或者用户可以右键单击 html 文档,然后选择编辑。它会自动在 Word 中打开。然后您可以将其保存为 Word .doc 文件。但首先,“复制粘贴”方法只能用于纯文本页面或一些非常基本的 HTML 页面。对于复杂的 HTML,可能会出现格式未正确呈现、图像放置不正确、有时甚至丢失、CSS 布局似乎被完全忽略的情况。其次,对 HTML 文档进行编辑也会导致 CSS 被忽略。但是使用 C#/VB.NET,将文件从 HTML 保存到 Word 可能会好得多。此外,它不需要在您的系统上安装 Microsoft Office。

如何使用 C#/VB.NET 将 HTML 转换为 Word?

借助 .NET 库,我们可以使用 C#/VB.NET 毫不费力地将 HTML 转换为 Word。Spire.Doc是一个 MS Word 组件,它使用户能够直接为.NET 和 Silverlight执行广泛的 Word 文档处理任务。与 Microsoft Word 可以帮助您将 Word 文件保存为不同的格式一样,Spire.Doc 也支持将文件从Word Doc 转换为 HTML、PDF、XML、RTF、Text、Docx、Dot 等。此外,除了将文件从 Word 转换为其他流行文件格式,Spire.Doc 还可以将文件从HTML 转 Doc、XML 转 Doc、RTF 转 Doc、Text 转 Doc、Docx 转 Doc、Dot 转 Doc 等。

将 Spire.Doc(或 )Spire.Office与 .NET 框架一起下载,然后按照以下简单步骤将 HTML 转换为 Word。

第 1 步:在 Visual Studio 中创建一个项目并添加 Spire.Doc 作为参考。

第 2 步:使用以下代码加载将转换为 Word doc 文件的 HTML 文件:

Document document = new Document();
document.LoadFromFile(@"D:\Work\Stephen\2011.12.06\test.html",FileFormat.Html,XHTMLValidationType.None);

第 3 步:下面的代码可以帮助我们将 HTML 文件转换为 Word 文档。此外,Spire.Doc 还支持将 HTML 转换为 PDF、XML、ePub、Text、Dot 等。

document.SaveToFile("test.doc", FileFormat.Doc);

第 4 步:将整个简单代码写入工程中,按F5开始转换,完整代码如下:

[C#]

using System;
using Spire.Doc;
using Spire.Doc.Documents;

namespace Html2Doc
{
class Program
{
static void Main(string[] args)
{
Document document = new Document();
document.LoadFromFile(@"D:\test.html",FileFormat.Html,XHTMLValidationType.None);
document.SaveToFile("test.doc", FileFormat.Doc);
}
}
}

[VB.NET]

Imports System
Imports Spire.Doc
Imports Spire.Doc.Documents

Namespace Html2Doc
Friend Class Program
Shared Sub Main(ByVal args() As String)
Dim document As New Document()
document.LoadFromFile("D:\test.html",FileFormat.Html,XHTMLValidationType.None)
document.SaveToFile("test.doc", FileFormat.Doc)
End Sub
End Class
End Namespace

输出的 Word doc 文件可以在 Bin 文件夹中找到

Word控件Spire.Doc 转换教程(五):在 C#、VB.NET 中将 Word与HTML互相转换_第2张图片

有效截图:

Word控件Spire.Doc 转换教程(五):在 C#、VB.NET 中将 Word与HTML互相转换_第3张图片

你可能感兴趣的:(Spire.Doc,入门教程,html,c#,.net)