Word 与 html 的转换使程序员和开发人员能够通过编辑和定义 word 来创建 html,最后实现word与html转换。本节将介绍一种通过使用 C#、VB.NET 的 .NET Word 组件将 word 与 html相互转换 的解决方案。
Spire.Doc for.NET 最新下载
(一)在 C#、VB.NET 中将 Word 转换为 HTML
Spire.Doc for .NET是一个专业的word组件,无需安装MS Word,两行关键代码即可将word转为html。一种是Document.LoadFromFile(string fileName)方法,用于从系统加载您的 word 文件。另一个是Document.SaveToFile(string fileName, FileFormat fileFormat)负责将 word 保存为 html 文件。
在这里可以查看word到html转换任务的效果。请随时下载 Spire.Doc for .NET并查看上图后的详细代码。
[C#]
using System;
using Spire.Doc;
using Spire.Doc.Documents;
namespace Html2Doc
{
class Program
{
static void Main(string[] args)
{
Document document = new Document();
document.LoadFromFile(@"D:\test.html",FileFormat.Html,XHTMLValidationType.None);
document.SaveToFile("test.doc", FileFormat.Doc);
}
}
}
[VB.NET]
Imports Spire.Doc
Imports Spire.Doc.Documents
Namespace Word_to_HTML
Public Class Form1
Inherits Form
Public Sub New()
MyBase.New
InitializeComponent
End Sub
Private Sub button1_Click(ByVal sender As Object, ByVal e As EventArgs)
'Create word document
Dim document As Document = New Document
document.LoadFromFile("..\wordtohtml.doc")
'Save doc file to html
document.SaveToFile("toHTML.html", FileFormat.Html)
WordDocViewer("toHTML.html")
End Sub
Private Sub WordDocViewer(ByVal fileName As String)
Try
System.Diagnostics.Process.Start(fileName)
Catch As System.Exception
End Try
End Sub
End Class
End Namespace
(二)如何将 HTML 转换为 Word
为什么使用 C#/VB.NET 将 HTML 转换为 Word?
仅通过复制和粘贴即可将 HTML 文件内容保存到 Word 文档中非常容易。或者用户可以右键单击 html 文档,然后选择编辑。它会自动在 Word 中打开。然后您可以将其保存为 Word .doc 文件。但首先,“复制粘贴”方法只能用于纯文本页面或一些非常基本的 HTML 页面。对于复杂的 HTML,可能会出现格式未正确呈现、图像放置不正确、有时甚至丢失、CSS 布局似乎被完全忽略的情况。其次,对 HTML 文档进行编辑也会导致 CSS 被忽略。但是使用 C#/VB.NET,将文件从 HTML 保存到 Word 可能会好得多。此外,它不需要在您的系统上安装 Microsoft Office。
如何使用 C#/VB.NET 将 HTML 转换为 Word?
借助 .NET 库,我们可以使用 C#/VB.NET 毫不费力地将 HTML 转换为 Word。Spire.Doc是一个 MS Word 组件,它使用户能够直接为.NET 和 Silverlight执行广泛的 Word 文档处理任务。与 Microsoft Word 可以帮助您将 Word 文件保存为不同的格式一样,Spire.Doc 也支持将文件从Word Doc 转换为 HTML、PDF、XML、RTF、Text、Docx、Dot 等。此外,除了将文件从 Word 转换为其他流行文件格式,Spire.Doc 还可以将文件从HTML 转 Doc、XML 转 Doc、RTF 转 Doc、Text 转 Doc、Docx 转 Doc、Dot 转 Doc 等。
将 Spire.Doc(或 )Spire.Office与 .NET 框架一起下载,然后按照以下简单步骤将 HTML 转换为 Word。
第 1 步:在 Visual Studio 中创建一个项目并添加 Spire.Doc 作为参考。
第 2 步:使用以下代码加载将转换为 Word doc 文件的 HTML 文件:
Document document = new Document();
document.LoadFromFile(@"D:\Work\Stephen\2011.12.06\test.html",FileFormat.Html,XHTMLValidationType.None);
第 3 步:下面的代码可以帮助我们将 HTML 文件转换为 Word 文档。此外,Spire.Doc 还支持将 HTML 转换为 PDF、XML、ePub、Text、Dot 等。
document.SaveToFile("test.doc", FileFormat.Doc);
第 4 步:将整个简单代码写入工程中,按F5开始转换,完整代码如下:
[C#]
using System;
using Spire.Doc;
using Spire.Doc.Documents;
namespace Html2Doc
{
class Program
{
static void Main(string[] args)
{
Document document = new Document();
document.LoadFromFile(@"D:\test.html",FileFormat.Html,XHTMLValidationType.None);
document.SaveToFile("test.doc", FileFormat.Doc);
}
}
}
[VB.NET]
Imports System
Imports Spire.Doc
Imports Spire.Doc.Documents
Namespace Html2Doc
Friend Class Program
Shared Sub Main(ByVal args() As String)
Dim document As New Document()
document.LoadFromFile("D:\test.html",FileFormat.Html,XHTMLValidationType.None)
document.SaveToFile("test.doc", FileFormat.Doc)
End Sub
End Class
End Namespace
输出的 Word doc 文件可以在 Bin 文件夹中找到
有效截图: