Python教程 – 简单代码实现HTML 转Word

之前文章分享过如何使用Spire.Doc for Python库将Word文档转为HTML格式,反过来,该库也能实现HTML到Word文档的转换。通过代码进行转换,避免了手动复制粘贴费时间,并且可能会出现错误或格式混乱等问题。

Spire.Doc for Python库能转换一个HTML文件为 Word Docx 格式,也能直接将HTML字符串转为Word文档。具体实现方法查看下文。

首先通过以下pip命令安装该Python库:

pip install Spire.Doc

Python实现HTML文件转Word

from spire.doc import *
from spire.doc.common import *

# 创建Document类的对象
document = Document()

# 加载一个HTML文件
document.LoadFromFile("input.html", FileFormat.Html, XHTMLValidationType.none)

# 将HTML文件保存为.docx格式
document.SaveToFile("Html文件转为Word.docx", FileFormat.Docx2016)
document.Close()

上述代码先加载了一个.html文件,然后通过调用 Document.SaveToFile() 方法就将该文件转换成了.docx 格式。三行Python代码轻松搞定HTML文件转Word。

效果图:

Python教程 – 简单代码实现HTML 转Word_第1张图片

 

Python实现HTML字符串转Word 

from spire.doc import *
from spire.doc.common import *

# 创建Document类的对象
document = Document()

# 在文档中添加一节
sec = document.AddSection()

# 在该节中添加一个段落
paragraph = sec.AddParagraph()

# 指定HTML字符串
htmlString = """


    HTML转Word示例
    


    

标题示例

这是一个简单段落展示。

无序列表:

  • 数学
  • 语文
  • 英语

表格:

产品 数量 价格
长裤 30 ¥150
毛衣 2 ¥99
""" # 将 HTML 字符串添加到段落中 paragraph.AppendHTML(htmlString) # 保存结果文件 document.SaveToFile("Html字符串转Word.docx", FileFormat.Docx2016) document.Close()

 上述代码中,首先新建了一个Word文档并添加段落,然后通过 Paragraph.AppendHTML() 方法将HTML字符串插入到了Word文档的段落中,最后再保存文档即可将实现转换。生成文件如下图:

Python教程 – 简单代码实现HTML 转Word_第2张图片


Python Word 库各功能教程 

你可能感兴趣的:(Python,Python,Doc,word,python,html)