python-docx 0.8.10手册 提炼汉化-Document文档概念

Document  文档概念

python-docx可以 创建新文档及修改现有文档。事实上它主要还是用于修改现存文档。

文档  的表现,很大程度上,取决于删除所有文本内容后剩下的部分。样式、页眉和页脚之类与文本内容是分离的。可以在文档开始前设置大量的自定义项,这样自定义项会在生成的文档中表现出来。

文档  有两个主要操作,打开及保存文档。

打开新建文档

这里第一句代码(from docx import Document)指从python-docx库(docx)里面引用Document。

from docx import Document

document = Document()

document.save('test.docx')

这会从内置的默认模板新建文档,并保存为“test.docx”。所谓的“默认模板”实际上是一个空白的Word文件,与安装的python docx库一起存储。

真正打开文档

要修改现存文档,需要带文件名:

from docx import Document

document=Document('existing-document-file.docx')

document.save('new-file-name.docx')

注意事项:

可以用这种方式打开任何Word 2007或更高版本的文件(.Word 2003或更早版本的文档文件不起作用)。

如果打开和保存的文件名相同,python docx会覆盖原始文件。

打开“类文件”文档

python docx可以从所谓的类文件对象中打开文档。它还可以保存为一个类文件对象。便于通过网络连接或从数据库获取源或目标文档。这意味着您可以传递打开的文件或StringIO/BytesIO流对象,来打开或保存文档。

f=open('foobar.docx','rb')

document=Document(f)

f.close()

#or

with open('foobar.docx', 'rb') as f:

       source_stream = StringIO(f.read())

document = Document(source_stream)

source_stream.close()

...

target_stream = StringIO()

document.save(target_stream)



内容源于PyPI。

原始手册内容可参考:https://python-docx.readthedocs.io/en/latest/user/documents.html。

你可能感兴趣的:(python-docx 0.8.10手册 提炼汉化-Document文档概念)