python拆分word文档_python-docx处理word文档

前言

更多内容,请访问我的 个人博客。

前言

全网找了一番,用python创建和更新word(.docx)文档,还是 python-docx 包比较好用。

依赖Python 2.6, 2.7, 3.3, or 3.4

lxml >= 2.3.2

安装模块由于 python-docx 已经提交给 PyPI 仓库,所以可以使用 pip 安装,如下: pip install python-docx

如果同时安装了 python2 和 python3 那么 pip 可能不能用,可以使用 pip3 来安装,如下: pip3 install python-docx

python-docx 也可以使用 easy_install 来安装,如下:easy_install python-docx

如果不能使用 pip 和 easy_install ,可以在 PyPI 下载包、解压、运行 setup.py ,如下: tar xvzf python-docx-{version}.tar.gz cd python-docx-{version} python setup.py install python-docx 还依赖 lxml 包 ,使用前2种方法会自动安装所需依赖包,第三种方法需要自己手动安装。

处理word文档

新建文档类

首先新建一个空白文档类 Document ,如下:

from docx import Document

document = Document()

编辑已存在的word文档

python-docx 不仅可以创建word文档,还可以编辑已存在的word文档。

其实吧,这玩意儿只能编辑已存在的word文档,之所以有个“创建空白文档”的功能,只不过是拷贝一份空白word文档到工作区间,再在空白文档上编辑,看起来似乎是“创建空白文档”罢了。本质上还是编辑已存在的word文档,捂脸中...

打开一个word文档,编辑完后,一定要记得保存。如果保存文件名和原文件名不一样,则会另存为一份word文档;若文件名一样,则会不加提示的保存修改内容。如下:

from docx import Document

document = Document('existing-document-file.docx')

document.save('new-file-name.docx')

新增段落

在word中 段落 是最常见的,创建段落 paragraph 的操作如下:

paragraph = document.add_paragraph('这是个段落。')

你可能感兴趣的:(python拆分word文档)