Python - python处理word(python-docx)

一、安装第三方模块

python-docx 是用于创建可修改 微软 Word 的一个 python 库,提供全套的 Word 操作,是最常用的 Word 工具
首先要下载名为"docx"的模块,然后import该模块
安装方法 :1.第一种方法:按win+r----> 输入cmd—>输入以下命令即可

pip install python-docx

2.第二种方法:打开pycharm,点击File,再点击settings,点击settings之后再点击project下面的project Interpreter,在界面中点击+号,直接搜索python-docx模块,直接安装即可。

二、基本概念

Document:是一个 Word 文档 对象,不同于 VBA 中 Worksheet 的概念,Document 是独立的,打开不同的 Word 文档,就会有不同的 Document 对象,相互之间没有影响
Paragraph:是段落,一个 Word 文档由多个段落组成,当在文档中输入一个回车键,就会成为新的段落,输入 shift + 回车,不会分段
Run 表示一个节段,每个段落由多个 节段 组成,一个段落中具有相同样式的连续文本,组成一个节段,所以一个 段落 对象有个 Run 列表

三、操作word

1、基本操作
打开、保存

from docx import Document
document = Document()
document.save('文件名称.docx')

添加段落

document.add_paragraph('段落内容')

添加图片

document.add_picture('图片名称.jpg')

设置图片大小

from docx.shared import Cm
#设置图片的跨度为 10 厘米
document.add_picture('图片名称.png', width=Cm(10))

在上一个段落前添加段落

prior_paragraph = paragraph.insert_paragraph_before('段落内容')

添加换页

#文档最后插入分页
document.add_page_break()
#特定段落分页
from docx.enum.text import WD_BREAK
paragraph = document.add_paragraph("独占一页")  # 添加一个段落
paragraph.runs[-1].add_break(WD_BREAK.PAGE)  # 在段落的最后一个节段后添加分页

2、样式
段落样式包括:对齐、列表样式、行间距、缩进、背景色等,可以在添加段落时设定,也可以在添加之后设置:

 #添加一个段落,设置为无序列表样式
document.add_paragraph('无序列表段落', style='List Bullet')

#添加段落后,通过 style 属性设置样式
paragraph = document.add_paragraph('无序列表段落')
paragraph.style = 'List Bullet'

文字样式

paragraph = document.add_paragraph('添加一个段落')
#设置 节段文字为加粗
run = paragraph.add_run('粗体')
run.bold = True

#设置 节段文字为斜体
run = paragraph.add_run('斜体')

你可能感兴趣的:(python,开发语言)