最全总结 | 聊聊 Python 办公自动化之 PDF(上)

1. 前言

自动化办公,非 Python 莫属!

从本篇文章开始,我们继续聊聊自动化办公中另外一个常用系列:PPT

2. 准备一下

Python 操作 PPT 最强大的依赖库是:python-pptx

所以,在开始操作之前,我们需要在虚拟环境下安装这个依赖库

# 安装依赖pip3install python-pptx

3. PPT 结构

首先,我们需要了解一个 PPT 文档的页面结构

正在上传... 取消

一个 PPT 文档对应一个 Presentation 对象

一个 Presentation 包含多个 Slide 对象,每一个 Slide 代表一个幻灯片

每一张幻灯片的内容都是由各种形状 Shape 组成

其次,PPT 中的内容元素都是由各种形状构成

比如:文字框、图片、占位符、表格、普通形状等

通过翻看源码,发现他们都定义在 MSO_SHAPE_TYPE  类中

正在上传... 取消

最后,我们需要了解一下 PPT 中的 版式模板

使用 Presentation 对象的 属性方法 slide_layouts 可以获取内置的 11 种母版样式

# 使用Presentation获取PPT内置的11种版式样式# 版式索引从0开始slide_layout= presentation.slide_layouts[slide_style_index]

他们分别是:

Title Slide 标题幻灯片

Title and Content    标题和内容幻灯片

Section Header    节标题幻灯片

Two Content    两栏内容幻灯片

Comparison    比较幻灯片

Title Only    仅标题的幻灯片

Blank    空白幻灯片

Content with Caption    内容和标题的幻灯片

Picture with Caption    图片和标题的幻灯片

Title and Vertical Text 标题和竖排内容

Vertical Title and Text 竖排标题和文本

当然,也可以在 Microsoft PPT / WPS 中查看对应母版的样式

这里补充一下,除了内置的版式样式,也可以通过占位符 PlaceHolder 去自定义母版,满足一些特定的场景需求

4. 幻灯片管理

一个 PPT 文件是由一个或多张幻灯片组成

1-1  那如何添加一张一张幻灯片呢?

这里,只需要通过下面 3 个步骤

实例化一个 Presentation 对象

通过内置的版本样式,新建一个版本样式 Layout

通过版本样式 Layout,添加一张幻灯片

defadd_slide(presentation, slide_style_index):"""

    在PPT文档中,以内置的版式添加幻灯片

    :param presentation:文档对象

    :param slide_style_index:版式索引

    :return:

    """# PPT版式样式# 内置有11种版式样式# 0:Title Slide 标题幻灯片# 1:Title and Content  标题和内容# 2:Section Header  节标题# 3:Two Content  两栏内容# 4:Comparison  比较# 5:Title Only  仅标题# 6:Blank  空白# 7:Content with Caption  内容和标题# 8:Picture with Caption  图片和标题# 9:Title and Vertical Text  标题和竖排内容# 10:Vertical Title and Text  竖排标题和文本slide_layout = presentation.slide_layouts[slide_style_index]# 通过样式Layout,新增一张幻灯片slide = presentation.slides.add_slide(slide_layout)returnslide# 1.1 新增幻灯片slide1 = add_slide(self.presentation,0)slide2 = add_slide(self.presentation,1)slide3 = add_slide(self.presentation,2)slide4 = add_slide(self.presentation,3)

1-2  获取已有的幻灯片或某一张幻灯片?

Presentation 对象的 slides 属性 会返回当前 PPT 文档中所有的幻灯片对象列表

defget_slides(presentation):"""

    获取所有的幻灯片

    :param presentation:

    :return:

    """# 所有幻灯片slides = presentation.slides# 幻灯片数目slide_num =len(slides)returnslides, slide_numdefget_slide(presentation, slide_index):"""

    根据索引,获取某一个幻灯片

    :param presentation:

    :param slide_index:页面索引,从0开始

    :return:

    """slides, slide_num = get_slides(presentation=presentation)returnslides[slide_index]# 1.2.1 获取所幻灯片slides, slide_num = get_slides(self.presentation)print('现有幻灯片:', slides)print('幻灯片数目:', slide_num)# 1.2.2 获取某一个幻灯片slide = get_slide(self.presentation,1)print(slide.shapes)

1-3  如果需要删除某一张幻灯片,如何破?

这个也简单,只需要先获取目前幻灯片对象,然后使用下面方法移除即可

defdel_slide(presentation, slide_index=0):"""

    删除某一张幻灯片

    :param presentation:

    :param slide_index: 索引

    :return:

    """# 所有幻灯片的列表slides =list(presentation.slides._sldIdLst)# 根据索引,删除某一张幻灯片presentation.slides._sldIdLst.remove(slides[slide_index])# 1.3 根据索引,删除PPT文档中某一张幻灯片# 比如:删除第4张幻灯片del_slide(self.presentation,3)

5. 文字及段落

我们首先需要指定一个幻灯片对象 Slide,它可以是已有的幻灯片,也可以是新建的一张幻灯片

接着,使用幻灯片对象的 slide.shapes 属性,获取当前幻灯片中的所有形状 Shape 组成的队列

最后利用形状队列的下面这个函数添加一个文本框,函数返回值为一个:文本框对象

add_textbox( left , top , width , height )

该函数参数分别为:

left  左边距

top  上边距

width  文字框宽度

height  文字框高度

这里需要引出另外一个概念:文字形状

PS:文字形状便于在文字框中添加段落和设置样式,通过「文本框对象」的属性函数 text_frame 获取

definsert_textbox(slide, left, top, width, height, unit=Inches):"""

    幻灯片中添加文本框

    :param unit: 单元,默认设置为Inches

    :param slide: 幻灯片对象

    :param left: 左边距

    :param top:  上边距

    :param width: 宽度

    :param height: 高度

    :return:

    """# 文本框textbox = slide.shapes.add_textbox(left=unit(left),                                      top=unit(top),                                      width=unit(width),                                      height=unit(height))# 文本框形状tf = textbox.text_framereturntextbox, tf

为了便于使用,我对幻灯片中插入文字框这一动作进行了一次封装

长度单位默认设置为:Inches,也可以自定义为厘米等单位

接下来,我们来操作文字框及段落的常见操作

1-1  插入文本框,并设置默认段落内容

插入文本框的同时,文本框形状对象会自带一个段落,可以对这个段落设置内容

# 2、往幻灯片中插入一个文本框,返回一个文本框对象和一个文本框形状对象textbox, tf = insert_textbox(slide,8,2,10,4, unit=Cm)# 2.1 默认的段落paragraph_default= tf.paragraphs[0]paragraph_default.text ="设置段落默认的内容"

1-2  文本框中新增一个段落

查看源码发现,文本框形状对象是 TextFrame 的子类,因此可以使用 TextFrame 类中的 add_paragraph() 函数添加一个新的段落

# 2.2 添加一个新的段落paragraph_new= tf.add_paragraph()# 2.3 给段落设置内容paragraph_new.text="欢迎关注公众号:AirPython\n每周分享 Python 原创技术干货!"

1-3  设置段落及文字样式

和 Word 一样,使用 python-pptx 同样可以设置 PPT 文档的段落样式

其中

对齐方式:对齐方式是针对段落的,只需要指定段落对象的 alignment 的属性值即可

defset_parg_font_style(paragraph, font_name=None, font_color=None, font_size=-1, font_bold=False, font_italic=False,                        paragraph_alignment=PP_ALIGN.CENTER):"""

    设置段落中文本的样式,包含:字体名称、颜色、大小、是否加粗、是否斜体

    :param paragraph_alignment: 段落对齐方式

    :param paragraph:

    :param font_name:

    :param font_color:

    :param font_size:

    :param font_bold:

    :param font_italic:

    :return:

    """# 对齐方式# 注意:对齐方式是针对段落的paragraph.alignment = paragraph_alignment# 获取段落中字体对象font = paragraph.font# 设置字体样式set_font_style(font, font_name, font_color, font_size, font_bold, font_italic)returnfont

段落文字属性:使用段落对象的 font 属性获取字体对象,接着设置字体名称、大小、颜色、是否斜体、加粗

defset_font_style(font, font_name=None, font_color=None, font_size=-1, font_bold=False, font_italic=False):"""

    设置字体样式

    :param font:

    :param font_name:

    :param font_color:

    :param font_size:

    :param font_bold:

    :param font_italic:

    :return:

    """# 字体名称iffont_name:        font.name = font_name# 字体颜色iffont_colorandlen(font_color) ==3:        font.color.rgb = RGBColor(font_color[0], font_color[1], font_color[2])# 字体大小iffont_size !=-1:        font.size = Pt(font_size)# 是否加粗,默认不加粗font.bold = font_bold# 是否倾斜,默认不倾斜font.italic = font_italic

1-4  设置文字框的背景颜色

设置文字框背景颜色只需要 2 步

将形状的填充类型设置为纯色

设置文字框的背景颜色

defset_widget_bg(widget, bg_rgb_color=None):"""

    设置【文本框textbox/单元格/形状】的背景颜色

    :param widget:文本框textbox、单元格、形状

    :param bg_rgb_color:背景颜色值

    :return:

    """ifbg_rgb_colorandlen(bg_rgb_color) ==3:# 1、将形状填充类型设置为纯色widget.fill.solid()# 2、设置文本框的背景颜色widget.fill.fore_color.rgb = RGBColor(bg_rgb_color[0], bg_rgb_color[1], bg_rgb_color[2])# 4、设置文字框的背景颜色set_widget_bg(textbox, [0,255,0])

需要指出的是,该方法同样适用于设置表格单元格、普通形状的背景颜色

1-5 文本框的自动对齐

一旦文本框设置一段很长的文字,单行可能显示不完全

这时候,我们只需要设置文字形状的 word_wrap 值为 True,则可以让文本框的文字自动换行显示

# 5、设置文本框的文字自动对齐tf.word_wrap=True

龙华大道1号 http://www.kinghill.cn/Dynamics/2106.html

你可能感兴趣的:(最全总结 | 聊聊 Python 办公自动化之 PDF(上))