Python实现提取ppt文本内容

一、安装python-pptx依赖:

pip install python-pptx

二、功能代码:

import pptx
from pptx import Presentation

prs = Presentation('F:\\test.pptx')  #绝对路径
#prs = Presentation('test.pptx')  #相对路径
print('啊哈')
for i,slide in enumerate(prs.slides):
    #if i == 1:  在这里可以指定提取ppt的具体页数
        for shape in slide.shapes:
            if shape.has_text_frame:
                text_frame = shape.text_frame
                print(str(i)+'页:'+text_frame.text)

三、输出:
Python实现提取ppt文本内容_第1张图片

踩的坑:
1、python-pptx版本问题:
详见:https://blog.csdn.net/qq_39779025/article/details/129721354?spm=1001.2014.3001.5501

2、对于提取ppt内容的先后顺序:
ppt内容:
Python实现提取ppt文本内容_第2张图片
提取内容:
在这里插入图片描述

所以,ppt提取的内容的顺序是由建立这个文本框的先后顺序决定的,而不是由位置决定的哟!!

你可能感兴趣的:(python,powerpoint,开发语言)