一、安装python-pptx依赖:
pip install python-pptx
二、功能代码:
import pptx
from pptx import Presentation
prs = Presentation('F:\\test.pptx') #绝对路径
#prs = Presentation('test.pptx') #相对路径
print('啊哈')
for i,slide in enumerate(prs.slides):
#if i == 1: 在这里可以指定提取ppt的具体页数
for shape in slide.shapes:
if shape.has_text_frame:
text_frame = shape.text_frame
print(str(i)+'页:'+text_frame.text)
踩的坑:
1、python-pptx版本问题:
详见:https://blog.csdn.net/qq_39779025/article/details/129721354?spm=1001.2014.3001.5501
2、对于提取ppt内容的先后顺序:
ppt内容:
提取内容:
所以,ppt提取的内容的顺序是由建立这个文本框的先后顺序决定的,而不是由位置决定的哟!!