如何用Python批量提取PPT中含有某关键词的一页,并将这些PPT合并

前提:我有一堆PPT文件:1.pptx、2.pptx、3.pptx......每个文件中都含有若干张幻灯片,这若干张幻灯片中都有一张含有某个关键词的一页,例如含有”月分析“,(我就是每个月要从每个分公司中提取他们的月分析)

需求:将这些含有关键词的PPTX文件,删除无关的页,只保留含有关键词的页,并替换关键词,防止混乱,最后将这些ppt全部合并。

奏乐,代码上:

import pptx
from pptx import Presentation
import os
import re
#import ALL

def replace_text(text_frame):#该函数实现的是文本替换功能
    for paragraph in text_frame.paragraphs:
        for run in paragraph.runs:
            for tt in TEXT_NEED_REPLACE:
                if tt[0] in run.text:
                    run.text = run.text.replace(tt[0], tt[1])

def process_ppt(filename_open, filename_save,Procices):
    prs = Presentation(filename_open)
    m=0;
    for slide in prs.slides:
        for shape in slide.shapes:
            if shape.has_text_frame:#判断Shape是否含有文本框
                text_frame = shape.text_frame
                for paragraph in

你可能感兴趣的:(Python,python,数据分析,ppt)