如下图所示,将PPT文件中的链接进行删除,且不保留链接名。
原始文件:
处理后文件:
使用python 的pptx模块进行处理,读取文字块,然后再进行判断处理;
from pptx import Presentation
def remove_hyperlinks_from_pptx(pptx_file):
prs = Presentation(pptx_file)
for slide in prs.slides:
for shape in slide.shapes:
if shape.has_text_frame:
for paragraph in shape.text_frame.paragraphs:
for run in paragraph.runs:
if run.hyperlink is not None:
if run.hyperlink.address==run.text:
run.hyperlink.address="" #只删除链接,会保留链接的名称
run.text = run.text.replace(run.text,"") #把链接的名称替换掉
prs.save("output.pptx")
# 调用函数以删除链接
remove_hyperlinks_from_pptx("文件.pptx")
注:如果是批量处理,可以增加一个for循环,遍历文件即可。