python docx修改word内容保留图片

问题描述

修改word中文本,如下代码,保存时会导致word中的部分图片消失

from docx import Document
path1 = 'test_in.docx'
path2 = 'test_out.docx'
file = docx.Document(path1)
for parg in file.paragraphs:
    if parg.text:
        parg.text = "test" + parg.text
file.save(path2)

python docx修改word内容保留图片_第1张图片

解决方案

file.inlineshapes仅能找到内联图片,非内联图片找不到,
但通过file.paragraphs[n].runs[m].element.drawing_lst 则可返回块中的图形列表,包括内联图形和非内联图形。所以图片会存在paragraph.run内,如果直接修改paragraph.text会破坏paragraph结构,导致图片丢失。
所以解决方案就是修改下一级run中text而不动图片,如下:

from docx import Document
path1 = 'test_in.docx'
path2 = 'test_out.docx'
file = docx.Document(path1)
for parg in file.paragraphs:
	runt = []
	    for run in parg.runs:
	        if run.text:
	            runt.appent(run.text)
	            runtext = ''
	    parg.add_run('test***'+''.join(runt))
file.save(path2)

python docx修改word内容保留图片_第2张图片

你可能感兴趣的:(文档处理)