Python中读取带格式的docx文件并保持原格式输出的方法

情景

要输出每个月的月报,每个月只有数据变化,月报文字不变。

思路

将原有的月报数字部分挖出来,用{}代替后当成模板,计算出当月的数据后直接用eval替换掉模板,保存。

模板举例

截至10月底,辖区共有{公司债券发行人数}家公司债券发行人。存续公司债券{存续公司债数}只,发行总额{公司债发行总额}亿元,债券余额{公司债券余额}亿元。

对应的代码

import docx

公司债券发行人数 = int(reportDf.loc['公司债券发行人家数', '历年累计/存续数'])     #债券发行人数
存续公司债数 = int(reportDf.loc['公司债券只数', '历年累计/存续数'])       #存续债券数
公司债发行总额 = df['公司债']['发行总额\n[单位] 亿元'].sum() #公司债发行总额
公司债券余额 = reportDf.loc['公司债存续/发行规模(亿元)', '历年累计/存续数']

doc = docx.Document('月度信息简报-2023年10月-债券部分back.docx')
para = doc.paragraphs

for p in para:
    for r in p.runs:
        r.text = eval(f'''f'{r.text}' ''')

doc.save('my.docx')

特别注意

此处需要替换run中的text,不能直接替换paragraphtext。如果直接替换paragraph的text,会出现模板格式丢失的问题。

你可能感兴趣的:(python,docx,格式)