ppt中插入excel源文件丢失,提取图中数据

ppt中插入excel源文件丢失

之前做PPT的时候有很多数据是嵌入的excel,后来excel的文件找不到了,用python的正则表达式读取实际数据。

1、保存pptx文件为xml

xml文件包含pptx文件中的所有数据,打开pptx另存为xml即可,以文本方式打开xml,可以在其中找到绘制图表的代码。

                                        
											
												32
											
											
												44
											
											
												56
											
											
												64
											
											
												72
											
											
												80
											
											
												84
											
											
												92
											

2、写python脚本,用正则表达式提取xml中的数据结果。

import re
with open('data1.xml','r',encoding='utf-8') as f:
    lines = f.readlines()
Modifications = lines   #'Q9P2E9 1xPhospho [T225]; 1xPhospho [T466]; 1xPhospho [T717]'
pp = []
for line in lines:
    res = re.findall(r'(.*?)',line)
    if not res:
        continue
    pp.append(res)

with open('write.txt','w') as f:
    for p in pp[0]:
        f.writelines(p + '\n')
re.findall()
 
print(res)

3、结果导入到excel中

从excel中以文本方式加载txtwe文件,稍加整理数据的格式即可。

注意

ppt文件到xml文件尽量保持ppt中的页数、内容、图片尽可能的少,否者数据量太大。

 

你可能感兴趣的:(python记录,python,xml,正则表达式,excel)