今天朋友给我一个需求,需要把xlsx文件中的图片拷贝到另一个xlsx中,但是试过网上比较普遍的几种方法,都不能达到很好的效果,比如下面几种方法:
from openpyxl import Workbook
from openpyxl import load_workbook
# 加载工作簿和工作表
wb = load_workbook("test.xlsx")
ws = wb[wb.sheetnames[0]]
# 创建新的工作簿和工作表
new_wb = Workbook()
new_ws = new_wb.active
# 遍历原始工作表中的图片
for img in ws._images:
new_ws.add_image(img)
# 保存新的工作簿
new_wb.save("output.xlsx")
源文件:
from openpyxl import load_workbook
from openpyxl.drawing.image import Image
# 打开源文件和目标文件
source_file = "test.xlsx"
target_file = "output.xlsx"
# 加载源文件和目标文件
source_workbook = load_workbook(source_file)
target_workbook = load_workbook(target_file)
# 获取源文件和目标文件的第一个Sheet
source_sheet = source_workbook.active
target_sheet = target_workbook.active
# 遍历源Sheet中的图片,并拷贝到目标Sheet
for image in source_sheet._images:
# 获取图片的坐标和文件路径
image_coordinate = image.anchor
image_path = image.filename
# 从源文件中读取图片,然后在目标文件中插入图片
with open(image_path, "rb") as f:
img = Image(f)
target_sheet.add_image(img, image_coordinate)
# 保存目标文件
target_workbook.save("output.xlsx")
报错如下:
Traceback (most recent call last):
File "C:\Users\HUAWEI\Desktop\pythonProject\e.py", line 20, in
image_path = image.filename
AttributeError: 'Image' object has no attribute 'filename'
网上查了很多方法,发现有一种方法大家很少提及,就是把xlsx文件转换为zip文件再进行解压提取照片,测试过是有效的,原理是这样的:
解压后的压缩包如下,成功把图片提取出来了,后续插入新xlsx可以从这里提取操作:
代码如下:
import os
import zipfile
# 判断是否是文件和判断文件是否存在
def isfile_exist(file_path):
if not os.path.isfile(file_path):
print("It's not a file or no such file exist ! %s" % file_path)
return False
else:
return True
# 修改指定目录下的文件类型名,将excel后缀名修改为.zip
def change_file_name(file_path, new_type='.zip'):
if not isfile_exist(file_path):
return ''
extend = os.path.splitext(file_path)[1] # 获取文件拓展名
if extend != '.xlsx' and extend != '.xls':
print("It's not a excel file! %s" % file_path)
return False
file_name = os.path.basename(file_path) # 获取文件名
new_name = str(file_name.split('.')[0]) + new_type # 新的文件名,命名为:xxx.zip
dir_path = os.path.dirname(file_path) # 获取文件所在目录
new_path = os.path.join(dir_path, new_name) # 新的文件路径
if os.path.exists(new_path):
os.remove(new_path)
os.rename(file_path, new_path) # 保存新文件,旧文件会替换掉
return new_path # 返回新的文件路径,压缩包
# 解压文件
def unzip_file(zipfile_path):
if not isfile_exist(zipfile_path):
return False
if os.path.splitext(zipfile_path)[1] != '.zip':
print("It's not a zip file! %s" % zipfile_path)
return False
file_zip = zipfile.ZipFile(zipfile_path, 'r')
file_name = os.path.basename(zipfile_path) # 获取文件名
zipdir = os.path.join(os.path.dirname(zipfile_path), str(file_name.split('.')[0])) # 获取文件所在目录
for files in file_zip.namelist():
file_zip.extract(files, os.path.join(zipfile_path, zipdir)) # 解压到指定文件目录
file_zip.close()
return True
# 读取解压后的文件夹,打印图片路径
def read_img(zipfile_path):
if not isfile_exist(zipfile_path):
return False
dir_path = os.path.dirname(zipfile_path) # 获取文件所在目录
file_name = os.path.basename(zipfile_path) # 获取文件名
pic_dir = 'xl' + os.sep + 'media' # excel变成压缩包后,再解压,图片在media目录
pic_path = os.path.join(dir_path, str(file_name.split('.')[0]), pic_dir)
file_list = os.listdir(pic_path)
for file in file_list:
filepath = os.path.join(pic_path, file)
print(filepath)
# 组合各个函数
def compenent(excel_file_path):
zip_file_path = change_file_name(excel_file_path)
if zip_file_path != '':
if unzip_file(zip_file_path):
read_img(zip_file_path)
# main
if __name__ == '__main__':
compenent('C:/Users/HUAWEI/Desktop/pythonProject/test.xlsx')