临时需要将客户给的文件夹里的文件全都导入到一个文件夹里,然后再用python做批量读取处理。但很烦的一点是,每个文件夹下面可能存在嵌套的文件夹,然后要把每一层的文件都导出来。然后另外一点是,客户给的是每个月份文件夹里的文件,又存在重名的情况,比如都叫“北京.xlsx”“上海.xlsx”
递归的方法应该大家都会,函数引用自身就可以实现。但遇到同名的文件怎么办呢?我使用的方法是修改原文件的名字,在前面加上标记,每遇到一次就加一个。比如遇到第二个叫“北京.xlsx”的,我就改成“新北京.xlsx”,第三个叫“新新北京.xlsx”,依此类推。
看了网上一圈,也没找到可以直接用的,所以就写了下面的代码,以作分享。
参考的文章有:
csdn-【递归拷贝文件bat shell python】
博客园-【python 实现文件的递归拷贝】
我使用的复制方法是,shutil.copy()
# -*- coding: utf-8 -*-
#!/usr/bin/python
#Filename:copyfile.py
import os,shutil
def mycopy(srcpath,dstpath):
# 如果文件夹里没有文件,就结束
if not os.listdir(srcpath):
return 0
else:
dir_list = os.listdir(srcpath) # 列出文件夹下所有的目录与文件
# 遍历文件夹里的所有文件和文件夹
for i in range(0, len(dir_list)):
path = os.path.join(srcpath, dir_list[i]) # 加上上一级目录,形成新目录,这一步是最重要的
print(path) # 试着打印一下
# 假如是文件,就试着复制
if os.path.isfile(path):
# 现在file是原文件的名字
file = dir_list[i]
path_last = path
while os.path.exists(os.path.join(dstpath, file)):
# 只要目标文件夹里已经存在同名文件,就修改原文件夹里当前的文件名
# 先修改最终复制的文件路径
path_last = os.path.join(srcpath, '新' + file)
os.rename(os.path.join(srcpath, file), path_last)
# file已经是新的文件名了
file = '新' + file
# 为了标识新文件的记号,这里用的是'新',可以根据需要修改
shutil.copy(path_last, dstpath)
else:
# 如果是文件夹,就重新调用原函数执行
mycopy(path, dstpath)
使用
srcpath=r"C:\Users\XXX\Downloads\源文件夹路径"
dstpath=r"C:\Users\XXX\Downloads\目标文件夹路径"
mycopy(srcpath,dstpath)
因为客户给的文件夹里的子文件夹名字带小数点,比如2019.01这种名字,我觉得不太方便加到文件名上面,所以就没有按文件夹的名字去做标记。