大家好,又到了 Python 办公自动化专题, 本文跟大家分享一个文件整理脚本的实现过程。
具体的功能很简单,给定一个打算整理的文件夹目录,这个脚本可以将该目录下的 所有文件都揪出来,并且 根据后缀名归类到不同的文件夹 里,就像下图一样,简直是整理爱好者的福音
通过本例还可以学到: os 、 glob 、 shutil 三个标准库的综合运用
现在让我们一起来捋一捋实现的逻辑
首先是导入需要的依赖库
import os
import shutil
import glob
os 库可以完成操作系统层面大量操作,例如文件夹的 创建、移动、重命名、删除 等,有些功能实现的不是很完美,就用到 shutil 库跟其互补了,例如文件的 复制、移动 等。 glob 库可以利用通配符进行 文件的搜索 获取,非常强大
# 设置建立分类总文件夹的路径,这里按自己的实际路径修改
mkdir_path = r'C:\Users\chenx\文件夹分类'
# 设置需要遍历整理的文件夹路径,可以依据自己的实际需求修改
goal_dir = r'C:\\xxxxxxxx)'
if not os.path.exists(mkdir_path):
os.mkdir(mkdir_path)
os.mkdir 可以在指定路径创建文件夹,但如果文件夹已经存在则会报错,因此谨慎一点可以利用 os.path.exists 先对文件夹的存在与否进行判断
接下来是代码核心循环,为了方便理解先简化成如下形式:
for file in glob.glob(f'{goal_dir}/**/*', recursive=True):
if os.path.isfile(file):
print(file)
glob.glob(f'{goal_dir}/**/*', recursive=True) 中 **/* 是 通配符的重要用法, * 可以代表任意个字符,包括 0 个字符, recursive 参数的设置确保遍历
由于需要 找出所有的文件而非文件夹 ,这里用 os.path.isfile 进行判断。
最后可以输出文件的绝对路径先看看代码有没出现错误,让我们继续往下写
for file in glob.glob(f'{goal_dir}/**/*', recursive=True):
if os.path.isfile(file):
filename = os.path.basename(file)
if '.' in filename:
suffix = filename.split('.')[-1]
else:
suffix = 'others'
这里发生了什么呢?
确认遍历到的是文件后,先用 os.path.basename 获取绝对路径中的文件名,接下来就是获取后缀名了
可以简单用 split 根据 . 将字符串 “劈开”,然后取最后一个元素就是后缀名了
需要注意的是,这里必须要考虑一个特殊情况:有些文件没有后缀名(文件类型就叫文件),且名字中也没有 . ,这时用字符串方法 split 就会报错。
如下图:
因此需要先判断文件中有没有 .
由于我们是利用后缀名建立文件夹,所以索性将文件名中没有 . 的 文件 类型统一分类到 others 文件夹了
这个实现逻辑大致上没有问题,但是依然忽略了一种极端情况: 有些文件没有后缀名,且文件名中有个 . ,哈哈哈哈这种就会被上面的实现逻辑拆解出错误的后缀名了; 更好的方法是有个函数可以直接获取文件的后缀名,利用这个对文件进行分类,感兴趣的读者可以自己尝试
接下来就可以 根据后缀名产生文件夹 了,这里依然要注意先判断文件夹是否已经产生
for file in glob.glob(f'{goal_dir}/**/*', recursive=True):
if os.path.isfile(file):
filename = os.path.basename(file)
if '.' in filename:
suffix = filename.split('.')[-1]
else:
suffix = 'others'
if not os.path.exists(f'{mkdir_path}/{suffix}'):
os.mkdir(f'{mkdir_path}/{suffix}')
shutil.copy(file, f'{mkdir_path}/{suffix}')
为了避免移动文件夹而造成的异常,尤其是系统盘,因此这里用的是复制。按照需要也可以换成 shutil.move 最后我们可以加上分类文件夹和所有文件的计数并输出
完整代码如下:
import os
import shutil
import glob
mkdir_path = r'C:\Users\chenx\文件夹分类'
goal_dir = r'C:\\xxxxxxxx'
if not os.path.exists(mkdir_path):
os.mkdir(mkdir_path)
file_num = 0
dir_num = 0
for file in glob.glob(f'{goal_dir}/**/*', recursive=True):
if os.path.isfile(file):
filename = os.path.basename(file)
if '.' in filename:
suffix = filename.split('.')[-1]
else:
suffix = 'others'
if not os.path.exists(f'{mkdir_path}/{suffix}'):
os.mkdir(f'{mkdir_path}/{suffix}')
dir_num += 1
shutil.copy(file, f'{mkdir_path}/{suffix}')
file_num += 1
print(f'整理完成,有{file_num}个文件分类到了{dir_num}个文件夹中')