模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。
不同操作系统底层对于文件系统的访问工作原理是不一样的,因此你可能就要针对不同的系统来考虑使用哪些文件系统模块。这样的做法是非常不友好的且麻烦的,因为这样就意味着当你的程序运行环境一改变,你就要相应的去修改大量的代码来应付。
python中的OS模块,我们不需要关心什么操作系统下使用什么模块,OS模块会帮助我们选择正确的模块并调用。
OS模块中关于文件/目录常用的函数使用方法
函数名使用方法
getcwd()返回当前工作目录
chdir(path)改变工作目录
listdir(path='.')列举指定目录中的文件名,(.表示当前目录,..表示上一级目录)
mkdir(path)创建单层目录,如果该目录已存在则抛出异常
makedirs(path)递归创建多层目录,如果该目录以存在则抛出异常,注意:'E:\\a\\b和'E:\\a\\c'并不会冲突
remove(path)删除文件
rmdir(path)删除单层目录,如果目录不为空,则报错
removedirs(path)递归删除目录,从子目录到父目录逐层尝试删除,遇到非空,则报错
rename(old,new)将文件old重命名为new,也可以给目录重命名
system(COMMAND)运行系统的shell命令
以下是支持路径操作中常用到的一些定义,支持所有平台
os.curdir指代当前目录('.')
os.pardir指代上一级目录('..')
os.sep输出操作系统特定的路径分隔符(Win下为'\\',Linux下为'/')
os.linesep当前平台使用的行终止符(Win下为'\r\n',Linux下为'\n')
os.name指代当前使用的操作系统(包括:'posix','nt','mac','os2','ce','java')
os.path模块中关于路径常用的函数使用方法
函数名使用方法
basename(path)去掉目录路径,单独返回文件名
dirname(path)去掉文件名,单独返回目录路径
join(path1[,path2[,...]])将path1,path2各部分组合成一个路径名
split(path)分割文件名与路径(f_path,f_name)元组,如果完全使用目录,它也会将最后一个目录作为文件名分离,且不会判断文件或目录是否存在
splitext(path)分离文件名与扩展名,返回(f_name,f_extension)元组
getsize(file)返回指定文件的大小,单位是字节
getatime(file)返回指定文件最近一次访问时间
getctime(file)返回指定文件创建时间
getmtime(file)返回指定文件最近的修改时间
以下为函数返回Ture或False
exists(path)判断指定路径(目录或文件)是否存在
isabs(path)判断指定路径是否为绝对路径
isdir(path)判断指定路径是否存在且是一个目录
isfile(path)判断指定路径是否存在且是一个文件
islink(path)判断指定路径是否存在且是一个符号链接
ismount(path)判断指定路径是否存在且是一个挂载点
samefile(path1,path2)判断path1和path2两个路径是否指向同一个文件
--------------------分割线,哈哈哈-------------------------------------------
课后作业:
0.编写一个程序,统计当前目录下每个文件类型的文件数:
import os
files = os.listdir(os.curdir)
file_type = dict()
for each_file in files:
if os.path.isdir(each_file):
file_type.setdefault('文件夹',0)
file_type['文件夹'] += 1
else:
ext = os.path.splitext(each_file)[1]
file_type.setdefault(ext,0)
file_type[ext] += 1
print(file_type)
for f_type in file_type.keys():
print('该文件夹下共有类型为【%s】的文件%d个'%(f_type,file_type[f_type]))
1.编写一个程序,计算当前文件夹下所有文件的大小:
import os
files = os.listdir(os.curdir)
file_size = dict()
for file in files:
file_size.setdefault(file,os.path.getsize(file))
print('%s【%sBytes】'%(file,file_size[file]))
file_size()
2.编写一个程序,用户输入文件名以及开始搜索的路径,搜索该文件是否存在。如遇到文件夹,则进入文件夹继续搜
索。
import os
def search_file(start_dir,target):
os.chdir(start_dir)
files = os.listdir(os.curdir)
for each_file in files:
if each_file == target:
print(os.getcwd() + os.sep + target)
if os.path.isdir(each_file):
search_file(each_file,target)
os.chdir(os.pardir)
start_dir = input('请输入待查找的初始目录:')
target = input('请输入需要查找的目标文件:')
search_file(start_dir,target)
3.编写一个程序,用户输入开始搜索的路径,查找该路径下(包含子文件夹内)所有的视频格式文件(要求查找mp4
rmvb, avi的格式即可),并把创建一个文件(VedioList.txt)存放所有找到的文件的路径。
import os
vedio = []
def search_file(start_dir):
os.chdir(start_dir)
files = os.listdir(os.curdir)
for each_file in files:
if os.path.isfile(each_file):
ext = os.path.splitext(each_file)[1]
if ext in [ '.mp4','.avi','.rmvb' ]:
vedio.append(os.getcwd() + os.sep + each_file + os.linesep)
if os.path.isdir(each_file):
search_file(each_file)
os.chdir(os.pardir)
return vedio
start_dir = input('请输入待查找的初始目录:')
search_file(start_dir)
f = open(os.getcwd() + os.sep + 'VedioList.txt','w')
f.writelines(vedio)
f.close()
4.编写一个程序,用户输入关键字,查找当前文件夹内(如果当前文件夹内包含文件夹,则进入文件夹继续搜索)所有含
有该关键字的文本文件(.txt后缀),要求显示该文件所在的位置以及关键字在文件中的具体位置(第几行第几个字符)。
写不出来,有点复杂
import os
def print_keywords(dict_keywords):
keys = dict_keywords.keys()
keys = sorted(keys) #由于字典是无序的,这里对字典进行排序
for each in keys:
print('关键字出现在第%s行,第%s个位置'%(each,str(dict_keywords[each])))
def line_keywords(line, keywords):
key_index = []
start = line.find(keywords)
while start!=-1:
key_index.append(start+1) #用户的角度是从1开始数
start = line.find(keywords, start+1) #从下一个位置继续查找
return key_index
def file_keywords(filename, keywords):
f = open(filename)
line = 0 #记录行数
dict_keywords = dict() #字典,用户存放key所在具体行数对应具体位置
for each_line in f:
line +=1
if keywords in each_line:
key_index = line_keywords(each_line, keywords) #key在每行对应的位置
dict_keywords[line]= key_index
f.close()
return dict_keywords
def file_search(keywords, flag):
all_files = os.walk(os.getcwd())
txt_list = []
for each in all_files:
for filename in each[2]:
if os.path.splitext(filename)[1]== '.txt': #根据后缀判断是否文本
txt_list.append(os.path.join(each[0],filename))
for each_txt_file in txt_list:
dict_keywords = file_keywords(each_txt_file, keywords)
print('====================================================')
print('在文件【%s】中找到关键字【%s】' % (each_txt_file, keywords))
if flag in ['YES','Yes','yes']:
print_keywords(dict_keywords)
keywords = input("请将该脚本放于待查找的文件夹中,请输入关键字:")
detail = input("请问是否需要打印关键字【%s】在文件中的具体位置(YES/NO):")
file_search(keywords, detail)