模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。

不同操作系统底层对于文件系统的访问工作原理是不一样的,因此你可能就要针对不同的系统来考虑使用哪些文件系统模块。这样的做法是非常不友好的且麻烦的,因为这样就意味着当你的程序运行环境一改变,你就要相应的去修改大量的代码来应付。

python中的OS模块,我们不需要关心什么操作系统下使用什么模块,OS模块会帮助我们选择正确的模块并调用。


OS模块中关于文件/目录常用的函数使用方法

函数名使用方法

getcwd()返回当前工作目录

chdir(path)改变工作目录

listdir(path='.')列举指定目录中的文件名,(.表示当前目录,..表示上一级目录)

mkdir(path)创建单层目录,如果该目录已存在则抛出异常

makedirs(path)递归创建多层目录,如果该目录以存在则抛出异常,注意:'E:\\a\\b和'E:\\a\\c'并不会冲突

remove(path)删除文件

rmdir(path)删除单层目录,如果目录不为空,则报错

removedirs(path)递归删除目录,从子目录到父目录逐层尝试删除,遇到非空,则报错

rename(old,new)将文件old重命名为new,也可以给目录重命名

system(COMMAND)运行系统的shell命令

以下是支持路径操作中常用到的一些定义,支持所有平台

os.curdir指代当前目录('.')

os.pardir指代上一级目录('..')

os.sep输出操作系统特定的路径分隔符(Win下为'\\',Linux下为'/')

os.linesep当前平台使用的行终止符(Win下为'\r\n',Linux下为'\n')

os.name指代当前使用的操作系统(包括:'posix','nt','mac','os2','ce','java')


os.path模块中关于路径常用的函数使用方法

函数名使用方法

basename(path)去掉目录路径,单独返回文件名

dirname(path)去掉文件名,单独返回目录路径

join(path1[,path2[,...]])将path1,path2各部分组合成一个路径名

split(path)分割文件名与路径(f_path,f_name)元组,如果完全使用目录,它也会将最后一个目录作为文件名分离,且不会判断文件或目录是否存在

splitext(path)分离文件名与扩展名,返回(f_name,f_extension)元组

getsize(file)返回指定文件的大小,单位是字节

getatime(file)返回指定文件最近一次访问时间

getctime(file)返回指定文件创建时间

getmtime(file)返回指定文件最近的修改时间

以下为函数返回Ture或False

exists(path)判断指定路径(目录或文件)是否存在

isabs(path)判断指定路径是否为绝对路径

isdir(path)判断指定路径是否存在且是一个目录

isfile(path)判断指定路径是否存在且是一个文件

islink(path)判断指定路径是否存在且是一个符号链接

ismount(path)判断指定路径是否存在且是一个挂载点

samefile(path1,path2)判断path1和path2两个路径是否指向同一个文件


--------------------分割线,哈哈哈-------------------------------------------

课后作业:


0.编写一个程序,统计当前目录下每个文件类型的文件数:

import os

files = os.listdir(os.curdir)

file_type = dict()


for each_file in files:

    if os.path.isdir(each_file):

        file_type.setdefault('文件夹',0)

        file_type['文件夹'] += 1

    else:

        ext = os.path.splitext(each_file)[1]

        file_type.setdefault(ext,0)

        file_type[ext] += 1


print(file_type)

for f_type in file_type.keys():

    print('该文件夹下共有类型为【%s】的文件%d个'%(f_type,file_type[f_type]))


1.编写一个程序,计算当前文件夹下所有文件的大小:

import os


files = os.listdir(os.curdir)

file_size = dict()


for file in files:

    file_size.setdefault(file,os.path.getsize(file))

    print('%s【%sBytes】'%(file,file_size[file]))

file_size()


2.编写一个程序,用户输入文件名以及开始搜索的路径,搜索该文件是否存在。如遇到文件夹,则进入文件夹继续搜

索。

import os


def search_file(start_dir,target):

    os.chdir(start_dir)

    files = os.listdir(os.curdir)

    for each_file in files:

        if each_file == target:

            print(os.getcwd() + os.sep + target)

        if os.path.isdir(each_file):

            search_file(each_file,target)

            os.chdir(os.pardir)


start_dir = input('请输入待查找的初始目录:')

target = input('请输入需要查找的目标文件:')

search_file(start_dir,target)


3.编写一个程序,用户输入开始搜索的路径,查找该路径下(包含子文件夹内)所有的视频格式文件(要求查找mp4

rmvb, avi的格式即可),并把创建一个文件(VedioList.txt)存放所有找到的文件的路径。

import os


vedio = []


def search_file(start_dir):

    os.chdir(start_dir)

    files = os.listdir(os.curdir)

    for each_file in files:

        if os.path.isfile(each_file):

            ext = os.path.splitext(each_file)[1]

            if ext in [ '.mp4','.avi','.rmvb' ]:

                vedio.append(os.getcwd() + os.sep + each_file + os.linesep)

        if os.path.isdir(each_file):

            search_file(each_file)

            os.chdir(os.pardir)

    return vedio


start_dir = input('请输入待查找的初始目录:')


search_file(start_dir)


f = open(os.getcwd() + os.sep + 'VedioList.txt','w')

f.writelines(vedio)

f.close()


4.编写一个程序,用户输入关键字,查找当前文件夹内(如果当前文件夹内包含文件夹,则进入文件夹继续搜索)所有含

有该关键字的文本文件(.txt后缀),要求显示该文件所在的位置以及关键字在文件中的具体位置(第几行第几个字符)。


写不出来,有点复杂

import os

def print_keywords(dict_keywords):

    keys = dict_keywords.keys()

    keys = sorted(keys)                        #由于字典是无序的,这里对字典进行排序

    for each in keys:

        print('关键字出现在第%s行,第%s个位置'%(each,str(dict_keywords[each])))

    

def line_keywords(line, keywords):

    key_index = []

    start = line.find(keywords)

    while start!=-1:

        key_index.append(start+1)                #用户的角度是从1开始数

        start = line.find(keywords, start+1)    #从下一个位置继续查找

    return key_index       

    

 

def file_keywords(filename, keywords):

    f = open(filename)

    line = 0                    #记录行数

    dict_keywords = dict()        #字典,用户存放key所在具体行数对应具体位置

    for each_line in f:

        line +=1

        if keywords in each_line:

                key_index = line_keywords(each_line, keywords)    #key在每行对应的位置

                dict_keywords[line]= key_index

    f.close()

    return dict_keywords

 

    

def file_search(keywords, flag):

    all_files = os.walk(os.getcwd())

    txt_list = []

 

    for each in all_files:

        for filename in each[2]:

            if os.path.splitext(filename)[1]== '.txt':        #根据后缀判断是否文本

                txt_list.append(os.path.join(each[0],filename))

 

    for each_txt_file in txt_list:

        dict_keywords = file_keywords(each_txt_file, keywords)

        print('====================================================')

        print('在文件【%s】中找到关键字【%s】' % (each_txt_file, keywords))

        if flag in ['YES','Yes','yes']:

            print_keywords(dict_keywords)

 

        

keywords = input("请将该脚本放于待查找的文件夹中,请输入关键字:")

detail = input("请问是否需要打印关键字【%s】在文件中的具体位置(YES/NO):")

file_search(keywords, detail)