6.1 os.path——平台独立的文件名管理 解析,构建,测试以及处理文件名和路径。 6.1.1 解析路径 路径解析依赖与os中定义的一些变量: os.sep-路径各部分之间的分隔符。 os.extsep-文件名与文件扩展名之间的分隔符。 os.pardir-路径中表示目录树上一级的部分。 os.curdir-路径中当前目录的部分。 split()函数将路径分解为两个单独的部分,并返回包含这些结果的tuple。第二个元素是路径的最后部分,地一个元素是其他部分。 import os.path for path in [ '/one/two/three', '/one/two/three/', '/', '.', '']: print '%15s : %s' % (path, os.path.split(path)) 输入参数以os.sep结尾时,最后一个元素是空串。 >>> ================================ RESTART ================================ >>> /one/two/three : ('/one/two', 'three') /one/two/three/ : ('/one/two/three', '') / : ('/', '') . : ('', '.') : ('', '') basename()函数返回的值等价与split()值的第二部分。 import os.path for path in [ '/one/two/three', '/one/two/three/', '/', '.', '']: print '%15s : %s' % (path, os.path.basename(path)) 整个路径会剥除到只剩下最后一个元素。 >>> ================================ RESTART ================================ >>> /one/two/three : three /one/two/three/ : / : . : . : dirname()函数返回分解路径得到的第一部分。 import os.path for path in [ '/one/two/three', '/one/two/three/', '/', '.', '']: print '%15s : %s' % (path, os.path.dirname(path)) 将basename()与dirname()结合,得到原来的路径。 >>> ================================ RESTART ================================ >>> /one/two/three : /one/two /one/two/three/ : /one/two/three / : / . : : splitext()作用类似与split(),不过它会根据扩展名分隔符而不是目录分隔符来分解路径。 import os.path for path in [ '/one.txt', '/one/two/three.txt', '/', '.', '' 'two.tar.gz']: print '%21s : %s' % (path, os.path.splitext(path)) 查找扩展名时,只使用os.extsep的最后一次出现。 >>> ================================ RESTART ================================ >>> /one.txt : ('/one', '.txt') /one/two/three.txt : ('/one/two/three', '.txt') / : ('/', '') . : ('.', '') two.tar.gz : ('two.tar', '.gz') commonprefix()取一个路径列表作为参数,返回一个字符串,表示所有路径中出现的公共前缀。 import os.path paths = [ '/one/two/three', '/one/two/threetxt', '/one/two/three/four',] for path in paths: print 'PATH:', path print print 'PREFIX:', os.path.commonprefix(paths) >>> ================================ RESTART ================================ >>> PATH: /one/two/three PATH: /one/two/threetxt PATH: /one/two/three/four PREFIX: /one/two/three 6.1.2 建立路径 除了分解现有路径外,还需要从其他字符串建立路径,使用join()。 import os.path for parts in [ ('one', 'two', 'three'), ('\one', 'two', 'three'), ('/one', '/two', '/three', '/four'),]: print parts, ':', os.path.join(*parts) 如果要连接的某个参数以os.sep开头,前面所有参数都会丢弃,参数会返回值的开始部分。 >>> ================================ RESTART ================================ >>> ('one', 'two', 'three') : one\two\three ('\\one', 'two', 'three') : \one\two\three ('/one', '/two', '/three', '/four') : /four 6.1.3 规范化路径 使用join()或利用嵌入变量由单独的字符串组合路径时,得到的路径最后可能会有多余的分隔符或者相对路径部分,使用normpath()可以清除这些内容。 import os.path for path in [ 'one/two/three', 'one/./two/three', 'one/../alt/two/three', ]: print '%20s : %s' % (path, os.path.normpath(path)) 可以计算并压缩有os.curdir和os.pardir构成的路径段。 >>> ================================ RESTART ================================ >>> one/two/three : one\two\three one/./two/three : one\two\three one/../alt/two/three : alt\two\three 要把一个相对路径转换为一个绝对文件名,可以使用abspath()。 import os.path for path in [ '.', '..', 'one/two/three', 'one/./two/three', 'one/../alt/two/three', ]: print '%20s : %s' % (path, os.path.abspath(path)) 结果是从一个文件系统树最顶层开始的完整路径。 >>> ================================ RESTART ================================ >>> . : C:\Users\Administrator\Desktop .. : C:\Users\Administrator one/two/three : C:\Users\Administrator\Desktop\one\two\three one/./two/three : C:\Users\Administrator\Desktop\one\two\three one/../alt/two/three : C:\Users\Administrator\Desktop\alt\two\three 6.1.4 文件时间 import os import time print 'File:', __file__ print 'Access time:', time.ctime(os.path.getatime(__file__)) print 'Modified time:', time.ctime(os.path.getmtime(__file__)) print 'Change time:', time.ctime(os.path.getctime(__time__)) print 'Size:', os.path.getsize(__file__) 返回访问时间,修改时间,创建时间,文件中的数据量。 6.1.5 测试文件 程序遇到一个路径名,通常需要知道这个路径的一些信息。 import os.path filename = r'C:\Users\Administrator\Desktop\tmp' print 'File :', filename print 'Is file? :', os.path.isfile(filename) print 'Absoulute :', os.path.isabs(filename) print 'Is dir? :', os.path.isdir(filename) print 'Is link? :', os.path.islink(filename) print 'Mountpoint? :', os.path.ismount(filename) print 'Exists? :', os.path.exists(filename) print 'Link Exists? :', os.path.lexists(filename) 所有测试都返回布尔值。 >>> ================================ RESTART ================================ >>> File : C:\Users\Administrator\Desktop\tmp Is file? : False Absoulute : True Is dir? : True Is link? : False Mountpoint? : False Exists? : True Link Exists? : True 6.1.6 遍历一个目录树 import os import os.path import pprint def visit(arg, dirname, names): print dirname, arg for name in names: subname = os.path.join(dirname, name) if os.path.isdir(subname): print '%s/' % name else: print ' %s' % name print if not os.path.exists('example'): os.mkdir('example') if not os.path.exists('example/one'): os.mkdir('example/one') with open('example/one/file.txt', 'wt') as f: f.write('i love you') with open('example/one/another.txt', 'wt') as f: f.write('i love you, two') os.path.walk('example', visit, '(User data)') 会生成一个递归的目录列表。 >>> ================================ RESTART ================================ >>> example (User data) one/ example\one (User data) another.txt file.txt