功能描述:glob模块可以使用Unix shell风格的通配符匹配符合特定格式的文件和文件夹,跟windows的文件搜索功能差不多。glob模块并非调用一个子shell实现搜索功能,而是在内部调用了os.listdir()和fnmatch.fnmatch()。
glob模块共包含以下3个函数:
glob(pathname, recursive=False)
第一个参数pathname为需要匹配的字符串。(该参数应尽量加上r前缀,以免发生不必要的错误)
第二个参数代表递归调用,与特殊通配符“**”一同使用,默认为False。
该函数返回一个符合条件的路径的字符串列表,如果使用的是Windows系统,路径上的“\”符号会自动加上转义符号变为“\\”(方便使用)。
在3.5版本之后,glob函数支持一个特殊的通配符“**”,该通配符可以匹配指定路径里所有文件和目录,包括子目录里的所有文件和目录。相当于递归地调用了这个函数。使用这个通配符必须加上recursive=True参数。
(在有复杂目录结构的情况下使用该通配符可能会导致性能下降,拖累整个程序的运行,需谨慎使用!)
iglob(pathname, recursive=False)
参数与glob()一致。
返回一个迭代器,该迭代器不会同时保存所有匹配到的路径,遍历该迭代器的结果与使用相同参数调用glob()的返回结果一致。
escape(pathname)
这个函数是在3.4版本之后才有的,功能是忽略所有通配符。(可以用于测试某文件是否存在)
(3.5.1版本该函数不能正常运行,升级到3.5.2之后恢复正常)
需要注意的地方:
glob默认不匹配以点符号(.)开始的文件,如果有这类文件,则需要做特殊处理。
假如当前文件夹包含test.txt和.test.txt两个文件。
>>> import glob
>>> glob.glob('*.txt')
['test.txt']
>>> glob.glob('.*.txt')
['.test.txt']
glob模块支持的通配符:
通配符 | 功能 |
---|---|
* | 匹配0或多个字符 |
** | 匹配所有文件、目录、子目录和子目录里的文件(3.5版本新增) |
? | 匹配1个字符,与正则表达式里的?不同 |
[exp] | 匹配指定范围内的字符,如:[1-9]匹配1至9范围内的字符 |
[!exp] | 匹配不在指定范围内的字符 |
总结:虽然glob模块可以很轻松地匹配特定文件和文件夹,但是仅仅支持少量的通配符,没办法像正则表达式一样匹配更复杂的字符串。使用的时候应当认真考虑使用场景,根据需求针对性地选择解决方案。
官方文档地址:
https://docs.python.org/3.5/library/glob.html#module-glob
感谢内容提供者
以上内容遵循BY-NC-SA协议,欢迎转载,转载请注明作者。