【Java基础专题】IO与文件读写---使用Apache commons IO包规范文件名

【Java基础专题】IO与文件读写---使用Apache commons IO包规范文件名
【一】Apache commons IO包之FilenameUtils

在使用JDK的File类构建目录、文件对象时,通常会碰到以下的问题:

 ①分隔符的问题:Unix系统和Windos系统的路径分隔符、换行符不同
 ②路径规范的问题:有些API对于返回的目录路径不带"/",有些则有
 ③文件名规范的问题:有些文件名中间带有空格,导致程序解析错误

上面的问题虽然不算复杂,却也恼人。有时候甚至会在这些问题上耗费大量的时间。于是Apache commons io包提供了一个FilenameUtils类来专门帮助我们解决这样的问题。根据Apache common io的说法:你可以通过使用JDK自带的File类构造方法File(String parent, String child)来避免使用这个类,但是实际上这个类还是很有用的!

【二】Apache commons IO包中对路径的定义

要了解Apache commons IO包如何处理路径文件名的问题,首先要知道Apache中如何定义关于路径的参数:

关于路径有3个概念:
 ①前缀:盘符或者根目录
 ②路径:从前缀或根目录开始直至文件的所在目录
 ③全路径:包含了前缀和路径

要注意的是:在Apache的所以关于路径的概念中,都是以分隔符结尾的。因为按照Apache的说法,如果没有提供分隔符,它将不能正确地识别路径代表的是一个目录还是一个文件,在这种情况下只能选择将其识别为一个文件。

关于文件名也有3个概念:
 ①基本名称:不包含路径和扩展名的部分
 ②扩展名称:从.开始直至结束的部分
 ③文件名称:包含了基本名称和扩展名称

要注意的是:扩展名并不包含"."

在路径概念中,前缀是一个很重要的概念:因为它告诉了程序应该从那里开始识别,在Apache commons IO包中,使用如下规则去获取前缀:


【三】常用API

①路径规范

首先要介绍的就是normalize方法,这个方法用于对各种类型的路径进行规范,它的规则如下:

A trailing slash will be retained.
A double slash will be merged to a single slash (but UNC names are handled).
A single dot path segment will be removed.
A double dot will cause that path segment and the one before to be removed.
If the double dot has no parent path segment to work with, null is returned


下面是官网上面的一个例子:


要特别注意的是:这个方法总是会返回一个结尾带有"/"的路径,如果你不需要这个分隔符,那么你可以调用另外一个方法:normalizeNoEndSeparator(String filename)。

②路径的比较

有点时候我们需要比较两个路径是否代表了同一个资源,但是由于路径写法或者API调用的不同,即便同一个对象也有可能返回false的结果。于是Apache提供了一个直接简便的方法:equals。这个方法的完整签名是:

 static boolean equals(String filename1, String filename2,
                               boolean normalized, IOCase caseSensitivity)

其中normalized参数表示在比较前是否要进行规范,通常都是true,参数caseSensitivity表示是否大小写敏感。这个参数有3个可选择的选项,他们分别是:
 ※ IOCase.INSENSITIVE
 ※ IOCase.SENSITIVE
 ※ IOCase.SYSTEM

通常为了移植性我们都会选择IOCase.SYSTEM,即根据系统的类型自动决定。

③路径获取

分为path和full path两种情况,可用的API有:

 ※ getFullPath(String filename)/getFullPathNoEndSeparator(String filename)
 ※ getPath(String filename)/getPathNoEndSeparator(String filename)
 
④路径的截取

包含了对扩展名的位置判断和分隔符的位置判断。设想一下假如现在有这样的一个路径:C:/path/my.file/you.txt

如果我们要获取扩展名,使用indexOf('.'),那么返回的将是错误的结果。使用Apache commons IO提供的indexOfExtension(String filename)方法,将会首先检查在"."后是否还有"/"分隔符。

该方法内部默认调用了另外一个方法:indexOfLastSeparator(String filename)

⑤文件名的获取

分为全文件名,基本文件名,扩展名。可用的API有:

 ※ getName(String filename)
 ※ getBaseName(String filename)
 ※ getExtension(String filename)


-------------------------------------------------------------
生活就像打牌,不是要抓一手好牌,而是要尽力打好一手烂牌。

你可能感兴趣的:(【Java基础专题】IO与文件读写---使用Apache commons IO包规范文件名)