转自 这里
众所周知,微软的文件系统经历了 fat->fat32->NTFS 的技术变革。且不论安全和文件组织方式上的革新,单就文件名而言,已经从古老的 DOS 8.3 文件格式(仅支持最长 8 个字符的文件名和 3 个字符的后缀名)转变为可以支持长达 255 个字符的文件名。而对于路径长度,NTFS 也已经支持长达 32768 个字符的路径名。
然而,Windows 操作系统并没有完全放开路径名长度的限制,在 windef.h 中,可以找到如下的宏:
#define MAX_PATH 260 |
事实上,所有的 Windows API 都遵循这个限制。因此,每当我们试图更改某一文件的文件名时,当输入的文件名长度 ( 全路径 ) 到达一定限度时,虽然文件名本身还未达到 255 个字符的限制,但是任何输入将不再被接受,这其实正是由于操作系统不允许 260 个字符(byte)的文件全路径。
实际应用中,这种 260 个字符的全路径的限制给应用开发带来了很大的不便。试想如下应用:我们希望给应用服务器增加一个本地 cache 的功能,该功能可以把远程服务器上的文件留下一个本地的副本。一个合理的实现可以把 url 映射为文件名,当 url 很长时,cache 文件的长度也会很长。当文件名长度超过 255,我们可以把映射文件名的前 255 个字符作为目录名称。但是,我们仍然无法解决 260 个字符的全路径限制。另外,如果一个应用软件的目录结构过深,很容易出现某些文件名长度(含路径)超过 260 个字符,并因此造成安装或删除的失败。总而言之,该限制给我们的开发测试工作带来了诸多不便。
对于一些网络服务器,往往需要将 Java 代码用于上层逻辑控制 / 事务处理的开发,同时将 C/C++ 用于底层核心功能的实现。为此,我们研究了这两种程序语言对长路径名文件的支持情况。其中,对于 Java,比较了两个常用版本 1.4 和 5.0 对长路径支持的差异性;对于 C/C++ 语言的局限性,提出了我们的解决方法。
实验环境 :
操作系统: Windows xp
文件系统: NTFS 文件系统
Java 编译环境: IBM JDK 1.4.2 以及 IBM JDK 5.0
C++ 编译环境: VC.net
|
在 Java 中使用长路径名文件
Java 语言并不需要对长路径名文件进行特殊的处理,就可以支持长路径名文件的创建、读写和删除操作等基本操作。但是,JDK 1.4.2 和 JDK 5.0 在长路径的支持上是不同的,JDK 1.4.2 并不是完全支持所有的长路径名文件操作,比如访问文件属性的操作是不支持的。我们设计了如下代码来验证 JDK 1.4.2 和 JDK 5.0 对长路径名文件支持的区别。
清单 1. 对长路径名文件操作的 Java 实验代码:
try { String fileName = "E://VerylongpathVerylongpathVerylongpath VerylongpathVerylongpathVerylongpathVerylongpath VerylongpathVerylongpathVerylongpathVerylongpath// VerylongpathVerylongpathVerylongpathVery longpathVerylongpathVerylongpathVerylongpath VerylongpathVerylongpathVerylongpathVerylongpa th.txt"; System.out.println("Filename: " + fileName); System.out.println("File path length: " + fileName.length()); String renameFileName = "E://VerylongpathVerylongpathVerylongpath VerylongpathVerylongpathVerylongpathVerylongpath VerylongpathVerylongpathVerylongpathVerylongpath//Short.txt"; //Create the file. File file = new File(fileName); if (!file.exists()) file.createNewFile(); if (file.exists()) System.out.println("The file exists!"); if (file.canRead()) System.out.println("The file can be read!"); if (file.canWrite()) System.out.println("The file can be written!"); if (file.isFile()) System.out.println("It's a file!"); //Write to the created file. FileOutputStream out = new FileOutputStream(file); PrintStream p = new PrintStream(out); p.println("This is only a test!"); p.close(); //Read the information from that file. BufferedReader br = new BufferedReader(new FileReader(file)); StringBuffer sb = new StringBuffer(); while (true) { String sl = br.readLine(); if (sl == null) { break; } else { sb.append(sl + "/n"); } } br.close(); System.out.println("The content in the file:"); System.out.print("/t" + sb.toString()); //File rename File newfile = new File(renameFileName); if (newfile.exists()) System.out.println(renameFileName + "exsited"); else { if (file.renameTo(newfile)){ System.out.println("Rename sucessful!"); } else { System.out.println("Rename failed!"); } } //delete file if (file.delete()) System.out.println("The old file deleted!"); if (newfile.delete()) System.out.println("The renamed file deleted!"); } catch (IOException e) { //Error happened e.printStackTrace(); System.out.println("Error occurs in writing to the file."); } } |
清单 2. 使用 ibm-java2-sdk-142 的结果
Filename: E:/VerylongpathVerylongpathVerylongpath VerylongpathVerylongpathVerylongpathVerylongpathVer ylongpathVerylongpathVerylongpathVerylongpath/ VerylongpathVerylongpathVerylongpathVerylong pathVerylongpathVerylongpathVerylongpath VerylongpathVerylongpathVerylongpathVerylongpath.t xt File path length: 272 The content in the file: This is only a test! Rename failed! The old file deleted! |
从实验结果来看,JDK 1.4.2 得到了该长路径名文件的内容,因此,对于该长路径名文件的创建以及读写操作都是支持的。但是对比下文使用 JDK 5.0 的结果,可以看到,所有对于文件属性的判断都是错误的,同时,重命名的操作也无法实现。更为重要的是,JDK 1.4.2 存在着一个很致命的问题,即方法 File.exists()
是失效的。通常,在删除文件前,需要调用该方法判断文件是否存在,对于 JDK 1.4.2,如果直接去删除一个不知道是否存在的文件,就会存在比较大的风险。因此,JDK 1.4.2 在 Windows 平台对长路径名文件的操作只是有限的支持,使用的时候,一定要注意。
清单 3. 使用 ibm-java2-sdk-50 的结果
Filename: E:/VerylongpathVerylongpathVerylongpath VerylongpathVerylongpathVerylongpathVerylongpathVer ylongpathVerylongpathVerylongpathVerylongpath/ VerylongpathVerylongpathVerylongpathVerylong pathVerylongpathVerylongpathVerylongpath VerylongpathVerylongpathVerylongpathVerylongpath.t xt File path length: 272 The file exists! The file can be read! The file can be written! It's a file! The content in the file: This is only a test! Rename sucessful! The renamed file deleted! |
从实验中可以清楚的看到,在版本 JDK 5.0 中,所有的文件操作(新建、读写、属性操作、重命名、删除等)都能够得到正确的处理。使用 JDK 5.0 就可以完全不用担心长路径名文件的使用问题。
|
在 C/C++ 中使用长路径名文件
相对于 JDK 5.0 不需要任何改动就可以支持长路径名文件,在 C/C++ 中使用超过 260 个字符的路径长度的文件,会复杂得多。下面介绍两种支持长路径名文件的方法。
方法一:使用 Unicode 版本的 API
从微软官方网站 Path Field Limits,可以查到,使用 Unicode 版本的 API,对于使用 NTFS 文件系统的 Windows NT 4.0, Windows 2000, Windows XP Home Edition, Windows XP Professional 和 Windows Server 2003 操作系统,可以支持 32768 字节的文件路径长度。同时,路径名必须使用 //?/ 的前缀。依照这个思路,我们设计了实验。
清单 4. 对长路径名文件操作的 C 的示例代码(Unicode API)
{ FILE *from, *to; char filename[1024]; strcpy(filename,"////?//E://VerylongpathVerylongpathVerylongpathVerylongpathVerylongpathV erylongpathVerylongpathVerylongpathVerylongpathVerylongpathVerylongpath//VerylongpathVeryl ongpathVerylongpathVerylongpathVerylongpathVerylongpathVerylongpathVerylongpathVerylongpat hVerylongpathVerylongpath.txt"); int iL1=MultiByteToWideChar(CP_ACP, 0, filename, strlen(filename), NULL, 0); WCHAR* wfilename=new WCHAR[iL1+1]; wfilename[iL1] = '/0'; int iL2=MultiByteToWideChar(CP_ACP, 0, filename, strlen(filename), wfilename, iL1); from = _wfopen( wfilename ,L"rb"); to = fopen(".//longpath.txt", "wb"); if((from ==NULL)||(to==NULL)) return -1; char buffer[1024]; int count = 0; while ( (count = fread(buffer, sizeof(char), 1024, from)) != 0) fwrite( buffer, sizeof(char), count, to); delete []wfilename; fclose (from); fclose(to); } |
使用如上的方法,我们可以拷贝某长路径名的文件到当前文件夹中。从试验结果看,该方法是有效的。但是,由于该方法要求系统使用 Unicode 的 API,同时需要更改路径名称以及编码方式。因此,对于一个已经存在的系统,由于需要改变所有文件操作相关的 API,因此改动将会很大。
方法二:创建 8.3 格式的短路径名
对于每一个长路径名,都有一个 8.3 格式(8 个字符的文件名和 3 个字符的后缀名)的短路径名与其相对应,任意的文件夹或者文件名都可以映射成一个 8 字符的文件名(A~B),其中 A 是文件名前缀,B 是表示字母序的顺序。操作系统可以保证这样的映射是一对一的,只要使用 GetShortPathName()
将长路径名转成相应的短路径名,就可以进行对该文件进行普通的文件操作。同时,在任何时候都可以用函数 GetLongPathName()
把 8.3 格式的短路径名恢复成初始的长路径名。
如 GetShortPathName Function 叙述,我们需要一个 Unicode 版本的 API,同时在路径名前加上 //?/ 的前缀,才能实现长短路径名间的切换。但从实验来看,即使不使用 Unicode 的 API,依然可以实现上述功能。
清单 4. 对长路径名文件操作的 c 的示例代码(ShortPath)
{ char pathName [1024]; strcpy(pathName,"////?//E://VerylongpathVerylongpathVerylongpathVerylongpathVerylongpathV erylongpathVerylongpathVerylongpathVerylongpathVerylongpathVerylongpath//VerylongpathVeryl ongpathVerylongpathVerylongpathVerylongpathVerylongpathVerylongpathVerylongpathVerylongpat hVerylongpathVerylongpath.txt"); const int MaxPathLength = 2048; char shortPath[MaxPathLength]; if (strlen(pathName) >= MAX_PATH) { char prePath[] = "////?//"; if (strlen(pathName) >= MaxPathLength - strlen(pathName)) return false; sprintf(shortPath, "%s%s", prePath, pathName); for (int iPathIndex = 0; iPathIndex < strlen(shortPath); iPathIndex++) if (shortPath[iPathIndex] == '/') shortPath[iPathIndex] = '//'; int dwlen = GetShortPathName(shortPath, shortPath, MaxPathLength); if (dwlen <= 0) return false; } } |
经过上述的代码,超过 MAX_PATH
限制的路径名都可以转变成一个 8.3 格式的短路径名,可以把这个文件名 (shortPath)
作为后续文件操作函数的参数。这种情况下,对于该文件的所有操作都可以被支持了。我们用这种缩短路径名长度的方式解决了长路径名文件的操作问题。
更多参考:http://connect.microsoft.com/VisualStudio/feedback/ViewFeedback.aspx?FeedbackID=94094