@Test
public void whenUsingJava7_thenSuccess() {
Path path = new File("product.png").toPath();
String mimeType = Files.probeContentType(path);
assertEquals(mimeType, "image/png");
}
此方法需要java 7及以上。Files.probeContentType
使用已经安装的FileTypeDetector
实现类的probeContentType
方法来解析获得文件的的Mime Type。
如果其中一个实现能够识别解析该文件则立即返回,如果不能则使用系统默认实现类来解析识别。对于使用系统默认实现可能导致的失败会由于系统的差异而不同。另外如果文件不存在或者文件没有后缀名也会导致失败。
目前测试基本文件类型都能够解析成功,附上
Files.probeContentType
源码
public static String probeContentType(Path path)
throws IOException
{
// try installed file type detectors
for (FileTypeDetector detector: FileTypeDetectors.installeDetectors) {
String result = detector.probeContentType(path);
if (result != null)
return result;
}
// fallback to default
return FileTypeDetectors.defaultFileTypeDetector.probeContentType(path);
}
URLConnection.getContentType()
方法来获取Mine Type,但是这个方法的主要缺陷就是太慢了。@Test
public void whenUsingGetContentType_thenSuccess(){
File file = new File("product.png");
URLConnection connection = file.toURL().openConnection();
String mimeType = connection.getContentType();
assertEquals(mimeType, "image/png");
}
URLConnection.getContentType()
方法来获取Mine Type。这个方法依赖于内部的FileNameMap
类,通过文件扩展名来匹配MineType。同时也可以调用guessContentTypeFromStream()
方法传入一个输入流,通过文件的前几个字符判断文件的MineType。@Test
public void whenUsingGuessContentTypeFromName_thenSuccess(){
File file = new File("product.png");
String mimeType = URLConnection.guessContentTypeFromName(file.getName());
assertEquals(mimeType, "image/png");
}
URLConnection.getFileNameMap()
。这个方法先通过URLConnection获取其内置的所有Mine Type列表,之后通过文件名取得对应值。URLConnection内置的类型是有限,默认加载路径为JRE_HOME/lib/content-types.properties
,可以设置content.types.user.table
属性自定义拓展改该列表。@Test
public void whenUsingGetFileNameMap_thenSuccess(){
File file = new File("product.png");
FileNameMap fileNameMap = URLConnection.getFileNameMap();
String mimeType = fileNameMap.getContentTypeFor(file.getName());
assertEquals(mimeType, "image/png");
}
System.setProperty("content.types.user.table","" );
第二点中的方法和第三点本质上是相同的,通过查看
URLConnection.guessContentTypeFromName
源码可知。
public static String guessContentTypeFromName(String fname) {
return getFileNameMap().getContentTypeFor(fname);
}
MimeTypesFileTypeMap
通过文件后缀获取Mie Type,这里的参数可以是文件名也可以是File对象。
@Test
public void whenUsingMimeTypesFileTypeMap_thenSuccess() {
File file = new File("product.png");
MimetypesFileTypeMap fileTypeMap = new MimetypesFileTypeMap();
String mimeType = fileTypeMap.getContentType(file.getName());
assertEquals(mimeType, "image/png");
}
MimeTypesFileTypeMap
通过查找加载mime.types
文件来进行类型解析,该类加载文件的顺序如下:
USER.HOME
目录下的mime.types文件。这里所说的加载顺序应该来自
MimeTypesFileTypeMap
类的构造方法中定义的,第一点中的以编程方式添加应该是下面的dbv.addElement((Object)null);
行,window下反编译出来是null。如果找不到具体加载的哪个文件可以本地debug试试。
public MimetypesFileTypeMap() {
Vector dbv = new Vector(5);
MimeTypeFile mf = null;
dbv.addElement((Object)null);
LogSupport.log("MimetypesFileTypeMap: load HOME");
String system_mimetypes;
try {
system_mimetypes = System.getProperty("user.home");
if (system_mimetypes != null) {
String path = system_mimetypes + File.separator + ".mime.types";
mf = this.loadFile(path);
if (mf != null) {
dbv.addElement(mf);
}
}
} catch (SecurityException var6) {
}
LogSupport.log("MimetypesFileTypeMap: load SYS");
try {
system_mimetypes = System.getProperty("java.home") + File.separator + "lib" + File.separator + "mime.types";
mf = this.loadFile(system_mimetypes);
if (mf != null) {
dbv.addElement(mf);
}
} catch (SecurityException var5) {
}
LogSupport.log("MimetypesFileTypeMap: load JAR");
this.loadAllResources(dbv, "META-INF/mime.types");
LogSupport.log("MimetypesFileTypeMap: load DEF");
mf = this.loadResource("/META-INF/mimetypes.default");
if (mf != null) {
dbv.addElement(mf);
}
this.DB = new MimeTypeFile[dbv.size()];
dbv.copyInto(this.DB);
}
mime.types定义样例如下:
type=application/octet-stream exts=bin
其他样例参考
jMimeMagic是一个限制性许的库,可以通过该库去获取Mine type。maven 依赖配置如下(版本可依据当前最新配置):
<dependency>
<groupId>net.sf.jmimemagicgroupId>
<artifactId>jmimemagicartifactId>
<version>0.1.5version>
dependency>
使用代码如下:
@Test
public void whenUsingJmimeMagic_thenSuccess() {
File file = new File("product.png");
Magic magic = new Magic();
MagicMatch match = magic.getMagicMatch(file, false);
assertEquals(match.getMimeType(), "image/png");
}
该函数可以使用流数据,因此文件可以不存在。
这说的应该是
getMagicMatch
方法的重载函数,可以直接使用bye[],如果使用File作为参数文件是必须存在的。
Apache Tika是一个工具集,可检测并从各种文件中提取元数据和文本。
它具有丰富而强大的API,并带有tika-core,我们可以利用它来检测fi的MIME类型。
maven依赖配置如下:
<dependency>
<groupId>org.apache.tikagroupId>
<artifactId>tika-coreartifactId>
<version>1.18version>
dependency>
java示例代码如下
@Test
public void whenUsingTika_thenSuccess() {
File file = new File("product.png");
Tika tika = new Tika();
String mimeType = tika.detect(file);
assertEquals(mimeType, "image/png");
}
The library relies on magic markers in the stream prefix, for type resolution.(这句没懂,大概意思应该是通过文件前面几个字符判断Mine Type)。
在这篇文章中我们使用了好几种方式获取文件的Mine Type,除此之外我们也分析了几种方法。文章中使用的完整代码gitHub链接