libmagic通过mime来识别文件类型

看过《文件类型识别的实现思路》文章的朋友应该知道,如果我们通过libmagic返回的描述信息来进行文件识别,有一个麻烦的地方是,我们无法获取到一个完整的文件描述信息列表,因为magic.mgc是二进制文件,我们看不到。

所以我们这里采用一种变通的办法,就是通过文件资源的mime来判断,mime的文件可以在系统的/etc/mime.types中找到,内容示例如下:

libmagic通过mime来识别文件类型_第1张图片

比如想识别一个文件是不是jpg,通过查看mime.types文件,我们知道jpg对应的mime是image/jpeg,那么我们可以将文件通过libmagic识别,返回的mime与image/jpeg进行比较,这个比较是字符串的比较,可以用多模AC算法或者是哈希算法,就可以很容易的知道一个文件是不是jpg文件了。

这里还要说一下, 《libmagic文件类型识别库的使用》一文中,如果想识别的文件类型返回mime的话,只需要在magic_open的参数中指定一下MAGIC_MIME这个标记就行了:

int main(int argc ,char *argv[])
{
char *mgc_file="share/misc/magic.mgc";

int flags = 0;
   flags |= MAGIC_MIME;
magic_t ctx = magic_open(flags);
if (ctx == NULL)
   {
printf("magic open failed\n");
goto error;
   }

   ......   
}

如果是用file命令,加-i参数也可以看到mime,例如:

libmagic通过mime来识别文件类型_第2张图片

好了,libmagic通过mime来进行文件类型识别的方法就讲到这里了。

至此,文件识别系列的文章就结束了,点击左下角阅读原文可以看到整个系列的文章。有问题的朋友可以进技术交流群获取(先加我wx,备注加群)。喜欢文章内容的朋友,记得关注并加星标

你可能感兴趣的:(文件类型识别,文件类型,文件格式,文件识别,网络安全)