在做web应用时候,通过web扩展名判断上存文件类型,这个是我们常使用的。有时候我们这样做还不完善。可能有些人上存一些文件,但是他通过修改扩展名,让在我们的文件类型之内。 单实际访问时候又不能展示(因为扩展名与文件内容不符)。下面这个php类,可能能够给我们带来帮助。
首先说明下,上面文件头与文件类型映射关系来自网上,如果你有新的文件需要检查,只需要将映射加入即可。 如果你需要知道文件头信息,可以通过工具:winhex打开标准文件查找。如:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
|
<?php
/*通过文件名,获得文件类型*
*@author chengmo QQ:8292669*
*@copyright <A href="http://www.xuehuwang.com">http://www.xuehuwang.com/</A> 2010-10-17
*@version 0.1
*$filename="d:/1.png";echo cFileTypeCheck::getFileType($filename); 打印:png
*/
class
cFileTypeCheck
{
private
static
$_TypeList
=
array
();
private
static
$CheckClass
=null;
private
function
__construct(
$filename
)
{
self::
$_TypeList
=
$this
->getTypeList();
}
/**
*处理文件类型映射关系表*
*
* @param string $filename 文件类型
* @return string 文件类型,没有找到返回:other
*/
private
function
_getFileType(
$filename
)
{
$filetype
=
"other"
;
if
(!
file_exists
(
$filename
))
throw
new
Exception(
"no found file!"
);
$file
= @
fopen
(
$filename
,
"rb"
);
if
(!
$file
)
throw
new
Exception(
"file refuse!"
);
$bin
=
fread
(
$file
, 15);
//只读15字节 各个不同文件类型,头信息不一样。
fclose(
$file
);
$typelist
=self::
$_TypeList
;
foreach
(
$typelist
as
$v
)
{
$blen
=
strlen
(pack(
"H*"
,
$v
[0]));
//得到文件头标记字节数
$tbin
=
substr
(
$bin
,0,
intval
(
$blen
));
///需要比较文件头长度
if
(
strtolower
(
$v
[0])==
strtolower
(
array_shift
(unpack(
"H*"
,
$tbin
))))
{
return
$v
[1];
}
}
return
$filetype
;
}
/**
*得到文件头与文件类型映射表*
*
* @return array array(array('key',value)...)
*/
public
function
getTypeList()
{
return
array
(
array
(
"FFD8FFE1"
,
"jpg"
),
array
(
"89504E47"
,
"png"
),
array
(
"47494638"
,
"gif"
),
array
(
"49492A00"
,
"tif"
),
array
(
"424D"
,
"bmp"
),
array
(
"41433130"
,
"dwg"
),
array
(
"38425053"
,
"psd"
),
array
(
"7B5C727466"
,
"rtf"
),
array
(
"3C3F786D6C"
,
"xml"
),
array
(
"68746D6C3E"
,
"html"
),
array
(
"44656C69766572792D646174"
,
"eml"
),
array
(
"CFAD12FEC5FD746F"
,
"dbx"
),
array
(
"2142444E"
,
"pst"
),
array
(
"D0CF11E0"
,
"xls/doc"
),
array
(
"5374616E64617264204A"
,
"mdb"
),
array
(
"FF575043"
,
"wpd"
),
array
(
"252150532D41646F6265"
,
"eps/ps"
),
array
(
"255044462D312E"
,
"pdf"
),
array
(
"E3828596"
,
"pwl"
),
array
(
"504B0304"
,
"zip"
),
array
(
"52617221"
,
"rar"
),
array
(
"57415645"
,
"wav"
),
array
(
"41564920"
,
"avi"
),
array
(
"2E7261FD"
,
"ram"
),
array
(
"2E524D46"
,
"rm"
),
array
(
"000001BA"
,
"mpg"
),
array
(
"000001B3"
,
"mpg"
),
array
(
"6D6F6F76"
,
"mov"
),
array
(
"3026B2758E66CF11"
,
"asf"
),
array
(
"4D546864"
,
"mid"
));
}
public
static
function
getFileType(
$filename
)
{
if
(!self::
$CheckClass
) self::
$CheckClass
=
new
self(
$filename
);
$class
=self::
$CheckClass
;
return
$class
->_getFileType(
$filename
);
}
}
|
通过WinHex软件来获取文件的头信息:
可以看到:png 文件,头是4个字节(头标记是多少字节需要自己查相关资料确定),对应是:89504E47
调用方法:
1
2
3
4
|
$filename
=
"d:/1.png"
;
echo
$filename
,
"\t"
,cFileTypeCheck::getFileType(
$filename
),
"\r\n"
;
$filename
=
"d:/test.doc"
;
echo
$filename
,
"\t"
,cFileTypeCheck::getFileType(
$filename
),
"\r\n"
;
|
输出为:
1
2
|
d:/1.png png
d:/test.doc xls/doc
|