EXIF格式分析及通过XML处理(3)

EXIF格式分析及通过XML处理<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

猛禽[Mental Studio](个人专栏)(BLOG)

http://mental.mentsu.com

下面是一个典型的

EXIF JPEG 文件格式分析结果(源文件为一张用 Nikon CoolPixel 775 相机拍摄的照片,所用的 EXIF 版本是 2.1 ,与 2.2 版差别不大):

JPEG SOI : FF D8 // 图片起始

JPEG APP1: FF E1

APP1 Size : 1C 45 // 注意:前面这三个WORD都是big endian

EXIF Flag : 'Exif', 0, 0

TIFF Header:

Byte Order: 'II'

Flag : 2A 00

IFD0 offset : 08 00 00 00

Entries Count : 0B 00 // 11

IFD Entry :

Tag : 0E 01 // Image Description 图像说明

Type : 02 00 // ASCII

Size : 0B 00 00 00

Value : 92 00 00 00 // from TIFF Header

IFD Entry:

Tag : 0F 01 // Make 制造

Type : 02 00

Size : 06 00 00 00

Value: B2 00 00 00

IFD Entry:

Tag : 10 01 // Model 型号

Type : 02 00

Size : 05 00 00 00

Value: CA 00 00 00

IFD Entry:

Tag : 69 87 // EXIF IFD

Type : 04 00 // LONG

Size : 01 00 00 00

Value: 1C 01 00 00 // Offset of EXIF IFD

END of IFD0

IFD1 Offset : 18 03 00 00

... // 存放IFDValue数据

EXIF IFD :

Entries Count : 18 00

IFD Entry :

Tag : 9A 82 // Exposure time

...

END of EXIF IFD

Next IFD : 00 00 00 00 // 按标准IFD链表约定,表示没有后继IFD

... // 存放EXIF IFDValue数据

IFD1 : // EXIF中用于存放缩略图

Entries Count : 06 00

IFD Entry :

Tag : 03 01

...

END of IFD1

Next IFD : 00 00 00 00 // EXIF只用到两个TIFF IFD

... // Thumbnail etc.

// end of TIFF header

// 其它JPEG Marker segments

JPEG EOI : FF D9 // 图片结束

EXIF格式的分析,至此基本上告一个段落了。从分析结果上可以看出,EXIF是一种非常灵活的格式,具有非常好的可扩充性,要想较好地处理其中的相关数据也是比较麻烦的。

其困难主要在于几个方面:

1、对于每种不同的IFD Entry Type,需要用不同的方法获取数据,特别是对于数据长度不同时,可能采用不同的数据存储方式,而IFD Entry的数量又可能很多,每个Entry根据Tag不同又有不同的意义

2、EXIF IFD是作为TIFF IFD的子链表形式存在(因为EXIFIFD里定义了不同于TIFF标准的Tag,要保持与标准的TIFF格式互用,必须这样做),使得原来的链表结构变成了树形结构

3、Tag的种类和数量非常之大,在EXIF规范里定义了各个Tag的支持级别(见[1]4.6.8),光是JPEG格式下必须支持的Tag就有十几个,TIFF格式更多,再加上可选支持的Tag,有几十上百个,并且还存在未来继续扩充的可能

4、对于可支持不同语言的软件来说,同一个Tag的意义要用每一种支持的语言表达一次,如果将这部分处理写入代码,对于增加新的语言支持会带来不必要的麻烦

为了解决这些困难,必须要找到一个同样是非常灵活的处理方法来处理EXIF数据。而XML正是这样一种方法。从前面的分析结果可以看出,EXIF的数据记录方式是层层嵌套的树形结构,是非常适合用XML的,因为XML也是这样的树形结构。

通过定义一套XML标签,然后将EXIF数据转换成XML文档,可以最大限度地保留EXIF数据的原始内容及结构。并且作为一种通用格式,XML可以很方便地进行再处理,比如:通过XSLT进行转换,使之成为HTML或其它便于显示的格式;或者将此XML传递给其它软件作进一步处理等。

对于前面说到的困难,XML都很好地解决:

1、不同类型的问题,通过转换为XML,将所有的Value都转换成字符串,便于统一处理

2、XML本来就是树形结构,可以在转换的时候方便地通过调整节点位置,使各IFD统一处理

3、可以将所有的Tag原样导出到XML中,在以后对XML的处理时再根据Tag进行处理,比如通过修改XSL文件实现对新增Tag的支持

4、同样是对XML处理时才需要面对具体的Tag,比如为不同的语言提供相应的XSL文件即可

(待续)

你可能感兴趣的:(Exif)