TIFF格式也叫TIF
,属于位图格式
,全名是Tag Image File Format
。
TIFF格式和JPEG及PNG都是属于一种主流且高位彩色图像格式
。
使用过扫描仪或传真的小伙伴应该还记得,很多品牌及其默认文件就是.tiff后缀。因为TIFF最初的设计目的就是在1980年左右,扫描仪厂商达成一个公用的统一的扫描图像文件格式,而不是每个厂商使用自己专有的格式造成混乱。
此部分内容参考自:https://blog.csdn.net/tony5243/article/details/123410603 ,仅作学习记录
TIFF(Tagged Image File Format)是一种基于标志域的图形,依靠指针
连接来组织数据。TIFF与其他标记语言不同的是除了图像数据还可以记录其他信息
。其他的图像格式可以嵌入到TIFF中为其所用
。TIFF有四种类型:
TIFF由四部分组成,分别是
图像由8字节的文件头
起始,文件头指向第一个文件目录。文件目录中包含了图像的各种信息
,也包含了一个指向实际图像数据的指针
。
Byte 0-1: 字节顺序标志位, 值为II
或者MM
。II表示小字节在前, 又称为little-endian。MM表示大字节在前,又成为big-endian。
Byte 2-3: TIFF的标志位,一般都是42
Byte 4-7: 第一个IFD的偏移量。可以在任意位置, 但必须是在一个字的边界,也就是说必须是2的整数倍。
由于一个TIFF文件中可以有多个图像,而一个IFD只标识一个图像的所有属性
,所以,一个TIFF文件中有几个图像,就会有几个IFD。
Byte 0-1: 表示此IFD包含了多少个DE
。每个DE只标识了图像的一个属性,那么这幅图像有N个属性就会有N个DE
。在此假设数目为n
Byte 2-(n*12+1): n个DE
Byte (n12+2)-(n12+5): 下一个IFD的偏移量,如果没有(只有一幅图像)则置为0
Byte 0-1: TAG
,即该属性的标签编号,在文件目录中按升序
排列。
Byte 2-3: 数据类型。
Byte 4-7: 数量。通过类型和数量可以确定存储此TAG的数据需要占据的字节数
Byte 8-11: 如果占用的字节数少于4
, 则数据直接存于此
。 如果超过4个
,则这里存放的是指向实际数据的指针
注:ASCII类型为文本类型,是7位ASCII码加1位二进制0;Rational为分数类型,由两个long组成,第一个是分子,第二个是分母。
这些数据可能是压缩的,也可能是未压缩的。如果经过压缩,那么压缩算法又有许多种,所以,图像数据是TIFF文件中最为复杂的部分,暂还没有哪个软件能译出所有的压缩算法。
**Byte 0-1:**值都为49,对应ASCII码为II,即小字节在前
**Byte 2-3:**值为42,TIFF标志位
**Byte 4-7:**第一个IFD的偏移量,为8e,即从8e开始是第一个IFD。该tif文件只有一张图像,因此只有一个IFD。
**Byte 008e-008f:**值为11,即有17个目录项DE,每个DE占12个字节,17个DE共占204字节;
**Byte 0090-015b:**17个DE共204字节,每个DE分析见下
**Byte 015c-015f:**值为0,即没有第二个图像(IFD)
一、主体不同
tif:是一种灵活的位图格式,主要用来存储包括照片和艺术图在内的图像。
jpg:常见的一种图像格式,它由联合图像专家组开发。
二、特点不同
tif:对图像信息的存放灵活多变,可以支持很多色彩系统,而且独立于操作系统,因此得到了广泛应用。
jpg:用有损压缩方式去除冗余的图像和彩色数据,在获得极高的压缩率的同时能展现十分丰富生动的图像,即可以用较少的磁盘空间得到较好的图片质量
三、优势不同
tif:在各种地理信息系统、摄影测量与遥感等应用中,要求图像具有地理编码信息,例如图像所在的坐标系、比例尺、图像上点的坐标、经纬度、长度单位及角度单位。
jpg:能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示。
tif图片的编码格式一般是16bit
的,在使用python-opencv读取tif文件时,为了保留其编码格式
,我们需要用以下的方式:
import numpy as np
import cv2
img = cv2.imread('demo.tif', -1)
print(img.dtype)
输出结果为:uint16
对于opencv中imread函数最后的参数解释如下:
当参数>0时,opencv读取的是3通道的彩色图
(灰度图也会被默认转化成彩色图
),编码格式会转化成8bit
当参数=0
时,opencv读取的是1通道灰度图
,编码格式会转化成8bit
当参数<0
时,opencv会按照原图的格式读取
,编码格式会返回16bit
的
另外一种读取tif图片的方式是使用tifffile库进行读取,在python中你可以先通过pip安装:
pip install tifffile
import tifffile as tiff
import numpy as np
a = tiff.imread('demo.tif')
print(a.shape)