索引图像读取与分析理解

索引图像

最近在做语义分割相关的内容,但是一直对数据集(如voc2012)的图像格式不太清楚,查阅资料在此进行记录。
相关链接:
1、索引图像概念:https://baike.baidu.com/item/索引图像
2、博客解释:https://blog.csdn.net/xuyunyunaixuexi/article/details/85016882

1、索引图像读取

索引图像的读取是用matlab进行读取的,方式如下:
(本人是加载的是VOC2012的索引图像,图像地址自行更改)

[X, map1] = imread('.../VOC2012data/VOCdevkit/VOC2012/SegmentationObject/2007_000032.png');
[Y, map2] = imread('.../VOC2012data/VOCdevkit/VOC2012/SegmentationObject/2007_000033.png');

相关的知识点,百度百科已经解释的很详细的,也如上面代码所示,每一个索引格式的图像可以得到一个矩阵和map映射图。
矩阵中的像素值是多少,就对应了map映射图中RGB的各成分比例。
如下图所示,显示了一部分的map映射图表(即map1)。
索引图像读取与分析理解_第1张图片
如下图所示,显示了图像的一部分矩阵(即X)。
索引图像读取与分析理解_第2张图片
那么可以通过这两者找到对应图像某位置的颜色。
如由图像矩阵图知道,第108行,第138列的像素值是2,而对应map映射图知道第3行(像素值是从0开始)的RGB编码的比例,即知道了该位置的颜色。

2、索引图像分析

链接中的博客已经介绍得非常详细了,如下图所示,该索引图像的位深度为8(位深度可以自行选择),那么2的8次方即是256,即该索引图像最多可以表示256种颜色(每一种颜色已经通过像素值一一对应好的)。同时由我们的matlab的读取也可以发现,map映射表有256个对应值,图像矩阵表格最小值为0,最大值为255,也验证了深度即是8。
索引图像读取与分析理解_第3张图片

你可能感兴趣的:(图像分析与理解)