读取PNG颜色索引数据

  在某些应用中,可能需要PNG图片每个像素颜色索引值。如在目标检测中,VOC2012数据库中对每个目标类进行了分割标注,不同类别分别采用不同的颜色索引值。如0 表示背景, 1表示飞机等。opencv中的imread函数可以直接读出png RGB颜色信息,但是不能读出每个像素的颜色索引值。所以,本文给出了一个读取png图片每个像素颜色索引的函数。该函数依赖libpng库,并且和opencv相结合,利用opencv的Mat数据容器保存读出的颜色索引值。libpng库主页网址为http://libmng.com/pub/png/libpng.html。

下面是函数源代码,包括两个部分一个是读取png图片每个像素颜色索引的函数indexfromPNG,和测试函数main。测试图片是将原图片缩放到尺寸为11*15, 便于输出结果。该测试实在ubuntu14.04系统下进行。

#include
#include
#include
#include
#include
#include
#include
#include
using namespace std;
using namespace cv;

#define PNG_BYTES_TO_CHECK 4

string filepath= "./2007_000063_1.png";
int indexfromPNG(string filepath, Mat& img)
{
    FILE *pic_fp;
    //read png file
    pic_fp = fopen(filepath.c_str(), "rb");
    if(pic_fp == NULL)
    {
        cout<<"file open failed!"<

测试所用元尺寸图片如下,可以看出包括黑、白、红、绿这四种颜色。

读取PNG颜色索引数据_第1张图片

输出结果如下图,可以看出有四种索引值0, 1, 2, 255.

读取PNG颜色索引数据_第2张图片

函数中一个关键地方是png_read_png(png_ptr, info_ptr, PNG_TRANSFORM_IDENTITY, 0)。 PNG_TRANSFORM_IDENTITY确定对png解码结果不做任何改变,直接输出像素颜色索引值。而不像opencv直接设置为输出RGB颜色值。其函数其他的设置参数如下:

PNG_TRANSFORM_IDENTITY      No transformation
PNG_TRANSFORM_PACKING       Pack 1, 2 and 4-bit samples
PNG_TRANSFORM_PACKSWAP      Change order of packed pixels to LSB first
PNG_TRANSFORM_INVERT_MONO   Invert monochrome images
PNG_TRANSFORM_SHIFT         Normalize pixels to the sBIT depth
PNG_TRANSFORM_BGR           Flip RGB to BGR, RGBA to BGRA
PNG_TRANSFORM_SWAP_ALPHA    Flip RGBA to ARGB or GA to AG
PNG_TRANSFORM_INVERT_ALPHA  Change alpha from opacity to transparency
PNG_TRANSFORM_SWAP_ENDIAN   Byte-swap 16-bit samples
PNG_TRANSFORM_STRIP_FILLER        Strip out filler bytes (deprecated).
PNG_TRANSFORM_STRIP_FILLER_BEFORE Strip out leading filler bytes
PNG_TRANSFORM_STRIP_FILLER_AFTER  Strip out trailing filler bytes
该信息可以在libpng安装包中的libpng-manual.txt中得到。


你可能感兴趣的:(软件配置)