目录
OpenCV 中像素遍历常用的几种方法
一、IplImage 结构
1.1、IplImage 灰度图像
1)直接访问
2)指针访问
行遍历:
行遍历:
列遍历:
1.2、IplImage 彩色图像(三通道)
1)使用指针的遍历方法如下:
行遍历:
二、Mat 类
Mat类的内存管理
2.1 Mat 灰度图像
2.2 Mat 彩色图像
方法1、
方法2、
方法3、
方法4、
计算算法耗时
【如果你要走,就早点走,就赶紧走;如果不走,也别在最能拼搏的年纪就选择了稳定,更别觉得这世界有什么稳定的工作,你现在享的福都是假象,都会在以后的某一天全部消失。生活是自己的,奋斗也不是为了别人,拼搏是每天必做的事情,只有每天进步才是最稳定的生活。】
在介绍OpenCV 中像素遍历的几种方法之前,先了解一下OpenCV中存储图像的数据结构IplImage 与 Mat。IplImage 是OpenCV2.1之前旧版本的接口,之后的OpenCV新版本中使用的是Mat。早期的 OpenCV 中,使用 IplImage 和 CvMat 数据结构来表示图像。IplImage和 CvMat 都是 C 语言的结构。使用这两个结构的问题是内存需要手动管理,开发者必须清楚的知道何时需要申请内存,何时需要释放内存。这个开发者带来了一定的负担,开发者应该将更多精力用于算法设计,因此在新版本的 OpenCV 中引入了 Mat 类。新加入的 Mat 类能够自动管理内存。使用 Mat 类,你不再需要花费大量精力在内存管理上。而且你的代码会变得很简洁,代码行数会变少。
IplImage是OpenCV中CxCore部分基础的数据结构,用来表示图像,其中Ipl是Intel Image Processing Library的简写。以下是IplImage的结构分析(来自OpenCV中文网站:http://www.opencv.org.cn/index.php/Cxcore%E5%9F%BA%E7%A1%80%E7%BB%93%E6%9E%84#IplImage)
typedef struct _IplImage
{
int nSize; /* IplImage大小,=sizeof(IplImage)*/
int ID; /* 版本 (=0)*/
int nChannels; /* 大多数OPENCV函数支持1,2,3 或 4 个通道 */
int alphaChannel; /* 被OpenCV忽略 */
int depth; /* 像素的位深度: IPL_DEPTH_8U, IPL_DEPTH_8S, IPL_DEPTH_16U,
IPL_DEPTH_16S, IPL_DEPTH_32S, IPL_DEPTH_32F and IPL_DEPTH_64F 可支持 */
char colorModel[4]; /* 被OpenCV忽略 */
char channelSeq[4]; /* 被OpenCV忽略 */
int dataOrder; /* 0 - 交叉存取颜色通道,对三通道RGB图像,像素存储顺序为BGR BGR BGR ... BGR;
1 - 分开的颜色通道,对三通道RGB图像,像素存储顺序为RRR...R GGG...G BBB...B。
cvCreateImage只能创建交叉存取图像 */
int origin; /* 0 - 顶—左结构,
1 - 底—左结构 (Windows bitmaps 风格) */
int align; /* 图像行排列 (4 or 8). OpenCV 忽略它,使用 widthStep 代替 */
int width; /* 图像宽像素数 */
int height; /* 图像高像素数*/
struct _IplROI *roi;/* 图像感兴趣区域. 当该值非空只对该区域进行处理 */
struct _IplImage *maskROI; /* 在 OpenCV中必须置NULL */
void *imageId; /* 同上*/
struct _IplTileInfo *tileInfo; /*同上*/
int imageSize; /* 图像数据大小(在交叉存取格式下imageSize=image->height*image->widthStep),单位字节*/
char *imageData; /* 指向排列的图像数据 */
int widthStep; /* 排列的图像行大小,以字节为单位 */
int BorderMode[4]; /* 边际结束模式, 被OpenCV忽略 */
int BorderConst[4]; /* 同上 */
char *imageDataOrigin; /* 指针指向一个不同的图像数据结构(不是必须排列的),是为了纠正图像内存分配准备的 */
}
IplImage;
IplImage结构来自于 Intel Image Processing Library(是其本身所具有的)。OpenCV 只支持其中的一个子集:
除了上述限制,OpenCV处理ROI有不同的要求。要求原图像和目标图像的尺寸或 ROI的尺寸必须(根据不同的操作,例如cvPyrDown 目标图像的宽(高)必须等于原图像的宽(高)除以2 ±1)精确匹配,而IPL处理交叉区域,如图像的大小或ROI大小可能是完全独立的。
访问图像中每个像素过程中涉及到比较重要的两个元素是:char *imageData以及widthStep。imageData是指向存放图像像素数据的指针,而widStep是图像行大小,即以字节为单位的行数据长度。
1、一个m*n的单通道字节型图像(灰度图像),其imageData排列如下:
///IplImage* src 图像遍历的N种方法.
///
/// OK
/// 灰度图像像素遍历.直接访问.
///
/// 输入:灰度图像.
void f_grayImageRow(IplImage* src)
{
if (NULL == src->imageData)
{
printf("src not exist!!!");
return;
}
int nchannel = src->nChannels;
//IplImage* img = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);
uchar* temp = new uchar;
if (1 == nchannel)
{
for (int i = 0; i < src->height; i++)//行遍历
{
for (int j = 0; j < src->width; j++)
{
*temp = ((uchar*)(src->imageData + i * src->widthStep))[j];
if ((i > 10 && i < 50) && (j > 10 && j < 80))
{
((uchar*)(src->imageData + i * src->widthStep))[j] = 0;
}
}
}
//cvSaveImage("dst.jpg", src);
cvNamedWindow("gray", 0);
cvShowImage("gray", src);
cvWaitKey(0);
}
delete temp;
}
void f_grayImageRow1(IplImage* src)
{
if (NULL==src->imageData)
{
printf("src not exist!!!");
return;
}
int i=0;
int j=0;
int nchannel = src->nChannels;
//单通道-灰度图
uchar* upixel = nullptr;
if (1 == nchannel)
{
//方式1:
for (i = 0; i < src->height; i++)//行遍历
{
upixel = (uchar*)(src->imageData + i * src->widthStep);
for (j = 0; j < src->width; j++)
{
if ((i > 10 && i < 50) && (j > 10 && j < 80))
{
upixel[j] = 0;
}
//std::cout << "upixel=" << (*upixel) + 0 << std::endl;//+0隐式转换为整型,否则会打印出字符
}
}
//cvSaveImage("dst1.jpg", src);
cvNamedWindow("gray1",0);
cvShowImage("gray1", src);
cvWaitKey(0);
}
}
void f_grayImageRow2(IplImage* src)
{
if (NULL==src->imageData)
{
printf("src not exist!!!");
return;
}
int i=0;
int j=0;
int nchannel = src->nChannels;
//单通道-灰度图
uchar* upixel = nullptr;
if (1 == nchannel)
{
//方式2:
for (i = 0; i < src->height; i++)//行遍历
{
for (j = 0; j < src->width; j++)
{
upixel = (uchar*)(src->imageData + i * src->widthStep + j);
if ((i > 10 && i < 50) && (j > 10 && j < 80))
{
*upixel = 0;
}
//std::cout << "upixel=" << (*upixel) + 0 << std::endl;//+0隐式转换为整型,否则会打印出字符
}
}
//cvSaveImage("dst2.jpg", src);
cvNamedWindow("gray2",0);
cvShowImage("gray2", src);
cvWaitKey(0);
}
}
///IplImage* src 图像遍历的N种方法.
///
/// OK
/// 灰度图像像素遍历.用指针来访问.
///
/// 输入:灰度图像.
void f_grayImageCol(IplImage* src)
{
if (NULL==src->imageData)
{
printf("src not exist!!!");
return;
}
int x=0;
int y=0;
int nchannel = src->nChannels;
//单通道-灰度图
uchar *upixel = nullptr;
if (1 == nchannel)
{
//方式1:
for (x = 0; x < src->width; x++)//列遍历
{
for (y = 0; y < src->height; y++)
{
//if ((i > 10 && i < 50) && (j > 10 && j < 80))
{
upixel = (uchar*)(src->imageData + y * src->widthStep + x);
*upixel = 0;
}
cvNamedWindow("gray111",0);
cvShowImage("gray111", src);
cvWaitKey(1);
//std::cout << "upixel=" << (*upixel) + 0 << std::endl;//+0隐式转换为整型,否则会打印出字符
}
}
//cvSaveImage("dst1.jpg", src);
cvNamedWindow("gray1",0);
cvShowImage("gray1", src);
cvWaitKey(0);
}
}
三通道彩色图像在字节图像中,imageData排列如下:
其中(Bi,Bj)(Gi,Gj)(Ri,Rj)表示图像(i,j)处BGR分量的值。
///
/// OK
/// 彩色图像遍历,分离出B/G/R通道的图像.
///
/// 输入:彩色图像
void f_colorImage(IplImage* src)
{
if (NULL == src->imageData)
{
printf("src not exist!!!");
return;
}
int nchannel = src->nChannels;
IplImage* b_img;
IplImage* g_img;
IplImage* r_img;
b_img = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);
g_img = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);
r_img = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);
if (3==nchannel)
{
for (int y=0; yheight; y++)
{
uchar* ptr = (uchar*)(src->imageData + y * src->widthStep);
uchar* btr = (uchar*)(b_img->imageData + y * b_img->widthStep);
uchar* gtr = (uchar*)(g_img->imageData + y * g_img->widthStep);
uchar* rtr = (uchar*)(r_img->imageData + y * r_img->widthStep);
for (int x=0; xwidth; x++)
{
/*ptr[3 * x + 0] = 0;
ptr[3 * x + 1] = 255;
ptr[3 * x + 2] = 255;*/
btr[x] = ptr[3 * x + 0];
gtr[x] = ptr[3 * x + 1];
rtr[x] = ptr[3 * x + 2];
}
}
}
cvNamedWindow("b");
cvNamedWindow("g");
cvNamedWindow("r");
cvShowImage("b", b_img);
cvShowImage("g", g_img);
cvShowImage("r", r_img);
cvWaitKey(0);
}
Mat类定义如下所示,关键的属性如下方代码所示:
class CV_EXPORTS Mat
{
public:
//一系列函数
...
/* flag 参数中包含许多关于矩阵的信息,如:
-Mat 的标识
-数据是否连续
-深度
-通道数目
*/
int flags;
//矩阵的维数,取值应该大于或等于 2
int dims;
//矩阵的行数和列数,如果矩阵超过 2 维,这两个变量的值都为-1
int rows, cols;
//指向数据的指针
uchar* data;
//指向引用计数的指针
//如果数据是由用户分配的,则为 NULL
int* refcount;
//其他成员变量和成员函数
...
};
Mat 是一个类,由两个数据部分组成:矩阵头(包含矩阵尺寸,存储方法,存储地址等信息)和一个指向存储所有像素值的矩阵的指针。矩阵头的尺寸是常数值,但矩阵本身的尺寸会依图像的不同而不同,通常比矩阵头的尺寸大数个数量级。复制矩阵数据往往花费较多时间,因此除非有必要,不要复制大的矩阵。
为了解决矩阵数据的传递,OpenCV 使用了引用计数机制。其思路是让每个Mat 对象有自己的矩阵头信息,但多个 Mat 对象可以共享同一个矩阵数据。让矩阵指针指向同一地址而实现这一目的。很多函数以及很多操作(如函数参数传值)只复制矩阵头信息,而不复制矩阵数据。 如果 Mat 类自己申请数据空间,那么该类会多申请 4 个字节,多出的 4 个字节存储数据被引用的次数。引用次数存储于数据空间的后面,refcount 指向这个位置,如图所示。当计数等于 0 时,则释放该空间。
Mat的存储形式和Matlab里的数组格式有点像,但一般是二维向量,如果是灰度图,一般存放
单通道灰度图数据存放格式:
多通道的彩色图像中,每列并列存放通道数量的子列,如RGB三通道彩色图:
注意通道的顺序反转了:BGR。通常情况内存足够大的话图像的每一行是连续存放的,也就是在内存上图像的所有数据存放成一行,这中情况在访问时可以提供很大方便。可以用 isContinuous()函数来判断图像数组是否为连续的。
cv::Mat src = cv::imread("..\\testPicture\\happyfish.jpg", cv::IMREAD_COLOR);
cv::namedWindow("0", 0);
cv::imshow("0", src);
cv::waitKey(0);
cv::Mat grayImg;
cv::cvtColor(src, grayImg, CV_RGB2GRAY);
int xwCol = src.cols;
int yhRow = src.rows;
int nchannels = src.channels();
/*
Mat类提供了一个at的方法用于取得图像上的点,它是一个模板函数,可以取到任何类型的图像上的点。
这种方法不推荐用来遍历图像,它主要用来获取或更改图像的中随机元素的。
基本用途是用来访问特定的矩阵元素(知道行数和列数)。
*/
// image.at
if (1==nchannels)
{
for (int y = 0; y < yhRow; y++)//行遍历
{
uchar* ptr = src.ptr(y);
for (int x = 0; x < xwCol; x++)
{
ptr[x] = 255 - ptr[x];
}
}
}
if (1==nchannels)
{
for (int i = 0 ; i < src.rows ; i ++)
{
for(int j = 0 ; j < src.cols ; j ++)
{
src.at(i,j) = 255-src.at(i,j);
}
}
}
//方法1:at(i,j)
//基于Mat对象的随机像素访问API实现,通过行列索引方式遍历每个像素值。
for (int y = 0; y < yhRow; y++)
{
for (int x = 0; x < xwCol; x++)
{
cv::Vec3b bgr = src.at(y, x);
bgr[0] = 255 - bgr[0];
bgr[1] = 255 - bgr[1];
bgr[2] = 255 - bgr[2];
src.at(y, x) = bgr;
}
}
//方法2
//基于Mat对象的行随机访问指针方式实现对每个像素的遍历.
for (int y = 0; y < yhRow; y++)
{
cv::Vec3b* curR = src.ptr(y);
for (int x = 0; x < xwCol; x++)
{
cv::Vec3b bgr = curR[x];
bgr[0] = 255 - bgr[0];
bgr[1] = 255 - bgr[1];
bgr[2] = 255 - bgr[2];
//src.at(y, x) = bgr;//OK
curR[x] = bgr;//OK
}
}
//方法三
//直接获取Mat对象的像素块的数据指针,基于指针操作,实现快速像素方法.
for (int y = 0; y < yhRow; y++)
{
uchar* uc_pixel = src.data + y * src.step;
for (int x = 0; x < xwCol; x++)
{
uc_pixel[0] = 255 - uc_pixel[0];
uc_pixel[1] = 255 - uc_pixel[1];
uc_pixel[2] = 255 - uc_pixel[2];
uc_pixel += 3;
}
}
//methed_1 数组访问 Spendtime:11.1927ms.
//methed_2 Vec3b指针 Spendtime:6.3479ms.
//methed_3 字节指针 Spendtime:0.1558ms.
//二、高效一点:用指针来遍历图像
void colorReducePtr(const Mat& image, Mat& outImage,int div)
{
//创建与原图像等尺寸的图像
outImage.create(image.size(),image.type());
//行数
int nr=image.rows;
//将3通道转换为1通道
int nl=image.cols*image.channels();//列数*通道数=每一行元素的个数
//双重循环,遍历所有的像素值
for(int k=0;k(k);//获取第K行的首地址
uchar* outData=outImage.ptr(k);
for(int i=0;i
//更高效的方法
//一般来说图像行与行之间往往存储是不连续的,但是有些图像可以是连续的,
//Mat提供了一个检测图像是否连续的函数isContinuous。当图像连通时,我们就可以把图像完全展开,看成是一行。
//方法四
//更高效的方法
//一般来说图像行与行之间往往存储是不连续的,但是有些图像可以是连续的,
//Mat提供了一个检测图像是否连续的函数isContinuous。当图像连通时,我们就可以把图像完全展开,看成是一行。
int div = 64;
cv::Mat outImage;
outImage.create(src.size(), src.type());
//int yhRow = src.rows;
//int xwCol = src.cols;
if (src.isContinuous() && outImage.isContinuous())
{
yhRow = 1;
xwCol = xwCol * src.rows * src.channels();
}
for (int i = 0; i < yhRow; i++)
{
const uchar* inData = src.ptr(i);
uchar* outData = outImage.ptr(i);
for (int j = 0; j < xwCol; j++)
{
//*outData++ = *inData++ / div * div + div / 2;
*outData++ = 255 - (*inData++);
}
}
cv::namedWindow("case 4", 0);
cv::imshow("case 4", outImage);
cv::waitKey(0);
//用迭代器来遍历 迭代遍历图像 Safe Method
//用迭代器来遍历 迭代遍历图像 Safe Method
/*下面的方法可以让我们来为图像中的像素声明一个迭代器:
MatIterator_ it;
Mat_::iterator it;
如果迭代器指向一个const图像,则可以用下面的声明:
MatConstIterator it; 或者
Mat_::const_iterator it;
*/
void colorReduce4(const Mat& image,Mat& outImage,int div)
{
outImage.create(image.size(),image.type());
MatConstIterator_ it_in=image.begin(); //初始位置的迭代器
MatConstIterator_ itend_in=image.end(); //终止位置的迭代器
MatIterator_ it_out=outImage.begin();
MatIterator_ itend_out=outImage.end();
//获取彩色图像的像素值
while(it_in!=itend_in)
{
(*it_out)[0]=(*it_in)[0]/div*div+div/2; //B
(*it_out)[1]=(*it_in)[1]/div*div+div/2; //G
(*it_out)[2]=(*it_in)[2]/div*div+div/2; //R
it_in++;
it_out++;
}
}
//如果想从第二行开始,则可以从image.begin()+image.rows开始。
//颜色缩减
void colorReduce(Mat &image, int div)
{
int n1 = image.rows; //行数
//每行的元素个数
int nc = image.cols*image.channels();
for(int j=0;j(j);
for(int i=0;i
为了验证几种方法的效率,可以用一个简单的计时和输出:
double t1 = (double)(cv::getTickCount());
…………………………………………………………………………………………………………
……………………………一系列算法操作………………………………
…………………………………………………………………………………………………………
double t2 = (double)(cv::getTickCount());
double t = (double)((t2 - t1) / (cv::getTickFrequency())) * 1000;
std::cout << "Spendtime:" << t << "ms." << std::endl;
ostringstream ss;
ss << "Spendtime : " << std::fixed << std::setprecision(2) << t << " ms ";
putText(src, ss.str(), cv::Point(10, 30), cv::FONT_HERSHEY_SIMPLEX, 0.5, cv::Scalar(0, 0, 255), 1, 8);