本文详细介绍了opencv中涉及通道的知识,包括图像类型转换,通道合成分解,图像的显示。
tips1: 一个图像的通道数是N,就表明每个像素点处有N个数,一个a×b的N通道图像,其图像矩阵实际上是b行N×a列的数字矩阵。
OpenCV中图像的通道可以是1、2、3和4。其中常见的是1通道和3通道,2通道和4通道不常见。
1通道的是灰度图。
3通道的是彩色图像,比如RGB图像。
4通道的图像是RGBA,是RGB加上一个A通道,也叫alpha通道,表示透明度。PNG图像是一种典型的4通道图像。alpha通道可以赋值0到1,或者0到255,表示透明到不透明。
2通道的图像是RGB555和RGB565。2通道图在程序处理中会用到,如傅里叶变换,可能会用到,一个通道为实数,一个通道为虚数,主要是编程方便。RGB555是16位的,2个字节,5+6+5,第一字节的前5位是R,后三位+第二字节是G,第二字节后5位是B,可见对原图像进行压缩了。
tips2: OpenCV中用imshow( )来显示图像,只要Mat的数据矩阵符合图像的要求,就可以用imshow来显示。二通道好像不可以。。。超过了4通道,就不是图像了,imshow( )也显示不了。
tips3: imshow( )显示单通道图像时一定是灰度图,如果我们想显示红色的R分量,还是应该按三通道图像显示,只不过G和B通道要赋值成0或255.
tips4: 通道分解用split( ),通道合成用merg( ),这俩函数都是mixchannel( )的特例。
下面,结合程序说明以上知识点。
Mat image=imread("E:/图片/color.jpg"); Mat imageGRAY,imageRGBA,imageRGB555; cvtColor(image,imageGRAY,CV_RGB2GRAY); //RGB转GRAY cvtColor(image,imageRGBA,CV_RGB2BGRA); //RGB转RGBA cvtColor(image,imageRGB555,CV_RGB2BGR555); //RGB转RGB555 //来看看通道数 int n = image.channels(); //n=3 int nRGBA = imageRGBA.channels(); //nRGBA = 4 int nRGB555 = imageRGB555.channels(); //nRGB555 = 2 //显示GRAY、RGB和RGBA图像 imshow("image",image); imshow("imageGRAY",imageGRAY); imshow("imageRGBA",imageRGBA); //imshow("imageRGB555",imageRGB555); //无法显示
RGB转GRAY是根据一个心理学公式来的:Gray = R*0.299 + G*0.587 + B*0.114
RGB转GRBA,默认A通道的数值是255,也就是不透明的。
我们先来看下最常用的合成与分解函数。
C++: void split(const Mat& mtx, Mat* mv)
C++: void split(const Mat& mtx, vector<Mat>& mv)
C: void cvSplit(const CvArr* src, CvArr* dst0, CvArr* dst1, CvArr* dst2, CvArr* dst3)
参数:mtx 输入矩阵
mv 输出矩阵或矩阵数组
src 输入矩阵
dst0、dst1、dst2、dst3 最多4个单通道的输出矩阵
当我们要固定提取某个通道的矩阵时,C形式的用法还是蛮实用的,不必向C++用法那样,先定义vector,再channels.at(k)
Mat rgb( 3, 4, CV_8UC3, Scalar(1,2,3,4) ); vector<Mat> channels; split(rgb,channels); Mat B = channels.at(0); //从vector中读数据用vector::at() Mat G = channels.at(1); Mat R = channels.at(2); cout<<"RGB="<<endl<<rgb<<endl; cout<<"B="<<endl<<B<<endl; cout<<"G="<<endl<<G<<endl; cout<<"R="<<endl<<R<<endl;注意rgb图像的通道排列是BGR
C++: void merge(const Mat* mv, size_t count, OutputArray dst)
C++: void merge(const vector<Mat>& mv, OutputArray dst)
C: void cvMerge(const CvArr* src0, const CvArr* src1, const CvArr* src2, const CvArr* src3, CvArr* dst)
参数:mv 输入矩阵
count 当mv是C形式的array时,count表示输入矩阵个数
dst 输出矩阵
src0、src1、src2、src3 最多4个单通道的输入矩阵
Mat R(3,4,CV_8UC1, Scalar(3)); Mat G(3,4,CV_8UC1, Scalar(2)); Mat B(3,4,CV_8UC1, Scalar(1)); Mat RGB( 3, 4, CV_8UC3); vector<Mat> src; src.push_back(B); //往vector里存数据要用vector::push_back() src.push_back(G); src.push_back(R); merge(src,RGB); cout<<"B="<<endl<<B<<endl; cout<<"G="<<endl<<G<<endl; cout<<"R="<<endl<<R<<endl; cout<<"RGB="<<endl<<RGB<<endl;
split( )和merge( )都是mixChannels( )的特例,接下来看看mixChannels()的用法
C++: void mixChannels(const Mat* src, int nsrc, Mat* dst, int ndst, const int* fromTo, size_t npairs)
C++: void mixChannels(const vector<Mat>& src, vector<Mat>& dst, const int* fromTo, int npairs)
参数:src 输入的矩阵,可以是一个矩阵也可以是多个矩阵构成的vector
nsrc 输入矩阵的个数
dst 输出矩阵,可以是一个矩阵也可以是多个矩阵构成的vector
ndst 输出矩阵的个数
fromTo src到dst通道对应数组
npairs fromTo中有几组对应关系
mixChannels( )本质是改变了几个通道的顺序,输入一共有几个通道,输出肯定也有几个通道,所以定义fromTo时,要知道有多少个通道,而且通道的编号一定是0,1,2,...
Mat RGB(3,4, CV_8UC3,Scalar(1,2,3,4)); Mat A(3,4,CV_8UC1,Scalar(6)); cout<<"RGB="<<endl<<RGB<<endl; cout<<"A="<<endl<<A<<endl; //RGB+A合成为RGBA cout<<"RGB+A合成为RGBA"<<endl; Mat RGBA(3,4,CV_8UC4); Mat in[]={RGB,A}; int fromTo1[] = {0,0, 1,1, 2,2, 3,3}; mixChannels(in,2,&RGBA,1,fromTo1,4); cout<<"RGBA="<<endl<<RGBA<<endl; //RGB分解为R+GB cout<<"RGB分解为R+GB"<<endl; Mat R(3,4,CV_8UC1); Mat GB(3,4, CV_8UC2); Mat out[]={R,GB}; int fromTo2[] = {0,2, 1,1, 2,0}; mixChannels(&RGB,1,out,2,fromTo2,3); cout<<"R="<<endl<<R<<endl; cout<<"GB="<<endl<<GB<<endl;
我们先来看一个例子
Mat image=imread("E:/图片/color.jpg"); vector<Mat> channels; split(image,channels); Mat B = channels.at(0); Mat G = channels.at(1); Mat R = channels.at(2); imshow("image",image); imshow("R",R); imshow("G",G); imshow("B",B);
三个分量R、G、B因为是单通道图像,所以只能显示为灰度图。如果要想显示出颜色来,应该用三通道图像来显示,比如显示R,我们就让G和B通道的数值为0或255。看下面例子
Mat image=imread("E:/图片/color.jpg"); vector<Mat> sbgr; split(image,sbgr); //split to sbgr[0],sbgr[1] ,sbgr[2] vector<Mat> mbgr(3); Mat bk1(image.size(),CV_8UC1,Scalar(0)); //Mat bk2(image.size(),CV_8UC1,Scalar(255)); //显示彩色的B分量 Mat imageB(image.size(),CV_8UC3); mbgr[0]= sbgr[0]; mbgr[1]= bk1; mbgr[2]= bk1; merge(mbgr,imageB); imshow("imageB",imageB); //显示彩色的G分量 Mat imageG(image.size(),CV_8UC3); mbgr[0]= bk1; mbgr[1]= sbgr[1]; mbgr[2]= bk1; merge(mbgr,imageG); imshow("imageG",imageG); //显示彩色的R分量 Mat imageR(image.size(),CV_8UC3); mbgr[0]= bk1; mbgr[1]= bk1; mbgr[2]= sbgr[2]; merge(mbgr,imageR); imshow("imageR",imageR); imwrite("imageR.jpg",imageR); imwrite("imageG.jpg",imageG); imwrite("imageB.jpg",imageB); waitKey(0);
PNG是RGBA的图片格式,对于一般的RGB图像,我们只需要加上一个A通道,并且A通道的值不全为1(或255),就可以得到一个透明的图片。
Mat image=imread("E:/图片/color.jpg"); //定义4种A通道 Mat imageA0 = Mat(image.size(),image.depth(),Scalar(0)); //image.depth()返回0,表示cv_8u Mat imageA85 = Mat(image.size(),image.depth(),Scalar(85)); Mat imageA170 = Mat(image.size(),image.depth(),Scalar(170)); Mat imageA255 = Mat(image.size(),image.depth(),Scalar(255)); //定义合成后的RGBA图像,透明度分别为0%,33%,67%,100%,透明---->不透明 Mat imageRGBA0 = Mat(image.size(),CV_8UC4); Mat imageRGBA85 = Mat(image.size(),CV_8UC4); Mat imageRGBA170 = Mat(image.size(),CV_8UC4); Mat imageRGBA255 = Mat(image.size(),CV_8UC4); Mat in1[] = {image,imageA0}; Mat in2[] = {image,imageA85}; Mat in3[] = {image,imageA170}; Mat in4[] = {image,imageA255}; int from_to[] = {0,0, 1,1, 2,2, 3,3}; mixChannels(in1,2,&imageRGBA0,1,from_to,4); mixChannels(in2,2,&imageRGBA85,1,from_to,4); mixChannels(in3,2,&imageRGBA170,1,from_to,4); mixChannels(in4,2,&imageRGBA255,1,from_to,4); imwrite("imageRGBA0.png",imageRGBA0); imwrite("imageRGBA85.png",imageRGBA85); imwrite("imageRGBA170.png",imageRGBA170); imwrite("imageRGBA255.png",imageRGBA255);
直接用imshow( )是看不出差别来的,可以这么看。把一张PPT的空白背景替换成彩色背景,然后把这些 图片放上去,效果如下图所示。
上图显示的结果实质是背景网格图片和我们的PNG图片叠加显示的效果。所以我们有个更简洁的方法实现上面的显示效果,是显示效果!
imageResult = α·image + (1-α)·imageRGID
我们只需要调整α的值就能控制image和imageGRID显示的比例了。