目录
一、简介
二、构造函数
二、GpuMat::upload、GpuMat::download
三、GpuMat与PtrStepSz、PtrStep
四、深复制与浅复制
五、其他成员函数
GpuMat可以从其命名看出,它是“GPU”版本的Mat,绝大部分接口和Mat相同,功能也类似。
和Mat相比,GpuMat多了两个成员函数upload和download,分别用于把数据从内存上传(通过总线传输)到显存和从显存下载(通过总线传输)到内存。
GpuMat和Mat都有数据指针(指向一块存储区域,其中存放着图像数据),不过GpuMat的数据指针是指向显存上的某一块区域,而Mat的数据指针是指向内存上的某一块区域。
GpuMat仅支持二维数据;GpuMat::isContinuous() == false,这是为了对齐内存,当一行的数据不是8字节(具体是几字节不知道)的倍数时,为了提高访问速度,这一行数据的末尾会填充空白字节,所以一行的实际内存大小保存在GpuMat的成员step里面。
OpenCV3中,GpuMat的构造函数如下;OpenCV2中,构造函数没有allocator这个参数。
//! 默认构造函数
explicit GpuMat(Allocator* allocator = defaultAllocator());
//! 根据指定大小(size)和类型(type)创建GpuMat实例
GpuMat(int rows, int cols, int type, Allocator* allocator = defaultAllocator());
GpuMat(Size size, int type, Allocator* allocator = defaultAllocator());
//! 根据指定大小和类型创建GpuMat,并用s初始化所有元素
GpuMat(int rows, int cols, int type, Scalar s, Allocator* allocator = defaultAllocator());
GpuMat(Size size, int type, Scalar s, Allocator* allocator = defaultAllocator());
//! 复制构造函数(浅复制)
GpuMat(const GpuMat& m);
//! 创建一个指定大小和类型的GpuMat;并使用由用户分配的d数据data作为初始数据
GpuMat(int rows, int cols, int type, void* data, size_t step = Mat::AUTO_STEP);
GpuMat(Size size, int type, void* data, size_t step = Mat::AUTO_STEP);
//! 创建ROI矩阵,就是把m的一部分作为新的矩阵
GpuMat(const GpuMat& m, Range rowRange, Range colRange);
GpuMat(const GpuMat& m, Rect roi);
//! 根据arr创建GpuMat,并把arr中的数据复制到GpuMat指定的显存区域
explicit GpuMat(InputArray arr, Allocator* allocator = defaultAllocator());
因此,构造GpuMat 的方式有如下几种
const int rows = 16*50;
const int cols = 16*60;
const int type = CV_8UC3;
//第一种
GpuMat gpuMat;
//第二种
GpuMat gpuMat1(rows,cols,type);
GpuMat gpuMat2(Size(cols,rows),type);
//第三种,
GpuMat gpuMat3(rows,cols,type,Scalar(0,255,0));
GpuMat gpuMat4(Size(cols,rows),type,Scalar(0,255,0));
//第四种
GpuMat gpuMat5 = gpuMat1;
//第五种
uchar *data = new uchar[rows*cols*3]();//像素个数乘以3
GpuMat gpuMat6(rows,cols,type,data);
GpuMat gpuMat7(Size(cols,rows),type,data);
//第六种
Range rowRange(0,16*10),colRange(0,16*10);
GpuMat gpuMat8(gpuMat1,rowRange,colRange);
Rect rect(0,0,16*10,16*10);
GpuMat gpuMat9(gpuMat1,rect);
//第七种
Mat mat(rows,cols,type,Scalar(0,255,0));
GpuMat gpuMat10(mat);
下面是OpenCV2的函数
//! 把m中的数据上传到GpuMat指定的显存中
void upload(const Mat& m);
//! 把GpuMat指定的显存中,把数据下载到m里
void download(Mat& m) const;
下面是opencv3的函数
//! 把arr中的数据上传到GpuMat,上传完成前会阻塞当前线程
void upload(InputArray arr);
//! 异步地把arr中的数据上传到GpuMat,不会阻塞当前线程
void upload(InputArray arr, Stream& stream);
//! 把GpuMat中的数据下载到dst,下载完成前会阻塞当前线程
void download(OutputArray dst) const;
//! 异步地把GpuMat中的数据下载到dst,下载完成前不会阻塞当前线程
void download(OutputArray dst, Stream& stream) const;
可以看出,opencv3中,upload和download都重载有参数stream的版本,这是把上传下载的操作放到stream中,让stream去管理,然后立即返回,CPU可以继续做其他事情,这就是异步的上传/下载数据。在opencv2中,异步上传下载的函数在stream里面。异步的上传下载数据,将在后面的博客中讲解。接下来演示如何使用upload/download函数。
//main.cpp
#include
//--------------------OpenCV头文件---------------
#include
#include
using namespace cv;
#if CV_VERSION_EPOCH == 2
#define OPENCV2
#include
namespace GPU = cv::gpu;
#elif CV_VERSION_MAJOR == 3
#define OPENCV3
#include
namespace GPU = cv::cuda;
#else
#error Not support this OpenCV version
#endif
//--------------------OpenCV头文件---------------
using namespace std;
int main() {
// 首先要检查是否CUDA模块是否可用
if(GPU::getCudaEnabledDeviceCount()==0){
cerr<<"此OpenCV编译的时候没有启用CUDA模块"<
注意:有的函数,例如cvtColor,在cv和cv::cuda(在opencv2中是cv::gpu)这两个命名空间中有相同的定义,可在函数名字前面加上cuda::(在opencv2是gpu::)就不会出现冲突。
PtrStepSz和PtrStep是两个轻量级的类,一般作为CUDA核函数的参数,为了提高性能而设计(越简单,复制的代价越小)。
PtrStep和PtrStepSz都是由GpuMat的成员函数生成,我们看下这两个函数的实现
template inline
GpuMat::operator PtrStepSz() const
{
return PtrStepSz(rows, cols, (T*)data, step);
}
template inline
GpuMat::operator PtrStep() const
{
return PtrStep((T*)data, step);
}
可见, PtrStepSz仅仅包含了GpuMat中的rows、cols、step、data(数据指针);而PtrStep仅包含GpuMat中的step和data这两个成员。PtrStepSz中的Ptr(指针)代表data;Step代表step;Sz则是Size的缩写,代表rows和cols。PtrStep中的Ptr代表data;Step则代表step。
那么如何通过GpuMat得到PtrStepSz和PtrStep呢?请看如下代码
//common.h
#ifndef OCSAMPLE_COMMON_H
#define OCSAMPLE_COMMON_H
#include
//--------------------OpenCV头文件---------------
#include
#include
using namespace cv;
#if CV_VERSION_EPOCH == 2
#define OPENCV2
#include
namespace GPU = cv::gpu;
#elif CV_VERSION_MAJOR == 3
#define OPENCV3
#include
namespace GPU = cv::cuda;
#else
#error Not support this OpenCV version
#endif
//--------------------OpenCV头文件---------------
using namespace std;
#endif //OCSAMPLE_COMMON_H
//main.cu
#include "common.h"
//---------------------CUDA头文件----------------
#include
//---------------------CUDA头文件----------------
__global__ void kernel(GPU::PtrStepSz src){
}
int main(){
// 首先要检查是否CUDA模块是否可用
if(GPU::getCudaEnabledDeviceCount()==0){
cerr<<"此OpenCV编译的时候没有启用CUDA模块"<>>(gpuMat);
}
kernel是一个CUDA Kernel,参数类型是PtrStepSz
和Mat一样,浅复制只复制GpuMat头信息和数据指针,两个GpuMat的数据指针指向同一块区域,修改其中任意一个GpuMat的数据都会相互影响。而深复制则是把数据也复制到新的GpuMat里面,修改其中一个GPUMat都不会影响另外一个。
//main.cpp
#include "common.h"
int main(){
// 首先要检查是否CUDA模块是否可用
if(GPU::getCudaEnabledDeviceCount()==0){
cerr<<"此OpenCV编译的时候没有启用CUDA模块"<
其他成员函数的用法和Mat的相同,不再一一赘述。