opencv cuda加速使用

如何使用

包含头文件

#include

链接库添加cudaopencv库

使用来说需要使用cv::cuda::GpuMat,它是在gpu上的数据结构。

一个upload,一个download

Mat I1;
cuda::GpuMat gI;
gI.upload(I1);

//download
I1 = gI; //or gI.download(I1)

使用cuda的函数需要使用GpuMat;另外,需要注意的一点是,GPU输入的数据要么是1通道的要么是四通道的,每一个元素是char或者float类型的,GPU不支持double类型的。如果传给其它类型,会报异常。这样一来,如果要处理三通道的图像,有两种方法:一是添加一个新通过,或者split图像到三个通道,然后分别处理。

如何优化

  1. GPU的内存分配太费时,所以尽量不要在函数里面分配内存,在函数外分配内存然后传引用进去。
  2. 避免不必要的数据传输,尽量使用提供的函数。例如:b.t1 = 2 * b.mu1_mu2 + C1;用下面的函数代替。

gpu::multiply(b.mu1_mu2, 2, b.t1); //b.t1 = 2 * b.mu1_mu2 + C1;

gpu::add(b.t1, C1, b.t1);

   3.使用异步调用方式。

gpu::Stream stream;
stream.enqueueConvert(b.gI1, b.t1, CV_32F);    // Upload
gpu::split(b.t1, b.vI1, stream);              // Methods (pass the stream as final parameter).
gpu::multiply(b.vI1[i], b.vI1[i], b.I1_2, stream);        // I1^2

 

你可能感兴趣的:(机器视觉,TX2)