编程需要,发现网上大部分内容都是2.4.9以前的编译环境,而目前使用的是2.4最新版的OpenCV 2.4.12版本,所以自己尝试了一下2.4.12 GPU库的编译。
下载cmake-3.5.0-win32-x86.msi Cmake 3.5.0
装完并配置完cmake和cuda的环境之后,先不要配置opencv,因为要自己进行编译生成bin、lib等。
官方文档对于OpenCV的GPU配置只提了一句进行配置的时候WITH-CUDA勾选上就行了。
打开cmake-gui,配置好opencv的source code的文件夹和输出的Build文件夹,点击左下角configure。
选择编译工具,这里是VS2013 64位,然后点finish,等待配置生成完毕。
Configure完后显示configuring done并出现全红色的新选项配置,这里的图应为是上一次错误配置的截图,所以一切以文字为准,图片做参考。
勾选with cuda(默认是勾选状态)
由于后续进行编译的时候出现PACKAGE的NSIS compiler要求和python 32位/64位的一些问题,build出现error,因此在进行配置时把WITH PACKAGE和WITH opencv_python给取消了,顺便一提,TBB并不需要。
把package的勾选取消了,工程里也用不到(有解决NSIS compiler问题的可以来讨论一下)
把opencv_python的勾选也取消了,因为原来已经用无gpu库的opencv配好了32位的python,不想再改了,否则编译时python模块一直有错。
再点击一次configure更新,无红色条目后再显示configuring done就完成配置了,再点击generate生成工程
生成完毕后,在选择的目标文件加中就生成了对应的2013工程文件OpenCV.sln了
编译前先把360和杀毒软件关掉,然后打开OpenCV.sln之前,先右键获取管理员权限,否则编译install的时候会出现system permission deny。
打开OpenCV.sln,选项:生成(build)—批生成(batch build)—全选(select all)—生成(build),等待编译完成,编译完毕后没有错误才算编译成功
为了生成要用的opencv库,再对INSTALL模块进行debug和release两种模式下的编译。
DEBUG模式和RELEASE模式下分别对INSTALL模块右键重新生成,无错误编译成功
这时候cmake目标文件夹里的install文件夹里就有了opencv所有要的include和x64-vc12里的bin、lib了。
编译完成后就可以对新的GPU OpenCV库进行环境变量配置和工程配置了。
系统PATH里配置的环境变量 D:\opencv\buildg-pp\install\x64\vc12\bin
工程设置vc++目录包含内容为
- CUDA的include目录
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v7.5\include
- 新的opencv的include目录
D:\opencv\buildg-pp\install\include以及下面两个子文件夹open和opencv2
- library目录为CUDA的lib目录C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v7.5\lib和新的opencv的lib目录D:\opencv\buildg-pp\lib\Debug(D:\opencv\buildg-pp\lib\Release)
链接器的输入按照需求进行,debug模式下进行的就带上d,release模式的就删除d
使用OpenCV sources里自带的GPU sample:surf_keypoint_matcher.cpp
测试的时候先调用了getCudaEnabledDeviceCount()看返回值,返回1说明GPU编译生效了,否则说明编译或者配置还是有问题。原程序在进行upload的时候挂住了,搜了一下google,用了另外一个人的程序upload没有挂住,好像之前也看到一篇文章提过前面再预定义一下lib,所以就加上去了,需要什么lib自己改吧。
#ifdef _DEBUG
#pragma comment(lib, "opencv_core2412d.lib")
#pragma comment(lib, "opencv_imgproc2412d.lib") //MAT processing
//#pragma comment(lib, "opencv_objdetect2412d.lib")
#pragma comment(lib, "opencv_gpu2412d.lib")
//#pragma comment(lib, "opencv_features2d2412d.lib")
#pragma comment(lib, "opencv_highgui2412d.lib")
//#pragma comment(lib, "opencv_ml2412d.lib")
#else
#pragma comment(lib, "opencv_core246.lib")
#pragma comment(lib, "opencv_imgproc246.lib")
//#pragma comment(lib, "opencv_objdetect246.lib")
#pragma comment(lib, "opencv_gpu246.lib")
//#pragma comment(lib, "opencv_features2d246.lib")
#pragma comment(lib, "opencv_highgui246.lib")
//#pragma comment(lib, "opencv_ml246.lib")
#endif
#include
#include "opencv2/opencv_modules.hpp"
#ifdef HAVE_OPENCV_NONFREE
#include "opencv2/core/core.hpp"
#include "opencv2/features2d/features2d.hpp"
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/gpu/gpu.hpp"
#include "opencv2/nonfree/gpu.hpp"
using namespace std;
using namespace cv;
using namespace cv::gpu;
static void help()
{
cout << "\nThis program demonstrates using SURF_GPU features detector, descriptor extractor and BruteForceMatcher_GPU" << endl;
cout << "\nUsage:\n\tmatcher_simple_gpu --left --right " << endl;
}
int main(int argc, char* argv[])
{
if (argc != 5)
{
help();
return -1;
}
GpuMat img1, img2;
for (int i = 1; i < argc; ++i)
{
if (string(argv[i]) == "--left")
{
img1.upload(imread(argv[++i], CV_LOAD_IMAGE_GRAYSCALE));
CV_Assert(!img1.empty());
}
else if (string(argv[i]) == "--right")
{
img2.upload(imread(argv[++i], CV_LOAD_IMAGE_GRAYSCALE));
CV_Assert(!img2.empty());
}
else if (string(argv[i]) == "--help")
{
help();
return -1;
}
}
cv::gpu::printShortCudaDeviceInfo(cv::gpu::getDevice());
SURF_GPU surf;
// detecting keypoints & computing descriptors
GpuMat keypoints1GPU, keypoints2GPU;
GpuMat descriptors1GPU, descriptors2GPU;
surf(img1, GpuMat(), keypoints1GPU, descriptors1GPU);
surf(img2, GpuMat(), keypoints2GPU, descriptors2GPU);
cout << "FOUND " << keypoints1GPU.cols << " keypoints on first image" << endl;
cout << "FOUND " << keypoints2GPU.cols << " keypoints on second image" << endl;
// matching descriptors
BFMatcher_GPU matcher(NORM_L2);
GpuMat trainIdx, distance;
matcher.matchSingle(descriptors1GPU, descriptors2GPU, trainIdx, distance);
// downloading results
vector keypoints1, keypoints2;
vector<float> descriptors1, descriptors2;
vector matches;
surf.downloadKeypoints(keypoints1GPU, keypoints1);
surf.downloadKeypoints(keypoints2GPU, keypoints2);
surf.downloadDescriptors(descriptors1GPU, descriptors1);
surf.downloadDescriptors(descriptors2GPU, descriptors2);
BFMatcher_GPU::matchDownload(trainIdx, distance, matches);
// drawing the results
Mat img_matches;
drawMatches(Mat(img1), keypoints1, Mat(img2), keypoints2, matches, img_matches);
namedWindow("matches", 0);
imshow("matches", img_matches);
waitKey(0);
return 0;
}
#else
int main()
{
std::cerr << "OpenCV was built without nonfree module" << std::endl;
return 0;
}
#endif
程序测试结果