windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速

windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速

  • 前言
  • 1. 下载源码与安装环境
    • 1.1 下载 opencv 官方源码,
    • 1.2 下载opencv_contrib源码
    • 1.3 解压下载的源码包
    • 1.4 安装cuda,cudnn
  • 2 使用CMake-Gui配置项目
    • 2.1 配置源码路径
    • 2.2 配置编译平台
    • 2.3 修改配置项
    • 2.4 再次点击configure
    • 2.5 生成OpenCV.sln vs 解决方案项目
  • 3 使用VS Studio编译opencv
    • 3.1 打开 OpenCV.sln
    • 3.2 编译工程
  • 错误集锦:
    • 1. unsupported architectures from CUDA_ARCH_BIN option.
    • 2. 文件download失败解决方法
    • 3.“cv::dnn::cuda4dnn::csl::device::detail::getBlockDim” 错误
  • 参考

前言

OpenCV官方提供了windows可安装的版本,已经有编译好的dll,不过不包括opencv_contrib。如果想应用这部分算法,则需要自己编译opencv,将opencv_contrib编译到opencv中。
所需材料:

  • opencv源代码
  • opencv_contrib源代码
  • cuda10.0
  • cudnn
  • cmake
  • vs2015
  • 通畅的网络(在编译配置过程中了,没有遇到网上下载出错的问题)

1. 下载源码与安装环境

1.1 下载 opencv 官方源码,

官方网站下载:https://opencv.org/releases/
windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速_第1张图片

1.2 下载opencv_contrib源码

opencv_contrib源码可以在GitHub上下载:https://github.com/opencv/opencv_contrib/releases
windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速_第2张图片

1.3 解压下载的源码包

解压后的源码包如下所示
在这里插入图片描述

1.4 安装cuda,cudnn

cuda10.0 下载地址:https://developer.nvidia.com/cuda-10.0-download-archive
windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速_第3张图片
cudnn下载地址:https://developer.nvidia.com/rdp/cudnn-download【下载需要登录账号】
windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速_第4张图片

2 使用CMake-Gui配置项目

2.1 配置源码路径

设置opencv官方源码目录和生成目录
在这里插入图片描述

2.2 配置编译平台

点击Configure,弹出对话框,选择编译工程的平台。我选的是64位的VS2015
windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速_第5张图片

2.3 修改配置项

第一次点击configure一般会出错,即很多项都是红色。

勾选OPENCV_DNN_CUDA
在这里插入图片描述
设置OPENCV_EXTRA_MODULES_PATH,即opencv_contrib源码包下的modules路径。
windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速_第6张图片
在BUILD下 勾选 BUILD_opencv_world,可以编译出opencv_world库,调用时直接使用该库。
在这里插入图片描述

2.4 再次点击configure

配置完成的没有问题的项,会变成白色,红色的项需要修改后,再次点击configure,直到变成全白。

2.5 生成OpenCV.sln vs 解决方案项目

等配置完成,没有错误后,点击generate,生成 vs 的 sln 项目
windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速_第7张图片

3 使用VS Studio编译opencv

3.1 打开 OpenCV.sln

windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速_第8张图片

3.2 编译工程

选择Debug x64,点击生成->生成解决方案开始编译,这个过程比较漫长,需要耐心。同样更改成Release x64,可以生成Release版本的库。

错误集锦:

1. unsupported architectures from CUDA_ARCH_BIN option.

CMake Error at modules/dnn/CMakeLists.txt:99 (message):
	CUDA backend for DNN module requires CC 5.3 or higher. Please remove
	unsupported architectures from CUDA_ARCH_BIN option.
Call Stack (most recent call first):
	modules/world/CMakeLists.txt:13 (include)
	modules/world/CMakeLists.txt:32 (include_one_module)

解决方法:
只需将CUDA_ARCH_BIN中小于5.3的选项去掉

2. 文件download失败解决方法

文件下载失败和网络有关系,而且一旦失败就会有多个文件下载失败,下面以第一个下载失败文件为例,进行说明,日志如下
windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速_第9张图片
从上面可以看出,下载日志在保存在“E:\opencv4.2\opencv\sources\build\CMakeDownloadLog.txt”文件内,打开文件,搜索"ippicv", 第三行即为本文件信息
windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速_第10张图片
其中上面为本地缓存路径,下面为下载网址,直接复制网址到浏览器下载,如果浏览器也下载失败,可以尝试将地址复制到迅雷或者IDM中进行下载,
下载后保存到“E:/opencv4.2/opencv/sources/.cache/ippicv/”目录,删除目录内大小0KB的文件(如果有), 并按照d222685246896fe089f88b8858e4b2f-ippicv_2019_win_intel64_20180723_general.zip重命名
windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速_第11张图片
其它下载失败的文件可以用同样的方法进行处理。

3.“cv::dnn::cuda4dnn::csl::device::detail::getBlockDim” 错误

在这里插入图片描述
中文显示乱码,搜索微软C2912错误描述为:显式专用化“declaration”不是函数模板的专用化,无法特化非模板函数。
可以采用修改方法:
1) 删除错误行
cudnn.hpp文件,将报错行的decltype部分去掉
grid_stride_range.hpp 文件,同样方法修改

2) 修改错误行
对应错误代码位置为windows下安装编译opencv4.2+opencv_contrib+dnn模块支持cuda加速_第12张图片
(1)修改sources\modules\dnn\src\cuda\grid_stride_range.hpp文件
替换15-33行为:

using dim3_member_type = decltype(dim3::x);

template <int>  __device__ dim3_member_type getGridDim();
template <> inline __device__ dim3_member_type getGridDim<0>() { return gridDim.x; }
template <> inline __device__ dim3_member_type getGridDim<1>() { return gridDim.y; }
template <> inline __device__ dim3_member_type getGridDim<2>() { return gridDim.z; }

template <int> __device__ dim3_member_type getBlockDim();
template <> inline __device__ dim3_member_type getBlockDim<0>() { return blockDim.x; }
template <> inline __device__ dim3_member_type getBlockDim<1>() { return blockDim.y; }
template <> inline __device__ dim3_member_type getBlockDim<2>() { return blockDim.z; }

using uint3_member_type = decltype(uint3::x);

template <int> __device__ uint3_member_type getBlockIdx();
template <> inline __device__ uint3_member_type getBlockIdx<0>() { return blockIdx.x; }
template <> inline __device__ uint3_member_type getBlockIdx<1>() { return blockIdx.y; }
template <> inline __device__ uint3_member_type getBlockIdx<2>() { return blockIdx.z; }

template <int> __device__ uint3_member_type getThreadIdx();
template <> inline __device__ uint3_member_type getThreadIdx<0>() { return threadIdx.x; }
template <> inline __device__ uint3_member_type getThreadIdx<1>() { return threadIdx.y; }
template <> inline __device__ uint3_member_type getThreadIdx<2>() { return threadIdx.z; }

(2) 修改sources\modules\dnn\src\cuda4dnn\csl\cudnn\cudnn.hpp文件
替换40-42行为:

using cudnn_data_enum_type = decltype(CUDNN_DATA_FLOAT);
template <class> cudnn_data_enum_type get_data_type();
template <> inline cudnn_data_enum_type get_data_type<half>() { return CUDNN_DATA_HALF; }
template <> inline cudnn_data_enum_type get_data_type<float>() { return CUDNN_DATA_FLOAT; }

之后保存,重新编译即可成功。

参考

  1. OpenCV3.4.1+opencv_contrib编译:windows 10
  2. opencv4.2版本dnn支持cuda加速
  3. opencv4.2.0 源码编译,win7+VS2015,DNN模块支持cuda加速

你可能感兴趣的:(opencv,c++,深度学习)