YOLOv 4调用
更新
opencv4.4已经支持yolov4模型了,调用起来简单的多,调用方式同v3。
原答案
昨天听说YOLO出到第四代了,据说识别能力,识别速度双双提高。boss让我看一下方不方便调用到项目里。在Github上下载下来,make一下,试了一下可以运行。
对比YOLOv 3可以发现,在卡车的边上多识别出盆栽(虽然我感觉那个不是盆栽hhh),只说下怎么调用。
在yolov3版本,opencv刚开始并不支持CUDA运算,最早是使用pytorch+opencv实现在目标检测算法在项目中的应用。自从opencv更新到4.20版本以后,增加了对cuda的支持,调用yolov3就简单的多了,opencv内对YOLOv3有很好的支持,cv::dnn::readNetFromDarknet 即可一步读取网络。
在对v4版本的调用最初以为把cfg文件和weights文件简单替换即可。(呵呵,天真了)。反复阅读yolo系列的github官网,终于在文章的最后看到了一丝希望,是一种我从来没用过调用的方式,将YOLO封装成dll文件进行调用。
在搜集了一些资料后,借鉴这两位老哥的流程,在YOLOv4版本下是可以成功的:
https://blog.csdn.net/stjuliet/article/details/87884976
https://blog.csdn.net/weixinhum/article/details/81475548?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1&utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1
在调用过程中出现了一些问题值得注意:
问题1:我的版本中出现了这个问题。
error C4996: ‘sprintf’: This function or variable may be unsafe.
解决方案:打开项目----项目属性—配置属性----C/C++ ----预处理器----预处理定义,添加_CRT_SECURE_NO_DEPRECATE_SCL_SECURE_NO_DEPRECATE这两个宏。
问题2:opencv在版本更新中更换了很多名字,在第二个链接中CV_CAP_PROP_FRAME_COUNT在现版本opencv中已经更名为CAP_PROP_FRAME_COUNT。
最后效果图:
无cuda版本运行了5分钟才出结果,一度以为调用方法出了问题。无奈之下为自己快退休的笔记本安装CUDA驱动,加了驱动以后速度大大提升
本来想附上YOLOv4的weights文件,省去,结果超出了220MB上传限制了,哭了。
更新补充一下代码部分
#include
#ifdef _WIN32
#define OPENCV
#define GPU
#endif
#include "yolo_v2_class.hpp" //引用动态链接库中的头文件
#include
#include "opencv2/highgui/highgui.hpp"
#include
#pragma comment(lib, "yolo_cpp_dll.lib") //引入YOLO动态链接库
//#pragma comment(lib, "opencv_world340d.lib") //引入OpenCV链接库,我在vs中配置过了,如果没配置请对应修改
using namespace cv;
//以下两段代码来自yolo_console_dll.sln
void draw_boxes(cv::Mat mat_img, std::vector<bbox_t> result_vec, std::vector<std::string> obj_names,
int current_det_fps = -1, int current_cap_fps = -1)
{
int const colors[6][3] = {
{
1,0,1 },{
0,0,1 },{
0,1,1 },{
0,1,0 },{
1,1,0 },{
1,0,0 } };
for (auto &i : result_vec) {
cv::Scalar color = obj_id_to_color(i.obj_id);
cv::rectangle(mat_img, cv::Rect(i.x, i.y, i.w, i.h), color, 2);
if (obj_names.size() > i.obj_id) {
std::string obj_name = obj_names[i.obj_id];
if (i.track_id > 0) obj_name += " - " + std::to_string(i.track_id);
cv::Size const text_size = getTextSize(obj_name, cv::FONT_HERSHEY_COMPLEX_SMALL, 1.2, 2, 0);
int const max_width = (text_size.width > i.w + 2) ? text_size.width : (i.w + 2);
cv::rectangle(mat_img, cv::Point2f(std::max((int)i.x - 1, 0), std::max((int)i.y - 30, 0)),
cv::Point2f(std::min((int)i.x + max_width, mat_img.cols - 1), std::min((int)i.y, mat_img.rows - 1)),
color, CV_FILLED, 8, 0);
putText(mat_img, obj_name, cv::Point2f(i.x, i.y - 10), cv::FONT_HERSHEY_COMPLEX_SMALL, 1.2, cv::Scalar(0, 0, 0), 2);
}
}
if (current_det_fps >= 0 && current_cap_fps >= 0) {
std::string fps_str = "FPS detection: " + std::to_string(current_det_fps) + " FPS capture: " + std::to_string(current_cap_fps);
putText(mat_img, fps_str, cv::Point2f(10, 20), cv::FONT_HERSHEY_COMPLEX_SMALL, 1.2, cv::Scalar(50, 255, 0), 2);
}
}
std::vector<std::string> objects_names_from_file(std::string const filename) {
std::ifstream file(filename);
std::vector<std::string> file_lines;
if (!file.is_open()) return file_lines;
for (std::string line; getline(file, line);) file_lines.push_back(line);
std::cout << "object names loaded \n";
return file_lines;
}
int main()
{
std::string names_file = "coco.names";
std::string cfg_file = "yolov4.cfg";
std::string weights_file = "yolov4.weights";
Detector detector(cfg_file, weights_file,0); //初始化检测器
std::vector<std::string> obj_names;
std::ifstream ifs(names_file.c_str());
std::string line;
while (getline(ifs, line)) obj_names.push_back(line);
//测试是否成功读入分类对象文件
//for (size_t i = 0; i < obj_names.size(); i++)
//{
// std::cout << obj_names[i] << std::endl;
//}
cv::Mat frame = imread("D://test.jpg");
std::cout << detector.cur_gpu_id<< std::endl;
std::vector<bbox_t> result_vec = detector.detect(frame);
draw_boxes(frame, result_vec, obj_names);
cv::imshow("test", frame);
waitKey();
return 0;
}