如何使用OpenCV-Python实现超轻量化的实时物体检测(可显示分类结果+bbox,附源码)

OpenCV杂谈_11


一. 需要做的前期准备

  1. 环境配置:
    Python版本:3.7.0
    功能包:opencv-python (4.5.1.48)
  2. 配置文件
    coco.names(darknet中常用的标签文件)、frozen_inference_graph.pb(weights文件)、ssd_mobilenet_v3_large_coco_2020_01_14.pbtxt(网络模型)。下载链接:链接在此
    具体文件夹构造如下图:如何使用OpenCV-Python实现超轻量化的实时物体检测(可显示分类结果+bbox,附源码)_第1张图片
  3. 一个用的顺手的IDE(本人推荐Pycharm)

二. 源码如下:

import cv2

#########################################################
threshold = 0.6  # 检测阈值
wCam, hCam = 640, 480  # 用于设置camera展示窗口的大小
#########################################################

# 打开摄像头
cap = cv2.VideoCapture(0)  # 计算机自带摄像头,如果是外置摄像头,需要更改末尾数字
cap.set(3, wCam)
cap.set(4, hCam)

# 导入coco.names中提前被定义好的类,作为分类结果的标签
classNames = []
classFile = "coco.names"
with open(classFile, 'rt') as f:
    classNames = f.read().rstrip('\n').split('\n')
# print(className)

# 导入配置文件
configPath = 'ssd_mobilenet_v3_large_coco_2020_01_14.pbtxt'
weightsPath = 'frozen_inference_graph.pb'

# 配置检测网络(可以简单地认为就是一些配置,具体细节没必要深究)
net = cv2.dnn_DetectionModel(weightsPath, configPath)
net.setInputSize(320, 320)
net.setInputScale(1.0 / 127.5)
net.setInputMean((127.5, 127.5, 127.5))
net.setInputSwapRB(True)

# 运行网络进行检测,并返回bbox,以及被检测物体的种类
while True:
    success, img = cap.read()
    classIDs, confs, bbox = net.detect(img, confThreshold=threshold)
    print(classIDs, bbox)
    if len(classIDs) != 0:
        for classID, conf, box in zip(classIDs.flatten(), confs.flatten(), bbox):
            # 画检测框
            cv2.rectangle(img, box, color=(255, 0, 0), thickness=2)
            # 写分类结果
            cv2.putText(img, classNames[classID - 1].upper(), (box[0] + 10, box[1] + 30),
                        cv2.FONT_ITALIC, 1, (0, 255, 0), 2)
            # 写分类结果的置信度
            cv2.putText(img, str(round(conf*100, 2)), (box[0] + 200, box[1] + 30),
                        cv2.FONT_ITALIC, 1, (0, 255, 0), 2)

        cv2.imshow('Output', img)
        cv2.waitKey(1)

三. 结果展示如何使用OpenCV-Python实现超轻量化的实时物体检测(可显示分类结果+bbox,附源码)_第2张图片

四.感悟与分享

  1. 在实时的检测过程中其实稳定性并不高,但是精简的代码量以及不用调用GPU进行演算会在一定程度上降低对设备的要求。
  2. 相关教程推荐:https://www.youtube.com/watch?v=HXDD7-EnGBY (内容为英文,且需要科学上网)

如有问题,敬请指正。欢迎转载,但请注明出处。

你可能感兴趣的:(opencv,python,图像识别)