实践目标检测--数据准备

环境

Windows10+Python3.6

实践内容

手势识别(识别1,2,3,4,5的手势)

构造数据集

1、录制视频,用于数据集收集

实践目标检测--数据准备_第1张图片

2、使用opencv的方法截取视频帧

import cv2

vc = cv2.VideoCapture('shoushi3.mp4')  # 读入视频文件
c = 1

if vc.isOpened():  # 判断是否正常打开
    rval, frame = vc.read()
else:
    rval = False

timeF = 3  # 视频帧计数间隔频率

while rval:  # 循环读取视频帧
    rval, frame = vc.read()
    if (c % timeF == 0):  # 每隔timeF帧进行存储操作
        cv2.imwrite('img_data/' + str(c+4500) + '.jpg', frame)  # 存储为图像
    c = c + 1
    cv2.waitKey(1)
vc.release()

3.选取图片(选取较为清晰的手势图片、删掉模糊的)

实践目标检测--数据准备_第2张图片

打标签

使用labelImg的方式对图片进行标注

1、IabelImg工具可在github上自行下载

2、解压后运行python IabelImg.py

3、开始标注

实践目标检测--数据准备_第3张图片

4、标记完成生成大量的xml文件

实践目标检测--数据准备_第4张图片

5、文件格式

表示图片中标签的位置和类别信息

实践目标检测--数据准备_第5张图片

到此,数据集准备完毕。

下一篇、构造可用于数据读取的迭代器

你可能感兴趣的:(MxNet)