基于深度学习的篮球比赛战术数据自动采集及统计系统——1数据集构建

前言:

        本篇文章主要介绍第一个模块:数据集构建。本篇文章的内容很关键,构建的数据集是能够实现训练后续三个模块的基石,所以构建一个符合训练格式的数据集尤为重要。本文将介绍如何构建数据集以及各模块数据集格式的讲解。

        如果对于这一部分数据集构建的理解有点困难,可以先看后面的目标检测等模块,可以对这一部分数据集的意义有所理解,

原始csv数据集的构建:

        标注软件的使用方法见博客  标注软件使用说明

        1.获取image数据集:本人基于Qt5开发了一个视频抽帧界面,可获取视频帧得到.jpg图像

        2.获取csv数据集:本人基于Qt5开发了一个标注数据集的软件

 标注完毕后形成input.csv文件。样式如下:

基于深度学习的篮球比赛战术数据自动采集及统计系统——1数据集构建_第1张图片

第1列video_name:记录了标注视频的编号。视频命名格式为xxxx_1.mp4,_ 后面为视频编号。

第2列frame_id: 记录了图片的帧数

第3-6列x1,y1,x2,y2:记录了框的位置坐标

第7列action_id:记录了动作对应的id

第8列persion_id: 记录了人员标签

到这,原始数据集的构建完毕,接下来就要基于这个csv格式下的原始数据集来形成每个模块我们需要的数据集。

各模块的数据集摆放格式:

1.yolov5数据集格式:

采取VOC格式的数据集:

 其中Annotations文件夹下存放.xml文件,JPEGImages文件夹下存放原图片。这两个文件需要我们手动导入。

所以我们重点需要的是.xml文件,那么这个.xml文件是用来干什么的呢?

首先,给出.xml文件的部分截图:

基于深度学习的篮球比赛战术数据自动采集及统计系统——1数据集构建_第2张图片

 的内容为图片的宽高和通道数。这个宽高很重要,标注的图片获取框的位置的尺度要与该宽高相对应,否则后续无法训练。

这里是我们在xml文件中主要用到的内容。为标签名,为框的位置。

综上,.xml文件就是用来提供人物标签和位置的。

2.deepsort数据集格式:

基于深度学习的篮球比赛战术数据自动采集及统计系统——1数据集构建_第3张图片

其中,annotations文件夹下存放.xml文件,images下存放原始图片。这两个文件我们需要手动导入。(同yolov5摆放)

3.slowfast的ava数据集摆放格式:

基于深度学习的篮球比赛战术数据自动采集及统计系统——1数据集构建_第4张图片

其中frame存放原始图片。只有这一个文件需要手动导入。

由input.csv原始文件一键生成.xml文件和ava格式下的csv文件

        我们现在知道了各个模块数据集摆放格式,那么如何获得我们需要的.xml文件和ava格式下的各种csv文件呢?

        本项目编写了convert_to_xml_ava.py文件,支持由input.csv一键生成.xml文件和ava格式下的各种csv文件。convert_to_xml_ava.py中需要输入的文件路径如下:

基于深度学习的篮球比赛战术数据自动采集及统计系统——1数据集构建_第5张图片

至此,三个模块所用的数据集均已构建完毕,我们可以基于数据集训练下三个模块。

下面进入目标检测模块。

你可能感兴趣的:(深度学习,人工智能,数据库,python)