[Datawhale AI 夏令营][第五期]智能识别系统-Task1笔记

任务是发布在MARS大数据服务平台的2024“大运河杯”数据开发应用创新大赛——城市治理。了解智慧河长的朋友可能听说类似的项目,它们可以识别河道中出现的一些问题。这次的智能识别系统与前者有相似的地方,但这个系统将聚焦城市违规行为的智能检测,通过研究开发高效可靠的计算机视觉算法,提升违规行为检测识别的准确度,降低对大量人工的依赖,提升检测效果和效率,从而推动城市治理向更高效、更智能、更文明的方向发展,为居民创造一个安全、和谐、可持续的居住环境。

在Datawhale AI夏令营中的第五期中,我们将学习CV相关的内容,主要实践的模型是YOLO模型。Task 1主要是跑通baseline,了解YOLO算法。YOLO是You only look once (YOLO) 的缩写,通常被是物体检测。YOLO模型的核心思想是将目标检测任务视为一个单一的回归问题,通过一个卷积神经网络(CNN)直接从图像像素到边界框坐标和类别概率的映射。YOLO使用的标注格式是每张图像一个文本文件,文件名与图像文件名相对应。文本文件中每一行对应一个边界框,格式为:
其中,是类别索引,是边界框中心点相对于图像宽度和高度的比例,是边界框的宽度和高度相对于图像宽度和高度的比例。

赛事的数据集由MP4格式的视频数据(城管视频监控数据)、JSON格式的标注数据(对应违规行为)组成,每个视频对应一个JSON标注。

- frame_id:违规行为出现的帧编号
- event_id:违规行为ID
- category:违规行为类别
- bbox:检测到的违规行为矩形框的坐标,[xmin,ymin,xmax,ymax]形式

评价指标包含F1score、MOTA指标。

Task1的内容给比较简单,利用算力平台厚德云几分钟内跑完了baseline的脚本。Task2将会精读baseline代码。

你可能感兴趣的:(人工智能,笔记)