赛题名称:视频全量目标分析和建模
赛题简介:人工智能结合视觉分析,极大推动各行业视觉应用。人脸识别、车辆测别、车辆智能驾驶等。结合当前高清1080P、2K、4K等视频,利用人工智能进行视觉分析技术,具有广泛得应用场景。
业务场景:针对10分钟1080P视频,视频内容街景(行车记录仪、电影等拍摄)内容,需要利用视觉分析技术,对高分辨率视频进行视频图像语义分割,赛题要求参赛者给出测试视频数据中每帧的每个点的类别预测。本赛题是为了对街景或高楼的高清视频进行目标检测和语义分割,相比于基于现有的方案进行简单的调参,我们更鼓励参赛者提出创新的深度学习算法模型解决方案。
基本功能要求:
场景要求是基于华为AI昇腾平台,重点考核建筑物等固定目标得识别和分割。
基本要求如下:
1、视频内容内移动目标识别,包括人、机动车、非机动车、建筑、植物等;
2、实现对高清视频的图像语义分割,对每帧的每个点的类别预测;
3、基于华为昇腾AI平台进行开发。
例如以下实现方式:
参考资料:基于目标建模的视频图像目标检测研究 https://www.ixueshu.com/document/994906362d7885decca0479d5b18b1b9318947a18e7f9386.html
视频跟踪中的目标建模及相似性度量研究:http://xueshu.baidu.com/usercenter/paper/show?paperid=ca30c97dd3c6ed4a2e9527f102220322&site=xueshu_se
python读取视频显示视频和保存视频文件:https://blog.csdn.net/qq_18343569/article/details/50275305
开发环境及语言:
华为云 python
江苏鲲鹏生态创新中心提供AI开发和训练平台,(AI平台会提供基础的开发和训练环境。数据集参考VOC、COCO、cityscapes-image-pairs及Semantic Segmentation for Self Driving Cars等),开发者可以向江苏鲲鹏生态创新中心获取账号和资源。开发语言、深度学习框架及数据库等不限制。
江苏鲲鹏生态创新中心提供AI开发和训练平台,(视频资源自备,电影或者实际拍摄),开发者可以向江苏鲲鹏生态创新中心获取账号和资源。开发语言、深度学习框架及数据库等不限制。
功能需求
可导入一段10分钟1080P视频
视频内容内移动目标识别,包括人、机动车、非机动车、建筑、植物等;
实现对高清视频的图像语义分割,对每帧的每个点的类别预测
对不同事物进行不同颜色标记并可以剔除
性能需求
实现移动目标5种识别以上
实现移动目标10种识别,其中建筑物必须识别。
系统良好运行