企业场景一 大规模跨镜追踪/重识别 (ReID)
行人重识别 (Person RelD)广泛应用于智慧城市、智慧交通、新零售、安防监控等领域,是利用CV技术判断图像或者视频序列中是否存在特定行人的技术,其本质是一个图像检索的子问题。即给定一个监控行人图像,检索跨设备下的该行人图像。该技术旨在弥补固定的摄像头的视觉局限,并可与行人检测/行人跟踪技术相结合部署一套完整的行人重识别工业级别系统。本项目重点涵盖以下流程:
1、代码实践
企业场景二 多模态图文搜索系统--实战感受Transformer
场景介绍:多模态信息理解和检索是2021年学界和业界最热的技术和话题,尤其是当长短视频、新间、视频号、朋友圈等PGC和
UGC的内容以多模态(图片、视频、文本、音频等)形式呈现,加速了多模态信息理解和检索技术的升级,BAT、字节跳动、爱奇艺、美团点评、优酷等各大厂商都在布局和招聘多模态技术算法人才。
涉及技术:在技术阶段讲过的Transformer、Vision Transformer等内容基础上,本次项目将继续补充多模态信息检索的前沿技术,如自监督学习(Self-supervised Learning)技术、2021年OpenAl提出的CLIP (Connecting Images and Text) 等最新技术内容。Transformer/BERT强大“编码”(Encode )能力。
企业场景三 人体姿态估计系统
人体姿态估计又名人体骨路关节点检测或人体关键点提取,是计算机视觉的基础性算法之一,在计算机视觉的其他相关领域的研究中都起到了基础性的作用,如行为识别、人物跟踪、步态识别等相关领域。具体应用主要集中在智能视频监控,病人监护系统,人机交互,虚拟现实,人体动画,智能家居,智能安防,运动员辅助训练等等。
企业场景四 视觉跟踪系统
项目介绍:视觉是人类认知世界的重要途径之一,人类获取外部信息的80%来自视觉系统。计算视觉追踪就是在了解人类视觉基础上,用成像系统代替人类视觉器官,用计算级代替人脑完成对输入图像的处理气理解。通过对连续的图像序列进行运动目标检测、提取特征、行为识别,以获得目标准确的运动信息参数(如位置、速度等),并对其进行相应的处理分析,实现对目标的行为理解。其在安全防护、体育竞赛、无人驾驶等领域有着广泛地应用。
涉及技术:将从目标检测之Anchor Free方向下大火的Cen-terNet入手,过渡到视觉追踪的Center Track (2021)。从视觉追踪系统的网络模型搭建、训练、优化及测试入手,深入挖掘视觉追踪系统的魅力。
企业场景五 基于GNN的论文引用查询系统
视觉是人类认知世界的重要途径之一,人类获取外部信息的80%来自视觉系统。计算视觉追踪就是在了解人类视觉基础上,用成像系统代替人类视觉器官,用计算级代替人脑完成对输入图像的处理与理解。通过对连续的图像序列进行运动目标检测、提取特征、行为识别,以获得目标准确的运动信息参数(如位置、速度等),并对其进行相应的处理分析,实现对目标的行为理解。其在安全防护、体育竞賽、无人驾驶等领域有着广泛地应用。
涉及技术:本项目将从目标检测之Anchor Free方向下大火的Cen-terNet入手,过渡到视觉追踪的Center Track (2021)。从视觉追踪系统的网络模型搭建、训练、优化及测试入手,深入挖掘视觉追踪系统的魅力。
企业场景六 基于深度学习的因像分割系统
图像分割一直是计算机视觉领域的一个研究热点,尤其在深度学习技术的推动下,图像分割开始从研究走向应用,图像分割广泛应用于机器人导航,自动驾驶,图像的艺术化处理,短视频编辑等等领域。
搭建一个基于深度学习的图像分割系统,并应用于实际应用中,并对图像分割领域的最新研究理论有深入的理解和思考。
项目一 SLAM三维重建系统
SLAM(simultaneous localization and mapping)同时构建地图和
定位是近年来计算机视觉领域的研究热点,广泛应用于AR导航,机器人,自动驾驶等等热点领域。通过本项目,我们能够对SLAM
理论基础,最新研究进展有深入的理解和思考,并能够搭建一套应用于工业界的SLAM系统,用于对特定物体和场景进行实时精确的三维重建。
项目二 给定图像自动生成描述
给出一张图,对图像做出描述,比如一个穿着黑衣服的人在弹吉他。该项目涉及多个视觉重的子任务,例如检测、识别;又和自然语言处理结合紧密(RNN/LSTM)。
通过该项目的训练,学员能将过去学过的知识融会贯通,掌握
high-level计t算机视觉任务是如何从底层子任务构建起来的。
项目三 基于自监督的图像表征学习
Automatec〝如果人工智能是一块蛋糕,那么蛋糕的大部分是自监督学习,蛋糕上的糖衣是监督学习,蛋糕上的樱桃是强化学习"。Yann Lecun
在他的演讲中引入了“蛋糕类比”来说明自监督学习的重要性。2020年,基于自监督学习的图像表征学习再次刷新了计算机视觉
各大Benchmark,凭借着以Contrastive Loss为主流的自监督学习框架,充分发挥了无标注数据的能量,通过自监督学习得到的图像表征将能更加高效地送入下游分类、检测、分割等任务。
学完七月CV高级小班第八期,各企业应用场景的代码以及思路,分享给大家,整理资料如下,自取哈~
链接:https://pan.baidu.com/s/15DY4pWzzWuGpuCkbyui8og
提取码:x0c9
辛苦整理,欢迎点赞收藏哈~