计算机视觉企业场景应用?CV算法学习复盘:七月CV高级小班第八期

# 企业应用场景 

企业场景一 大规模跨镜追踪/重识别 (ReID)

行人重识别 (Person RelD)广泛应用于智慧城市、智慧交通、新零售、安防监控等领域,是利用CV技术判断图像或者视频序列中是否存在特定行人的技术,其本质是一个图像检索的子问题。即给定一个监控行人图像,检索跨设备下的该行人图像。该技术旨在弥补固定的摄像头的视觉局限,并可与行人检测/行人跟踪技术相结合部署一套完整的行人重识别工业级别系统。本项目重点涵盖以下流程:

1、代码实践

  1. 搭建基线解决方案(如从交叉熵损失出发构建深度特征学习、定制Data Loader实现高级预处理等)
  2. 评价指标
  3. 优化迭代(如深度排序损失函数的优雅实现、多任务训练技术、标签平滑/随机擦除/在线困难样本挖掘技术等训练技巧、微调近似特征中心、批规范化运用技巧解决多任务训练引1起的特征冲突现象等)

企业场景二  多模态图文搜索系统--实战感受Transformer

场景介绍:多模态信息理解和检索是2021年学界和业界最热的技术和话题,尤其是当长短视频、新间、视频号、朋友圈等PGC和

UGC的内容以多模态(图片、视频、文本、音频等)形式呈现,加速了多模态信息理解和检索技术的升级,BAT、字节跳动、爱奇艺、美团点评、优酷等各大厂商都在布局和招聘多模态技术算法人才。

涉及技术:在技术阶段讲过的Transformer、Vision Transformer等内容基础上,本次项目将继续补充多模态信息检索的前沿技术,如自监督学习(Self-supervised Learning)技术、2021年OpenAl提出的CLIP (Connecting Images and Text) 等最新技术内容。Transformer/BERT强大“编码”(Encode )能力。

企业场景三 人体姿态估计系统

人体姿态估计又名人体骨路关节点检测或人体关键点提取,是计算机视觉的基础性算法之一,在计算机视觉的其他相关领域的研究中都起到了基础性的作用,如行为识别、人物跟踪、步态识别等相关领域。具体应用主要集中在智能视频监控,病人监护系统,人机交互,虚拟现实,人体动画,智能家居,智能安防,运动员辅助训练等等。

企业场景四 视觉跟踪系统

项目介绍:视觉是人类认知世界的重要途径之一,人类获取外部信息的80%来自视觉系统。计算视觉追踪就是在了解人类视觉基础上,用成像系统代替人类视觉器官,用计算级代替人脑完成对输入图像的处理气理解。通过对连续的图像序列进行运动目标检测、提取特征、行为识别,以获得目标准确的运动信息参数(如位置、速度等),并对其进行相应的处理分析,实现对目标的行为理解。其在安全防护、体育竞赛、无人驾驶等领域有着广泛地应用。

涉及技术:将从目标检测之Anchor Free方向下大火的Cen-terNet入手,过渡到视觉追踪的Center Track (2021)。从视觉追踪系统的网络模型搭建、训练、优化及测试入手,深入挖掘视觉追踪系统的魅力。

企业场景五 基于GNN的论文引用查询系统

视觉是人类认知世界的重要途径之一,人类获取外部信息的80%来自视觉系统。计算视觉追踪就是在了解人类视觉基础上,用成像系统代替人类视觉器官,用计算级代替人脑完成对输入图像的处理与理解。通过对连续的图像序列进行运动目标检测、提取特征、行为识别,以获得目标准确的运动信息参数(如位置、速度等),并对其进行相应的处理分析,实现对目标的行为理解。其在安全防护、体育竞賽、无人驾驶等领域有着广泛地应用。

涉及技术:本项目将从目标检测之Anchor Free方向下大火的Cen-terNet入手,过渡到视觉追踪的Center Track (2021)。从视觉追踪系统的网络模型搭建、训练、优化及测试入手,深入挖掘视觉追踪系统的魅力。

企业场景六 基于深度学习的因像分割系统

图像分割一直是计算机视觉领域的一个研究热点,尤其在深度学习技术的推动下,图像分割开始从研究走向应用,图像分割广泛应用于机器人导航,自动驾驶,图像的艺术化处理,短视频编辑等等领域。

搭建一个基于深度学习的图像分割系统,并应用于实际应用中,并对图像分割领域的最新研究理论有深入的理解和思考。

项目一 SLAM三维重建系统

SLAM(simultaneous localization and mapping)同时构建地图和

定位是近年来计算机视觉领域的研究热点,广泛应用于AR导航,机器人,自动驾驶等等热点领域。通过本项目,我们能够对SLAM

理论基础,最新研究进展有深入的理解和思考,并能够搭建一套应用于工业界的SLAM系统,用于对特定物体和场景进行实时精确的三维重建。

项目二 给定图像自动生成描述

给出一张图,对图像做出描述,比如一个穿着黑衣服的人在弹吉他。该项目涉及多个视觉重的子任务,例如检测、识别;又和自然语言处理结合紧密(RNN/LSTM)。

通过该项目的训练,学员能将过去学过的知识融会贯通,掌握

high-level计t算机视觉任务是如何从底层子任务构建起来的。

项目三 基于自监督的图像表征学习

Automatec〝如果人工智能是一块蛋糕,那么蛋糕的大部分是自监督学习,蛋糕上的糖衣是监督学习,蛋糕上的樱桃是强化学习"。Yann Lecun

在他的演讲中引入了“蛋糕类比”来说明自监督学习的重要性。2020年,基于自监督学习的图像表征学习再次刷新了计算机视觉

各大Benchmark,凭借着以Contrastive Loss为主流的自监督学习框架,充分发挥了无标注数据的能量,通过自监督学习得到的图像表征将能更加高效地送入下游分类、检测、分割等任务。

# 学习路径

学完七月CV高级小班第八期,各企业应用场景的代码以及思路,分享给大家,整理资料如下,自取哈~

链接:https://pan.baidu.com/s/15DY4pWzzWuGpuCkbyui8og 
提取码:x0c9 
 

辛苦整理,欢迎点赞收藏哈~

你可能感兴趣的:(CV,人工智能,深度学习,opencv)