计算机视觉的终极目标

计算机视觉的终极目标:让计算机自动理解图片(视频)的内容。
这个终极目标的核心其实可以拆解为一下几个任务:
1. 让计算机理解图片的场景(咖啡厅, 教室, 博物馆, 等等),
2. 理解场景中包含的物体(餐具,交通工具,人, 动物等等),
3. 理解物体所在图片中的位置(bounding box边界框的坐标, 物体的边界点),
4. 理解物体之间的关系和行为(是在交谈, 体育比赛,对抗, 等等), 以及图片所表达的抽象含义(例如表达讽刺挖苦, 暴力色情, 艺术,宗教的神圣, 大自然的壮阔, 节日的喜庆, 等等)。

如果我们可以让计算机做到这些,那么这个计算机视觉的终极目标就是可以达成的。而这些拆解完成的任务,单独或结合,也都构成了计算机视觉领域,今天在工业界和企业界中的的重要应用点。

转载链接:https://mp.weixin.qq.com/s/2VbHwigMdIHkAzynvKoDsQ

你可能感兴趣的:(knowledge)