1.前言部分

本笔记对应b站视频《计算机视觉与深度学习》北京邮电大学鲁鹏的视频。
#个人总结:这一部分主要是对于计算机视觉的整体历史回顾介绍,以及课程的安排讲解。
*1.计算机视觉的一些使用方向:网络上的搜索查询、现实图像的图像增强、监控数据的管理、医学图像的分析、导航的图像采集分析、星云分析和气象预测等等;
*2.计算机视觉与哪些学科相关:从神经科学和认知科学的角度给cv提供了思路和导向,算法和理论以及系统等则是cv具体分析和使用的工具,机器学习技术是cv具体应用的技术点,光学传感器optics等则可以用于图像的获取和采集,图像处理与计算机视觉之间还是有差距的,图像处理更侧重于输入的是图像,输出的还是图像,侧重于图像的底层分析和处理,而计算机视觉的输出不局限于图像,更加倾向于对于图像的分析,识别和理解层面;speech指的是语音的识别,而NLP技术则主要是从文本到意图或者说表达含义的具体理解。实际使用时CV与NLP也有交叉的研究,比如说研究跨模态或者看图说话,根据文本生成图片等等。计算机视觉实际落地则可以以机器人作为载体。Robotics。
*3.相关课程的推荐:推荐计算机视觉领域的
CS131:侧重于12年以前的图像处理技术;
CS231a:主要是三维重建和3维结构;
CS230:主要是深度学习,吴恩达等人讲述,值得学习;
CS231n:重点,主要是12年后的计算机视觉和深度学习技术,卷积神经网络等。
4.从象棋的角度思考与智能之间的关系:如何定义机器智能(机器智能不同于人类的智能):针对下象棋这件事,如何下象棋对于人类和对于电脑机器来说是一件完全不同的事情,对于机器来说,下棋是在有限时间内进行快速搜索的事情,对于人类来说却不是这样,因而我们不能从人类的角度去衡量机器智能。
5.什么是计算机视觉:对于人来说,图像或者视频首先经过感知设备眼睛获取,再通过解释器大脑进行理解,得到具体的解释;从此我们可以归纳出计算机视觉的处理方式,使用摄像机作为感知设备对于图像或者视频进行感知,计算机相当于大脑作为解释器,最后的得到对于采集到的图像的理解。
6.计算机视觉的目标是什么:跨越语义鸿沟建立像素到语义的映射。比如说我们看到的一张灰度图像。每个点的像素都只是用0-255共256个等级的灰度来表示。机器看到的是一个数据矩阵。
7.人类从鸟的角度思考去发明了飞机,但是实际的飞机却不需要和鸟一样煽动翅膀,但这不影响人们在探索过程中发现了空气动力学,发现了升力的存在,在研究人工智能的过程中也没必要完全按照人脑的形式去模仿。
8.计算机视觉的三大理论(来自计算机视觉之父大卫马尔):
(1)计算理论:计算的目的是什么,该问题已知或可以施加的约束是什么?
(2)表达和算法:输入、输出和中间信息是如何表达的?使用哪些算法来计算所期望的结果?
(3)硬件实现:表达和算法是如何映射到实际硬件即生物视觉系统或者特殊的硅片上的,相反的,硬件的他约束怎样才能用于指导表达和算法的选择?随着计算机施虐中使用图形芯片和多核结构日益增长,这个问题变得更加重要。
9.视觉表达的三个阶段:输入图像——简单2D特征——3D模型;
10.图像中包含哪些信息:三维场景的结构信息或者语义信息。三维场景的结构信息代表着三维信息的获取,语义信息则与识别任务密切相关,将结构信息和语义信息结合可以构建完整的图像信息。
11.计算机视觉研究进展:从20世纪70年代至今,聪数字图像处理、人脸识别等到卷积网络等等,在计算机视觉发展的过程中主要是任务与算法交替发展的过程。
12.计算机视觉的一些应用:(1)计算机视觉与动画产业:如根据实际任务进行动画的三维重建,或者是进行人体的关键点或者是荧光点去进行运动捕捉技术;(2)计算机视觉与三维建模:在3维建模的过程中主要是3D建模和SLAM技术等;(3)计算机视觉与摄影:摄影过程中涉及的一些计算机视觉技术有人脸检测、人脸捕捉等辅助拍摄手段;(4)计算机视觉与生物识别技术:比如说虹膜识别:对于人的虹膜进行拟合匹配最后展开信息是否完整的判断识别(虹膜信息不随着时间的变化而变化);(5)计算机视觉与生物识别:指纹识别、人脸识别技术等;(6)光学字符识别比如手写字符识别、车牌识别等;(7)计算机视觉与家用机器人:机器人内置算法、自我定位和轨迹规划等等;(8)计算机视觉与视觉搜索、服饰识别、穿戴等等;(9)计算机视觉在自动驾驶和无人驾驶中的应用:综合应用,范围更广;(10)新零售、人机交互(游戏、眼动识别、增强现实等);(11)计算机视觉与机器人、太空探索、医学图像、气象学等等的关系。
13.课程聚焦于图像分类任务。视觉识别中与图像分类任务相关的有很多。如目标检测、图像分割、图像描述、图像生成等。深度学习三要素算法、数据和算力。
课程详细安排
1.前言部分_第1张图片
1.前言部分_第2张图片

你可能感兴趣的:(计算机视觉与深度学习笔记,计算机视觉)