(计算机视觉笔记)1、初入计算机视觉

计算机视觉笔记
1、初入计算机视觉


文章目录

  • 一、人工智能
    • 1、什么是人工智能
    • 2、人工智能三大核心要素
    • 3、算法概念
    • 4、机器学习
    • 5、深度学习
    • 6、神经网络
  • 二、计算机视觉
    • 1、什么是计算机视觉
    • 2、研究方向
    • 3、专业工具
    • 4、应用领域
  • 三、总结


一、人工智能

1、什么是人工智能

被广泛接受的说法:人工智能是通过机器来模拟人类认知能力的技术。人工智能最核心的能力就是根据给定的输入做出判断或预测。该领域的研究包括机器人、图像识别、语言识别、自然语言处理和专家系统等。

深度学习的崛起和AI的三次热潮:
(计算机视觉笔记)1、初入计算机视觉_第1张图片

2、人工智能三大核心要素

数据、算法、算力。这三要素缺一不可,都是人工智能取得成就的必备条件。

3、算法概念

百度说法:算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。

简单点说,当交给计算机一个任务的时候,不但要告诉它做什么,还要告诉它怎么做。关于“怎么做”的一系列指令就叫做算法。

4、机器学习

机器学习是一种实现人工智能的方法,是计算机系统为了有效地执行特定任务,不使用明确的指令,而依赖模式和推理使用的算法和统计模型的科学研究。
机器学习≈构建一个函数
(计算机视觉笔记)1、初入计算机视觉_第2张图片

举个例子,一般的狗,一般全身披覆着毛,由头、颈、躯体、尾巴和四肢等组成。前端是头部,以两眼为界可分为额部与颜面部,额部较短,在头部上方,狗的鼻子特别长,约占颜面的2/3。而机器学习相当于通过判断是否有毛,是否由头、颈、躯体、尾巴和四肢等组成,通过数据不断输入,模型不断优化,预测是否具有上述的一些特点来判断它是不是狗。
(计算机视觉笔记)1、初入计算机视觉_第3张图片
推荐:机器学习入门好文

5、深度学习

深度学习是一类机器学习算法:使用多个层逐步从原始输入中逐步提取更高级别的特征。例如,在图像处理中,较低层可以识别边缘,而较高层可以识别对人类有意义的部分,例如数字/字母或面部。

(计算机视觉笔记)1、初入计算机视觉_第4张图片

推荐:一文看懂深度学习
(计算机视觉笔记)1、初入计算机视觉_第5张图片

6、神经网络

神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术。

推荐:神经网络——最易懂最清晰的一篇文章

二、计算机视觉

1、什么是计算机视觉

几个严谨的定义:
1、对图像中的客观对象构建明确而有意义的描述(Ballard&Brown,1982)
2、从一个或多个数字图像中计算三维世界的特性(Trucco&Verri,1998)
3、基于感知图像做出对客观对象和场景有用的决策(Sockman&Shapiro,2001)

用一句话概括:就是让机器人拥有人能所见、人能所识、人能所思的能力,就说计算机拥有视觉,既计算机视觉。
(计算机视觉笔记)1、初入计算机视觉_第6张图片

2、研究方向

物体识别和检测,语义分割,运动和跟踪,三维重建,人体姿态识别等。

1、物体识别和检测:既给定一张输入图片,通过算法能够自动找到目标,并将属性及位置输出出来,例如:水杯识别,人脸检测,车辆检测等
(计算机视觉笔记)1、初入计算机视觉_第7张图片
(计算机视觉笔记)1、初入计算机视觉_第8张图片

2、语义分割:物体检测和识别通常是将物体在原图像上框出,语义分割是从每一个像素上进行分类,图像中的每一个像素都有属于自己的类别。

(计算机视觉笔记)1、初入计算机视觉_第9张图片
3、三维重建:指的是对输入图像进行分析处理,再结合计算机视觉知识推导出现实环境中物体的三维信息。
(计算机视觉笔记)1、初入计算机视觉_第10张图片

4、人体姿态识别:既对输入图片中的人进行头、手、身体、腿进行识别、连接相当于一个火柴人。
在这里插入图片描述

3、专业工具

编程语言:Python,matlab,c++等
计算机视觉包:opencv,halcon等
深度学习框架:tensorflow(偏向静态图识别),pytorch(偏向动态流识别,且一句一句执行),keras等

4、应用领域

安防,交通,工业生产,在线购物,信息检索,游戏娱乐,摄影,摄像,机器人/无人机,体育,医疗等

三、总结

计算机视觉要好的数学基础,对相机摄影有一定了解,其涉及领域范围广,需要不断积累,路漫漫其修远兮,共勉。
附上:计算机视觉技能书
(计算机视觉笔记)1、初入计算机视觉_第11张图片

你可能感兴趣的:(计算机视觉,人工智能)