到底什么是计算机视觉,又该如何高效使用?

  计算机视觉到底是什么,要说清什么是计算机视觉,就不得不提到人工智能、机器学习和深度学习这几个类目了。计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指利用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等,并进一步做图形处理,使其成为更适合人眼观察或传送给视觉仪器检测的图像。近些年这些概念十分火热,但很多从业者却很难说清它们之间的关系,外行人更是雾里看花,作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘图像内容信息’的人工智能系统。只有先分清这几者的区别,才知道计算机视觉是什么。概括来说,人工智能、机器学习和深度学习覆盖的技术范畴是逐层递减的,

即:人工智能> 机器学习 > 深度学习。

到底什么是计算机视觉,又该如何高效使用?_第1张图片

图1:人工智能、机器学习和深度学习三者关系示意

1. 人工智能

人工智能(ArtificialIntelligence,AI)是最宽泛的概念,是研发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。由于这个定义只阐述了目标,而没有限定方法,因此实现人工智能存在的诸多方法和分支,导致其变成一个“大杂烩”式的学科。机器学习(MachineLearning,ML)是当前比较有效的一种实现人工智能的方式。深度学习(DeepLearning,DL)是机器学习算法中最热门的一个分支,近些年取得了显著的进展,并替代了大多数传统机器学习算法.

2. 机器学习

区别于人工智能,机器学习、尤其是监督学习则有更加明确的指代。机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。

2.1机器学习的实现

机器学习的实现可以分成两步:训练和预测,类似于归纳和演绎:

归纳:从具体案例中抽象一般规律,机器学习中的“训练”亦是如此。从一定数量的样本中,学习输出与输入的关系。

演绎:从一般规律推导出具体案例的结果,机器学习中的“预测”亦是如此。基于训练得到的A与B之间的关系,如出现新的输入A,计算出输出B。通常情况下,如果通过模型计算的输出和真实场景的输出一致,则说明模型是有效的。

2.2机器学习的方法论

机器学习的方法论和人类科研的过程有着异曲同工之妙,即在“机器思考”的过程中确定模型的三个关键要素:假设、评价、优化。

3. 深度学习

机器学习算法理论在上个世纪90年代发展成熟,在许多领域都取得了成功,但随着大数据的涌现和计算机算力提升,在2010年之后,深度学习模型异军突起,极大改变了机器学习的应用格局。今天,多数机器学习任务都可以使用深度学习模型解决,尤其在语音、计算机视觉和自然语言处理等领域,深度学习模型的效果比传统机器学习算法有显著提升。

相比传统的机器学习算法,深度学习做出了哪些改进呢?其实两者在理论结构上是一致的,即:模型假设、评价函数和优化算法,其根本差别在于假设的复杂度

4. 计算机视觉

计算机视觉的发展历程要从生物视觉讲起。对于生物视觉的起源,目前学术界尚没有形成定论。有研究者认为最早的生物视觉形成于距今约7亿年前的水母之中,也有研究者认为生物视觉产生于距今约5亿年前寒武纪。

寒武纪生物大爆发的原因一直是个未解之谜,不过可以肯定的是在寒武纪动物具有了视觉能力,捕食者可以更容易地发现猎物,被捕食者也可以更早的发现天敌的位置。视觉能力加剧了猎手和猎物之间的博弈,也催生出更加激烈的生存演化规则。视觉系统的形成有力地推动了食物链的演化,加速了生物进化过程,是生物发展史上重要的里程碑。经过几亿年的演化,目前人类的视觉系统已经具备非常高的复杂度和强大的功能,人脑中神经元数目达到了1000亿个,这些神经元通过网络互相连接,这样庞大的视觉神经网络使得我们可以很轻松的观察周围的世界。

对人类来说,识别猫和狗是件非常容易的事。但对计算机来说,即使是一个精通编程的高手,也很难轻松写出具有通用性的程序(比如:假设程序认为体型大的是狗,体型小的是猫,但由于拍摄角度不同,可能一张图片上猫占据的像素比狗还多)。那么,如何让计算机也能像人一样看懂周围的世界呢?研究者尝试着从不同的角度去解决这个问题,由此也发展出一系列的子任务。

(a) Image Classification:图像分类,用于识别图像中物体的类别。

(b) Object Localization:目标检测,用于检测图像中每个物体的类别,并准确标出它们的位置。

(c)Semantic Segmentation:图像语义分割,用于标出图像中每个像素点所属的类别,属于同一类别的像素点用一个颜色标识。

(d) Instance Segmentation:实例分割,不仅要标注出物体位置,还需要标注出物体的外形轮廓。

在早期的图像分类任务中,通常是先人工提取图像特征,再用机器学习算法对这些特征进行分类,分类的结果强依赖于特征提取方法,往往只有经验丰富的研究者才能完成。

对计算机而言,能够“看到”的是图像被编码之后的数字,但它很难理解高层语义概念,比如图像或者视频帧中出现的目标是人还是物体,更无法定位目标出现在图像中哪个区域。目标检测的主要目的是让计算机可以自动识别图片或者视频帧中所有目标的类别,并在该目标周围绘制边界框,标示出每个目标的位置,

到底什么是计算机视觉,又该如何高效使用?_第2张图片

有关计算机视觉方面的使用,前景,就业还有很多很多,此处就不多做介绍了,为了方便大家,我也整理了很多计算机视觉,机器学习,深度学习方面的学习资料,包含:论文,视频,文章,行业报告,书籍,项目代码等

免费分享给大家,整理了很久,非常全面。包括一些人工智能基础入门视频+AI常用框架实战视频、图像识别、OpenCV、NLP、YOLO、机器学习、pytorch、计算机视觉、深度学习与神经网络等视频、课件源码、国内外知名精华资源、AI热门论文等。

免费分享私信“学习”就可以了,有惊喜,先到先发

​​​​​​​

你可能感兴趣的:(计算机视觉cv,计算机视觉,人工智能,深度学习,神经网络)