人工智能 机器学习 深度学习

人工智能是一个很老的概念,机器学习是人工智能的一个子集,深度学习又是机器学习的一个子集。机器学习与深度学习都是需要大量数据来“喂”的,是大数据技术上的一个应用,同时深度学习还需要更高的运算能力支撑,如GPU。

题外话:人工智能需要大数据,因为人工智能程序到处都是,但数据是稀缺的,像淘宝有购物数据,百度有搜索数据,特斯拉有驾驶数据,所以大公司在人工智能方面就比小公司有优势。人工智能 机器学习 深度学习_第1张图片

人工智能(本质是统计学,给出数据后,程序从数据中找到规律,之后就可以用这个程序来解决问题了)

智慧是与人类相关的一种特征,因此当我们尝试在机器中模仿这种智能时,我们将其称为人工智能。

人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。(任何模拟人类行为的方法都可以成为人工智能)

如图像识别、NLP,其实依然没有脱离这个范围,说白了,就是“模拟人在看图方面的智能”和“模拟人在听话方面的智能”,本质上和“模拟人在计算方面的智能”没啥两样,虽然难度有高低,但目的是一样的——模拟、延伸和扩展人的智能。

缺点:根据以往的数据解决问题,所以它解决不了新的问题。

编程是显示方法,我们需要定义每个可能的方案以及该方案对应的操作。机器学习是人工智能的一部分,但是这里的主要区别是他不是基于显示编程的。这意味着,代替我们为机器定义规则,机器本身将学习规则。

机器学习(换一个词,数据分析)

机器学习就是用算法解析数据,不断学习,对世界中发生的事做出判断和预测的一项技术。研究人员不会亲手编写软件、确定特殊指令集、然后让程序完成特殊任务;相反,研究人员会用大量数据和算法“训练”机器,让机器学会如何执行任务。

这里有三个重要的信息:1、“机器学习”是“模拟、延伸和扩展人的智能”的一条路径,所以是人工智能的一个子集;2、“机器学习”是要基于大量数据的,也就是说它的“智能”是用大量数据喂出来的,如果缺少海量数据,它也就啥也不是了;3、正是因为要处理海量数据,所以大数据技术尤为重要;“机器学习”只是大数据技术上的一个应用。常用的10大机器学习算法有:决策树、随机森林、逻辑回归、SVM、朴素贝叶斯、K最近邻算法、K均值算法、Adaboost算法、神经网络、马尔科夫。

机器学习算法通常分为以下三大类:

有监督学习:需要从有标签的数据中学到或者建立一个模式。
  • 有监督学习又分为分类(类别是既定数量的)和回归(需要应对持续变化的数据,而不是有限的分类)。
  • 像刚出生的宝宝一样,有父母教你这是啥那是啥,然后自己学。
无监督学习:数据是无标签的,机器学习算法需要先将数据分类,然后对数据结构进行描述,使复杂的数据看起来简单,以便进行后续分析工作。
  • 可进一步分为聚类(店铺选址,购物应用感兴趣物品,搜索引擎搜相同图片等),关联,降维(减小数据体积,消除冗余),以及特征提取。
  • 像原始人类,没人告知什么是什么,需要自己分类,就像生物学家一样。
强化学习:与监督学习相似,通过不断地探索学习,从而获得一个好的策略。
  • 做出决策的一方被称作主体,它存在环境中主题每做出一个动作,环境都会给予反馈,主体评估反馈后决定下一个动作。一切动作的基础都是回报,目标是未来的回报尽可能大。拿五子棋举例,每落下一子,对方都会再落一子,这是主体就要认识新的局面,也就是新的环境,分析判断后再行动,主体的目标是尽可能在更多的棋局中获胜。
  • 主体的每个行动都会改变环境,所以无法使用数据集训练,只能通过真实环境或模拟器产生的数据来学习。
  • 计算量大,效率低,除AlphaGo,和Game AI外,落地应用并不多。现实中存在很多强化学习问题,推荐系统每次推荐都会影响人们的购买,系统需要根据新的市场数据给出心的推荐;股票市场中,每个人的买入卖出都会影响股价,交易系统需要理解新的环境后再行动。
  • 强化学习分为两类。一类是基于模型的,试图用模型模拟真实环境;另一类是无模型的,不模拟环境,根据反馈数据建关于回报的模型。
  • 在以上三种学习中,最接近人的学习方式,主体就像蹒跚学步的孩子,迈出的每一步都会根据现实世界的反馈不断调整自己的姿态,在跌倒中学会行走。

机器需要人提供特征进行学习。

深度学习 :不需定义特征,机器自行决定哪些特征是相关的,并根据给定的数据进行自我训练。

深度学习的思想是受到由数十亿个神经元组成的人脑的启发,基于这种神经元的架构,我们创建了一个人工神经网络。当这个神经网络具有多层(多个隐藏层)时,我们称其为深度神经网络,因此叫深度学习。

深度学习是一个比较新的概念,算是00后,严格地说是2006年提出来的。是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术。

例如自动驾驶,作为人类,我们通过眼睛看到周围的环境,并以此为基础来决定汽车是否要制动,加速还是转向,我们通过多年的驾驶实践来习得开车技能。我们可以通过相同的方式,从摄像机收集图像,并记录启动角加速度和刹车等数值,然后我们可以通过这些数据来训练机器,当像机器展示一副新图片,机器就能根据图片自己决定怎样加速,转向和刹车。

它的基本特点,是试图模仿大脑的神经元之间传递,处理信息的模式。最显著的应用是计算机视觉和自然语言处理领域。显然,“深度学习”是与机器学习中的“神经网络”是强相关,“神经网络”也是其主要的算法和手段;或者我们可以将“深度学习”称之为“改良版的神经网络”算法。深度学习又分为卷积神经网络(Convolutional neural networks,简称CNN)和深度置信网(Deep Belief Nets,简称DBN)。其主要的思想就是模拟人的神经元,每个神经元接受到信息,处理完后传递给与之相邻的所有神经元即可。

Google的TensorFlow是开源深度学习系统一个比较好的实现,支持CNN、RNN和LSTM算法,是目前在图像识别、自然语言处理方面最流行的深度神经网络模型。

机器学习与深度学习区别

  1. 特征工程:我们在训练一个模型的时候,需要首先确定有哪些特征。在机器学习方法中,几乎所有的特征都需要通过行业专家在确定,然后手工就特征进行编码。然而深度学习算法试图自己从数据中学习特征。这也是深度学习十分引人注目的一点,毕竟特征工程是一项十分繁琐、耗费很多人力物力的工作,深度学习的出现大大减少了发现特征的成本。

  2. 解决问题方式:在解决问题时,传统机器学习算法通常先把问题分成几块,一个个地解决好之后,再重新组合起来。但是深度学习则是一次性地、端到端地解决。
    如果任务是要识别出图片上有哪些物体,找出它们的位置。那么传统机器学习的做法是把问题分为两步:发现物体 和 识别物体。首先,我们有几个物体边缘的盒型检测算法,把所有可能的物体都框出来。然后,再使用物体识别算法,例如SVM在识别这些物体中分别是什么。
    但是深度学习不同,给它一张图,它直接给出把对应的物体识别出来,同时还能标明对应物体的名字。这样就可以做到实时的物体识别。

  3. 可理解性:最后一点,也是深度学习一个缺点。其实也说不上是缺点吧,那就是深度学习很多时候我们难以理解。一个深层的神经网络,每一层都代表一个特征,而层数多了,我们也许根本就不知道他们代表的啥特征,我们就没法把训练出来的模型用于对预测任务进行解释。例如,我们用深度学习方法来批改论文,也许我们训练出来的模型对论文评分都十分的准确,但是我们无法理解模型到底是啥规则,这样的话,那些拿了低分的同学找你质问“凭啥我的分这么低啊?!”,你也哑口无言····因为深度学习模型太复杂,内部的规则很难理解。但是机器学习不一样,比如决策树算法,就可以明确地把规则给你列出来,每一个规则,每一个特征,你都可以理解。

深度学习是数学与神经科学的儿子,更贴近探究智能本身,机器学习更贴近统计学本身

参考来源

  1. 知乎,链接:https://www.zhihu.com/question/41268372/answer/499938700
  2. 哔哩哔哩 - 人工智能(8):无监督学习,链接:https://www.bilibili.com/video/BV1nW411178K?from=search&seid=6318581699250098822&spm_id_from=333.337.0.0
  3. 哔哩哔哩 - 什么是强化学习(Reinforcement Learning)?【知多少】,链接:https://www.bilibili.com/video/BV18F411B7sL/?spm_id_from=333.788.recommend_more_video.1
  4. 哔哩哔哩 - 8分钟搞清楚人工智能,机器学习和深度学习的区别-有字幕,链接:https://www.bilibili.com/video/BV1fA411a7X6/?spm_id_from=333.788.recommend_more_video.-1
  5. 哔哩哔哩 - 人工智能、机器学习、神经网络、深度学习原理解读,链接: https://www.bilibili.com/video/BV1zV411U7Me/?spm_id_from=333.788.recommend_more_video.-1
  6. 哔哩哔哩 - 什么是人工智能/机器学习/深度学习/神经网络?,链接:https://www.bilibili.com/video/BV1vJ41147QU/?spm_id_from=333.788.recommend_more_video.-1

你可能感兴趣的:(毕设准备,机器学习,人工智能,深度学习)