人工智能初识了解

机器学习、人工智能、深度学习之间的关系

  • 机器学习是人工智能的一个实现途径
  • 深度学习是机器学习的一个方法发展而来

机器学习的三要素

  • 数据
  • 算法
  • 计算力

人工智能的起源

图灵测试

图灵测试(The Turing test)由艾伦·麦席森·图灵发明,指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。
进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能。

此时被称为**人类智能**

达特茅斯会议

1956年8月,在美国汉诺斯小镇宁静的达特茅斯学院中,
约翰·麦卡锡(John McCarthy)
马文·闵斯基(Marvin Minsky,人工智能与认知学专家)
克劳德·香农(Claude Shannon,信息论的创始人)
艾伦·纽厄尔(Allen Newell,计算机科学家)
赫伯特·西蒙(Herbert Simon,诺贝尔经济学奖得主)
等科学家正聚在一起,讨论着一个完全不食人间烟火的主题:
用机器来模仿人类学习以及其他方面的智能。
会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字:人工智能。因此,1956年也就成为了人工智能元年。

发展历程

  • 1、起步发展期:1956年—20世纪60年代初
    人工智能概念提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个高潮。

  • 2、反思发展期:20世纪60年代—70年代初
    人工智能发展初期的突破性进展大大提升了人们对人工智能期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标落空使人工智能发展走入低谷。

  • 3、应用发展期:20世纪70年代初—80年代中
    20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。

  • 4、低迷发展期:20世纪80年代中—90年代中
    随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。

  • 5、稳步发展期:20世纪90年代中—2010年
    由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。

  • 6、蓬勃发展期:2011年至今
    随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长新高潮。

人工智能主要分支

  • 计算机视觉(CV):指机器感知环境的能力
    • 物体检测
    • 人脸识别
  • 自然语言处理(NLP)
    • 文本挖掘/分类:
      • 这里的文本主要指文本的分类 , 该技术可用于理解、组织和分类结构化或非分类结构化文本文档。
    • 机器翻译:
      • 是利用机器的力量自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)。
    • 语音识别
      • 是指识别说出的语言 , 并将其转换成对应的文本的技术
  • 机器人
    • 固定机器人
    • 移动机器人

机器学习

什么是机器学习

机器学习是从**数据自动分析获得模型 , 并利用模型**对未知数据进行预测

人工智能初识了解_第1张图片

机器学习怎么工作

人工智能初识了解_第2张图片

  • 获取数据
    • 在数据集中一般:
      • 一行数据我们称为一个样本
      • 一列数据称为一个特征
      • 有些数据有目标值(标签值) , 有些数据没有目标值
    • 数据分割
      • 训练数据:用于训练构建模型 占数据总量的70% ~ 80%
      • 测试数据:在模型检验时使用 , 用于评估模型是否有效 20% ~ 30%
  • 数据基本处理:
    • 去除异常值
    • 处理缺失值
  • 特征工程:
    • 特征工程是使用**专业背景知识和技巧**处理数据 , 使得特征能在机器学习算法上发挥更好的作用的过程
    • 特征提取:
      • 将任意数据转换为可用于机器学习的数字特征
    • 特征预处理:
      • 通过一些转换函数转换成更加适合算法模型的特征数据过程
    • 特征降维:
      • 值在某些限定条件下 , 降低随机变量(特征个数) , 得到一组“不相关”主变量的过程
  • 机器学习(模型训练):
    • 选择合适的算法对模型进行训练
  • 模型评估:
    • 对训练好的模型进行评估
    • 结果达到要求 、 上线服务
    • 没有达到要求 , 重新上面的步骤

机器学习算法分类

  1. 监督学习:

    • 输入的数据是由输入特征值和目标值所组成
    • 函数的输出可以是一个连续的值(称为回归)
    • 或是输出是有限个连续的值(乘坐分类)
  2. 无监督学习:

    • 输入的数据室友输入特征值组成 , 没有目标值
      • 输入数据没有被标记 , 也没有确定的结果。样本数据类别未知
      • 需要根据样本间的相似性对样本集进行类别划分
        人工智能初识了解_第3张图片
  3. 半监督学习

    • 训练集同时包含有标记数据和为标记样本数据
  4. 强化学习:

    • 实质就是make decisions问题 , 即自动进行决策 , 并且可以做连续决策。
      人工智能初识了解_第4张图片

独立同分布:

人工智能初识了解_第5张图片
人工智能初识了解_第6张图片

模型评估

按照数据集的目标值不同 , 可以把模型分为分类模型评估和回归模型评估

  • 分类模型评估

    • 准确率:预测正确的数占样本总数的比例
    • 其他评价指标:精确率、召回率、F1-score、AUC指标等
  • 回归模型评估

  • 均方根误差

    • RMSE是一个衡量回归模型误差率的常用公式。不过,他技能比较无误差是相同单位的模型
    • 其他评价指标:相对平方误差、平均绝对误差、相对绝对误差
  • 拟合

    • 过拟合:
      • 所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在测试数据集中表现不佳。
    • 欠拟合:
      • 模型学习的太过粗糙,连训练集中的样本数据特征关系都没有学出来

azure机器学习模型搭建实验

https://studio.azureml.net/

深度学习

你可能感兴趣的:(其他)