机器学习概述与算法介绍

  1. 机器学习概述
  2. 机器学习基本概念
  3. 机器学习基本流程与工作环节
  4. 机器学习中的评估指标
  5. 机器学习算法一览

机器学习概述


机器学习是什么

人工智能的一个重要学科分支多领域交叉学科。 数据驱动,在数据上通过算法总,结规律模式,应用在新数据上。

机器学习概述与算法介绍_第1张图片
image
机器学习概述与算法介绍_第2张图片
image

机器学习研究的是计算机怎样模拟人类的学习行为,以获取新的知识或技能,并重新组织已有的知识结构使之不断改善自身。 就是计算机从数据中学习出规律和模式,以应用在新数据上做预测的任务

机器学习概述与算法介绍_第3张图片
image

互联网时代

巨大的数据量

超高的数据维度

机器学习概述与算法介绍_第4张图片
image

机器学习几个例子

机器学习概述与算法介绍_第5张图片
image
机器学习概述与算法介绍_第6张图片
image
机器学习概述与算法介绍_第7张图片
image
  • 几乎无处不在
机器学习概述与算法介绍_第8张图片
生物信息学

生物信息学

机器学习概述与算法介绍_第9张图片
智能医疗

智能医疗

机器学习概述与算法介绍_第10张图片
电商推荐

电商推荐

机器学习概述与算法介绍_第11张图片
决策助手(DARPA)

决策助手(DARPA)

机器学习概述与算法介绍_第12张图片
Web搜索

Web搜索

机器学习概述与算法介绍_第13张图片
无人驾驶汽车

无人驾驶汽车

要点总结

  • 机器学习:计算机从数据中学习出规律和模式,以应用在新数据上做 预测的任务。
  • 作为一套数据驱动的方法,在互联网、生物、医疗、金融、能源、交 通等等领域有广泛应用。
机器学习概述与算法介绍_第14张图片
image

机器学习基本概念


不同类型的问题

机器学习概述与算法介绍_第15张图片
不同类型的问题
  1. 聚类

    • 机器学习基础

    • 聚类算法原理及应用

  2. 分类

    • 监督学习算法

    • 分类算法原理及应用

  3. 回归

    • 回归分析与预测

    • 回归算法原理及应用

  4. 强化学习

    • *AlphaGo 背后的算法

    • *深度学习实战项目

分类问题(监督学习):

  • 根据数据样本上抽取出的特征,判定其属于有限个类别中的哪一个
  • 垃圾邮件识别(结果类别:1、垃圾邮件 2、正常邮件)
  • 文本情感褒贬分析(结果类别:1、褒 2、贬)
  • 图像内容识别识别(结果类别:1、喵星人 2、汪星人 3、人类 4、草泥马 5、都不是)
机器学习概述与算法介绍_第16张图片
基本术语与概念

分类问题(监督学习)

回归问题(监督学习):

  • 根据数据样本上抽取出的特征,预测连续值结果
  • 《芳华》票房值
  • 魔都房价具体值
  • 刘德华和吴彦祖的具体颜值得分
机器学习概述与算法介绍_第17张图片
回归问题(监督学习)

聚类问题(无监督学习)

  • 聚类问题(无监督学习):
  • 根据数据样本上抽取出的特征,挖掘数据的关联模式
  • 相似用户挖掘/社区发现
  • 新闻聚类
机器学习概述与算法介绍_第18张图片
聚类问题(无监督学习)

强化问题:

  • 研究如何基于环境而行动,以取得最大化的预期利益
  • 游戏(“吃鸡”)最高得分
  • 机器人完成任务

强化问题

基本术语与概念

  • 无监督学习 (unsupervised learning)
  • 监督学习 (supervised learning)
机器学习概述与算法介绍_第19张图片
基本术语与概念

数据

  • 数据集; 训练, 测试
  • 示例(instance),样例(example)
  • 样本(sample)
  • 属性(attribute),特征(feature);属性值
  • 属性空间,样本空间,输入空间
  • 特征向量(feature vector)
  • 标记空间,输出空间

算法

  • 假设(hypothesis)
  • 真相(ground-truth)
  • 学习器(learner)

模型

  • 分类,回归
  • 二分类,多分类
  • 正类,反类

类别标记

  • 未见样本(unseen instance)
  • 未知“分布”
  • 独立同分布(i.i.d.)
  • 泛化(generalization)

案例 From 周志华《机器学习》

实际应用场景

机器学习概述与算法介绍_第20张图片
实际应用场景

要点总结

  • 机器学习分类

    • 监督学习:特征+标签
      • 分类:离散个结果中做选择
      • 回归:输出连续值结果
    • 无监督学习:特征
      • 聚类:抱团学习
      • 关联规则
    • 强化学习:从环境到行为映射的学习
  • 机器学习概念

    • 样本/示例/样例、特征/属性、训练集、 测试集
  • 机器学习工业应用方向

    • 自然语言处理、计算机视觉、电商推 荐与预估…

AI开发日志 电子书: https://iosdevlog.gitbooks.io/aidevlog

扫码关注

  • 微信公众号:AIDevLog
  • 机器学习概述与算法介绍_第21张图片
    AIDevLog

(未完等续)

你可能感兴趣的:(机器学习概述与算法介绍)