机器学习综述

机器学习

  1. 通过问答这种方式已经无法区分对方是机器还是人类
  2. 利用现有经验E(Experience),不断改善其完成任务T(Task)的性能P(Performance)

Task

监督学习: 常用于对未知事物的预测,主要有分类问题,回归问题
无监督学习: 常有于对事物的特性进行分析,主要有数据降维、聚类问题

分类问题: 对事物类型进行预测,事物类型为离散且有限
回归问题: 预测目标常为连续变量

数据降维: 对事物特性进行压缩和筛选
聚类问题: 依赖数据的相似性,将相似数据分为一簇。不能预先知道簇的数量和含义

Experience

特征: 反映数据内在规律的信息

监督学习: 经验包括特征(特征向量描述的数据样本)、标记/目标(监督学习的分类)
无监督学习:没有标记/目标,无法从事预测任务,适合数据结构分析

训练集:既有特征又有标记/目标的数据集
测试集:为评价学习模型完成任务的质量,需要具备相同特征的数据,并将模型的预测结果同相对应的正确答案对比

训练集与测试集彼此互斥,测试集不能用于模型训练

Performance

用于评价完成任务质量的指标

分类问题: 用预测正确类型的百分百评价(准确性)
回归问题: 使用预测值和实际值之间的偏差大小

思维导图

机器学习综述_第1张图片
机器学习综述.png

你可能感兴趣的:(机器学习综述)