机器学习笔记

一、机器学习的定义

ARTHUR SAMUEL对机器学习的定义:

机器学习是这样的领域,它赋予计算机学习的能力,不是通过显著式编程获得的。
非显著式编程:让计算机自己总结的规律的编程方法(我们规定了行为和收益函数后,让计算机自己去找最大化收益函数的行为)。

机器学习的定义:

一个计算机程序被称为可以学习,是指它能够针对某个任务T和某个性能指标P,从经验E中学习。这种学习的特点是,它在T上的被P所衡量的性能,会随着经验E的增加而提高。

机器人冲咖啡的例子:
任务T: 设计程序让机器人冲咖啡
经验E:机器人多次尝试的行为和这些行为产生的结果 (数据集)
性能测度P:在规定时间内成功冲好咖啡的次数

二、机器学习的分类

按照任务是否和环境交互获得经验,将机器学习分为监督学习强化学习

监督学习根据数据标签存在与否的分类

(1)传统的监督学习(Traditional Supervised Learning); 每一个训练数据都有对应的标签

  • 支持向量机(SUPPORT VECTOR MACHINE )
  • 人工神经网络(NEURAL NETWORKS)
  • 深度神经网络 (Deep Neural Networks )

(2)非监督学习(Unsupervised Learning) ; 所有训练数据都没有对应的标签
需要假设:
同一类的训练数据在空间中距离更近,
样本的空间信息,
设计算法将它们聚集为两类

  • 聚类(Clustering)
  • EM算法(Expectation-Maximization algorithm)
  • 主成分分析(Principle Component Analysis )

(3)半监督学习( Semi-supervised Learning); 训练数据中一部分有标签部分没有标签
少量的标注数据+大量未标注数据=更好的机器学习算法

另一种分类方法是基于标签的固有属性

  • 分类:标签是离散的值 ,类别标签
    经常用于:
    – ⚫ 垃圾邮件过滤
    – ⚫ 语言检测
    – ⚫ 相似文本搜索
    – ⚫ 情感分析
    – ⚫ 图像识别
    – ⚫ 欺诈检测
    常见算法:
    – ⚫ 朴素贝叶斯、决策树、逻辑回归、K近邻、支撑向量机
  • 回归:标签是连续的值 ,通常用于预测
    经常用于:
    – ⚫ 股票价格预测
    – ⚫ 医学诊断
    – ⚫ 需求和销量分析
    – ⚫ 任何数字时间相關
    常见算法:
    – ⚫ 线性回归、多项式回归

强化学习 研究智能体如何基于环境而做出行动反应,已取得最大化的积累奖励:

经常用于:
– ⚫ 自动驾驶
– ⚫ 机器人
– ⚫ 游戏
– ⚫ 企业资源管理
常见算法:
– ⚫ Q-Learning,SARSA,DQN,A3C,遗传算法

三、机器学习算法的过程

首先特征提取、特征选择 —> 不同的算法会对特征空间做不同的划分 —> 获得不同的结果

  • 研究不同场景下应该采取哪种算法
  • 研究新的机器学习算法以便适应新的场景

注:机器学习的重点,在已经提取好特征的前提下,如何构造算法获得更好的性能

机器学习笔记_第1张图片

四、没有免费午餐定理

任何一个预测函数,如果在一些训练样本上表现好,那么必然在另一些训练样本上表现不好,如果不对数据在特征空间的先验分
布有一定假设,那么表现好与表现不好的情况一样多。
如果不对特征空间的先验分布有假设,则所有算法的表现都一样

机器学习的本质:有限的已知数据,复杂的高维特征空间中,预测未知的样本的属性和类别

你可能感兴趣的:(机器学习,人工智能,算法)