【机器学习系列】浙大机器学习课程-第一章概述

文章目录

  • 机器学习的定义
  • 监督学习
  • 机器学习入门

机器学习的定义

机器学习是一种非显著式编程。显著式编程是程序固定了程序的输入输出,但是非显著式编程可以让机器进行不断学习。以机器人路径规划为例,机器人根据经验E来提升性能指标P的过程。

在人脸识别任务中,经验E往往指训练样本以及对应标签的集合。这些输入的数据都是人为手动添加标签,被称为监督学习。在自动驾驶任务中,经验E往往需要计算机和环境互动获得,计算机产生行为,算法定义收益函数,通过改变行为模式来最大化收益函数。这种往往被称为强化学习。

监督学习

  1. 传统的监督学习(所有的训练数据都有对应的标签)
    –支持向量机
    –人工神经网络
    –深度神经网络

  2. 非监督学习(所有的训练数据都没有对应的标签)
    聚类
    EM算法
    主成分分析算法

  3. 半监督学习(少量标记数据和大量未标记数据)

机器学习入门

机器学习的第一步:不是下载大量的数据+套用一个模型!重点在于分析原始数据,对数据有感性的认知!!!
针对不同媒质不同任务,提取特征的方式千变万化。

第一步:特征提取
【机器学习系列】浙大机器学习课程-第一章概述_第1张图片
因此,选择“面积”和“周长”作为选择的特征。

第二步:采用支持向量机划分不同标签的数据

【机器学习系列】浙大机器学习课程-第一章概述_第2张图片

不同的机器学习算法会对特征特征空间做不同的划分,可以获得不同的分类曲线。

在设计机器学习算法的时候有一个假设:在特征空间上距离接近的样本,属于同一个类别的概率会更高。

没有免费的午餐定理:没有普遍而放之四海而皆准的算法。

你可能感兴趣的:(机器学习系列,机器学习,人工智能,算法)