机器学习入门笔记- 李宏毅-L1L2

本能学习的局限

机器同样可以采用提前设定的方式进行情况处理,类似于AIMA书中所说的提供一个状态-行动映射表,从而处理一些情况,但是其存在一些缺陷:
1. 无法处理所有的情况,无法处理特殊情况;
2. 无法超越创造者;
3. 需要很大量的人力成本,无法适用于小型企业和小型应用。

如下的漫画说明了部分AI的困境,存在大量的人工处理方法,难以实现自适应的情况。

机器学习入门笔记- 李宏毅-L1L2_第1张图片

实际机器学习

而实际情况中,机器学习需要处理的问题是通过编程的方式,让机器通过规则学习如何处理相关的未知的情况,即通过给定方法,从给定的数据中能够实现一些函数,运用这些函数达到实际的学习效果。例如,通过给定语音和对应的文字,实现函数,能够利用该函数去实现未知的语音辨识能力,如下图所示。

机器学习入门笔记- 李宏毅-L1L2_第2张图片

通用的一个机器学习框架包括以下部分,一个较为核心的问题是 机器学习对于未知问题的有效性,即机器学习是否能够通过学习得到对于未知数据的正确处理能力。
1. 模型,实际上对应的是一系列的函数,其中函数集合存在变量差异;
2. 训练集合,用于判断模型的优劣,指导模型参数的选择,因此训练过程存在大量的优化方法和对应的算法,以及需要定义合适的损失函数;
3. 运用优化方法,得到函数集合中最优的函数,将其用于机器学习的判断阶段;
4. 利用步骤3得到的函数,将其应用于后续数据,得到正确的结果。

但是显然上述的过程只是一个简要的介绍,其中各个部分都需要进行研究和学习,才能确保机器学习的有效性。

机器学习入门笔记- 李宏毅-L1L2_第3张图片

机器学习概览

机器学习的learning map如下图所示:
1. Regression,回归,输出量为标量,典型问题为PM2.5的预测,输入为时间序列的PM2.5值;
2. Classification,分类,包括二分类和多分类问题,二分类问题典型例子为垃圾邮件过滤,输入为不同邮件文本对应是否为垃圾邮件;多分类问题典型例子为针对文本内容的分类。分类的模型包括了线性模型和非线性模型,特别的深度学习属于非线性分类问题,能够处理图片识别、棋类博弈等问题。
上述需要大量的训练数据,输出需要人力进行标注,称为label
3. semi-supervised,通过无标签的数据辅助学习过程;
4. transfer learning, 给出的数据不相关
5. unsupervised learning,无监督学习
6. structured learning,输出为具有特定的结构,例如翻译过程中输出为符合特定语法结构的语句,例如GAN
7. reinforcement learning,强化学习,learning from critics。



可参考资料和网址

  1. 学习笔记
  2. 课程列表
  3. 视频内容
  4. 课程主页

你可能感兴趣的:(机器学习,机器学习)