机器学习入门

废话多多的导语

跟着社会的主流,开始踩机器学习这些坑了,毕竟内心还是非常认可这类相关技术的社会价值。本人研二做通信优化的,目前跟机器学习不沾边,其实说沾边也不为过,毕竟两者数学层面的储备都差不多,而且某种程度上二者都是在找optimal solution。 那问题来了,该如何入门呢~~

翻了很多推荐的贴,有推荐书籍,有推荐吴恩达老师(Andrew Ng)的视频,有推荐李宏毅老师的视频,有推荐莫烦。条条大路通坑底,问题是如何找到适合自己的入坑法,才能沿着最大梯度下降。深知自己此刻有些耐不住性子,书籍就只起到查阅功能,不能是主力。我是喜欢从视频入手的人,觉得这是最快的入手模式,推荐的几个老师我都简单的看了一两个视频,然后坚定不移的选了李宏毅老师。吴恩达老师讲的很详细,然鹅我喜欢李宏毅老师的风格。就像考研那时候在李永乐和张宇之间我选择了张宇欧巴一样。莫烦的我觉得讲得有些过于粗糙,不太适合我这种知识积累一般的人~~当然,选择老师或者选择入坑方法因人而异,最主要还是坚持啦~

决定每学习一小段时间,同时记录跟踪分享,是为了监督自己,也是希望对想入坑的同学能有一点点点点点点帮助。李宏毅老师视频链接:https://www.bilibili.com/video/av10590361/?p=1

机器学习导图

下面的图高度总结了机器学习场景、任务和方法分类。
机器学习入门_第1张图片
根据这张图我整理了另外一张简单版的思维导图(后续可能还会调整)。
机器学习入门_第2张图片

监督学习

监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。
简单的理解就是,训练集的输入和对应的输出是已知的,也就是训练集的输出的是带有标签的。把这些已知的输入和输出对作为训练数据,监督式学习建立一个学习过程,将预测结果与“训练数据”的实际输出进行比较,不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。然后呢,输入未参与训练的测试集,训练所得模型可以输出结果。

  • Regression:The output of the target function ? is “scalar”. 举个简单的栗子:通过输入过去几天(包括今天)每天早上的PM2.5, 来预测明天早上的PM2.5.
    机器学习入门_第3张图片
  • Classification:包括了Binary Classification和Multi-class Classification。
    Binary Classification就是告诉你输出是yes还是no,再举个栗子,每封邮件对应一个输出,不是垃圾邮件就对应no,是垃圾邮件就对应yes。通过不断不断不断的训练,得到一个function。这时候,你把刚收到的邮件作为function的输入,它就会告诉你这份邮件是不是垃圾邮件(要么yes要么no)。
    而Multi-class Classification就是告诉你输出是人是鬼是妖是魔(反正不是yes or no的问题啦)。举个栗子,给猫的图片贴个标签,this is a cat!给狗狗图片贴个标签告诉这是只狗狗,给猴子帖子贴个标签这是monkey等等然后作为训练集,通过一个CNN训练,这时候把我家大傻(我家英短叫大傻)的图片扔进去,这个网络就会告诉你,这是一只猫!!
    机器学习入门_第4张图片

无监督学习

现实生活中常常会有这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。很自然地,我们希望计算机能代我们完成这些工作,或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。
也就是说训练集中的不是输入输出对,只有输入。比如给一堆猫猫狗狗的照片,然而并不告诉你这是啥(简直耍流氓啊)。
机器学习入门_第5张图片

半监督学习

半监督学习(Semi-Supervised Learning,SSL)是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构以便合理的组织数据来进行预测。

举个栗子,训练集有些是有标签,有些没有,通过训练后,它会知道有这样结构的是猫猫,有那样结构的是狗狗。把我家大傻作为测试集输入,就能得出这是一只傻猫。
机器学习入门_第6张图片

增强学习

增强学习是指从动物学习、随机逼近和优化控制等理论发展而来,是一种无导师在线学习技术,从环境状态到动作映射学习,使得Agent根据最大奖励值采取最优的策略;Agent感知环境中的状态信息,搜索策略(哪种策略可以产生最有效的学习)选择最优的动作,从而引起状态的改变并得到一个延迟回报值,更新评估函数,完成一次学习过程后,进入下一轮的学习训练,重复循环迭代,直到满足整个学习的条件,终止学习。
举个栗子,把大傻放在一个陌生的地方,目的是找到家门口,在每次试验中,如果找到了家门口就会给它奖励(营养膏),找不到就惩罚(不给吃饭)。当他试验完所有路径之后,再把大傻放在这片陌生地方的任何点,它能找到通往出口最正确的道路。
机器学习入门_第7张图片
可见啊,在Reinforcement中,critics是很关键的。

迁移学习

迁移学习(Transfer learning) 顾名思义就是就是把已学训练好的模型参数迁移到新的模型来帮助新模型训练。考虑到大部分数据或任务是存在相关性的,所以通过迁移学习我们可以将已经学到的模型参数(也可理解为模型学到的知识)通过某种方式来分享给新模型从而加快并优化模型的学习效率不用像大多数网络那样从零学习(starting from scratch,tabula rasa)。也就是我们常说的“举一反三”、“触类旁通”。

巴拉巴拉了一堆,这些都是最最基础的概念了。后续学习中可能会不断修正和完善自己的理解。我要退居二线开始搞我实验室的科研了~~

你可能感兴趣的:(机器学习,监督学习,半监督学习,无监督学习,增强学习,机器学习)