李宏毅深度学习笔记-P1机器学习介绍

       好了,今天开始了李宏毅先生机器学习课程的自学,千里之行始于足下,P1介绍篇章是一个介绍性的概括章节,主要讲清楚了这门学科的几个基本问题。

       总结起来这一节主要说了两个问题,when & what,如下图1所示是机器学习发展的大致脉络,就我看来主要有两个时间点,第一个是19世纪80年代,此时AI界开始使用机器学习的方法来实现人工智能的目标(个人理解是放弃了handcrafted的规则推导,使用的是以概率论为基础的机器学习),第二个是2010年左右开始的深入,提出了深度学习的概念,是在基础的机器学习模型/方法上提出了新的模型和方法,用于解决更复杂的场景问题。 

李宏毅深度学习笔记-P1机器学习介绍_第1张图片

图1

       在了解了机器学习学科发展的时间脉络的基础上,接下来介绍的是机器学习是什么的议题。从目的来看,机器学习是让机器拥有人的能力,比如识别图像,识别文字亦或是识别语音,如下图2

李宏毅深度学习笔记-P1机器学习介绍_第2张图片

图2

把这个问题转化一下,其实就是一个映射,无论是从图像到猫的映射,还是文字到语义的映射,其本质就是一个函数,也就是说,人工智能问题的数学模型是求解函数(即使这个函数可能比较复杂),即找到一个正确的函数,能正确的反应输入和输出之间的关系。

       那么如何找到这个函数呢,类比于人的学习方式,机器学习求解的方式分成三个步骤,即找到一个函数集,然后用训练数据来给每一个函数进行打分,然后通过分数来获取最匹配的函数。另一方面,介绍篇也概括整个机器学习包括了哪些内容,分别从场景,任务和方法来进行范围从大到小的归类。

     场景上说,依据对标注训练数据的依赖程度,从大到小分为supervised learing,semi-supervised learning,transfer learning,unsupervised learning,reinforcement learning,另外在有监督学习supervised learning中还有一种structured learning,是用于处理非常规任务时使用,这个在后面会提到,所以场景分类可以理解为根据拥有的数据条件进行的分类。在supervised-learning中,依据任务-或者说解决的问题不同,分为regression,classification,structured learning三类任务,regression的任务目的是依据输入,输出一个数值结果。classfication会比较复杂,分成两种,一种相当于做判断题,根据输入判断YES OR NO,是binary classfication,另一种是相当于做图书归类,将输入归入某一类的结果,是multi-class classification;那么在classfication类型的任务中,如果针对简单的线性问题,我们可以使用 linear model 进行解决,而对于更复杂的问题,我们需要使用非线性的模型,如decision tree,SVM,K-NN或者Deep Learning来解决。structured learning是有别于regression,classification外其他所有类型任务的总称,简单来说就是输出是一个结构化的数据。

       最后一个场景是强化学习(reinforcement learning),这个对于我来说比较特殊,单独来说,它是基于最终的反馈结果,来对前面所有的决策进行调整,最终得到最优函数的学习方式,强化学习场景下也没有标签化的训练数据,我的理解,强化学习非常适合路径规划类型的问题,如游戏角色的行走路线,围棋走法的策略,还有机器人的行走路线,有幸研究过强化学习的课题所以印象会稍微深一点,数学上说强化学习需要一个可收敛的模型,学习的过程就是模型不断收敛的过程,最终获得全局最优解,以上是本章的学习内容啦,谢谢~

你可能感兴趣的:(深度学习,人工智能)