Datawhale 李宏毅机器学习 Task1

目录

一.简单理解机器学习

二.机器学习基本步骤

三.机器学习相关步骤:

1.监督学习

2.半监督学习

3.迁移学习

4.无监督学习

5.监督学习中的结构化学习

6.强化学习

四.学习总结


一.简单理解机器学习

就像是生物本能,比如河狸修水坝一样,流水声刺激河狸->河狸开始修水坝,直到听不见水声。

我们需要赋予机器这种本能,然后通过学习具备能力,对机器而言就是找到一个合适的function。

二.机器学习基本步骤

就像把大象放进冰箱一样明了。

Datawhale 李宏毅机器学习 Task1_第1张图片

三.机器学习相关步骤:

Datawhale 李宏毅机器学习 Task1_第2张图片

1.监督学习

Datawhale 李宏毅机器学习 Task1_第3张图片

Regression(回归):在知乎上找到一个很形象的比喻想象这样一个场景,一堆看似无规律的数据在你的图像上肆无忌惮的乱走,我们要做的是找出其中的规律模型,把他们行走的趋势和轨迹“重新组合起来”。

比如用以前的PM2.5数据去预测明天的PM2.5,用以前收到的邮件去分析新邮件是不是垃圾邮件。

机器学习分为线性模型和非线性模型,非线性模型中最耳熟能详的就是深度学习了,这方面已经有很多应用和相关新闻。

2.半监督学习

Datawhale 李宏毅机器学习 Task1_第4张图片

监督学习的问题是我们需要大量的训练数据训练数据告诉我们要找的function的input和output之间的关系。

如果我们在监督学习下进行学习,我们需要告诉机器function的input和output是什么。这个output往往没有办法用很自然的方式取得,需要人工的力量把它标注出来,这些function的output叫做标签。

那有没有办法减少label需要的量呢?就是半监督学习。

假设你先想让机器鉴别猫狗的不同。你想做一个分类器让它告诉你,图片上是猫还是狗。你有少量的猫和狗的labelled data,但是同时你又有大量的Unlabeled data,但是你没有力气去告诉机器说哪些是猫哪些是狗。在半监督学习的技术中,这些没有label的data,他可能也是对学习有帮助。这个我们之后会讲为什么这些没有label的data对学习会有帮助。

3.迁移学习

Datawhale 李宏毅机器学习 Task1_第5张图片

是另外一个减少data用量的方向。

迁移学习的意思是:假设我们要做猫和狗的分类问题,我们也一样,只有少量的有label的data。但是我们现在有大量的data,这些大量的data中可能有label也可能没有label。但是他跟我们现在要考虑的问题是没有什么特别的关系的,我们要分辨的是猫和狗的不同,但是这边有一大堆其他动物的图片还是动画图片(凉宫春日,御坂美琴)你有这一大堆不相干的图片,它到底可以带来什么帮助。这个就是迁移学习要讲的问题。

4.无监督学习

Datawhale 李宏毅机器学习 Task1_第6张图片

更加进阶的就是无监督学习,我们希望机器可以学到无师自通。

如果在完全没有任何label的情况下,到底机器可以学到什么样的事情。举例来说,如果我们给机器看大量的文章(在去网络上收集站文章很容易,网络上随便爬就可以)让机器看过大量的文章以后,它到底可以学到什么事情。

 它能不能够学会每一个词汇的意思,要让机器学会每一个词汇的意思,你可以想成是我们找一个function,然后你把一个词汇丢进去。比如说你把“apple”丢进这个function里面,机器要输出告诉你说这个词会是什么意思。也许他用一个向量来表示这个词汇的各种不同的特性。但现在讲是无监督学习的问题,你现在只有一大堆的文章,也就是说你只有词汇,你只有function的输入,没有任何的输出。那你到底要怎么解决这个问题。

我们举另外一个无监督学习的例子:假设我们今天带机器去动物园让它看一大堆的动物,它能不能够在看了一大堆动物以后,它就学会自己创造一些动物。那这个都是真实例子。仔细看了大量的动物以后,它就可以自己的画一些狗出来。有眼睛长在身上的狗、还有乳牛狗等等。(有点像ai画图根据用户不同tag组合的自创图像)

这个Task也是一个无监督学习的问题,这个function的输入不知道是什么,可能是某一个code代表要输出图片的特性,输出是一张图片。你给机器看到的只有非常大量的图片,只有function的input,没有output。机器要咋样生成新的图片,这是我们后面要解决的问题。

5.监督学习中的结构化学习

Datawhale 李宏毅机器学习 Task1_第7张图片

在machine要解的任务上我们讲了Regression、classification,还有一类的问题是structured learning

structured learning 中让机器输出的是要有结构性的,举例来说:在语音辨识里面,机器输入是声音讯号,输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的object。或者是说在机器翻译里面你说一句话,你输入中文希望机器翻成英文,它的输出也是有结构性的。或者你今天要做的是人脸辨识,来给机器看张图片,它会知道说最左边是长门,中间是凉宫春日,右边是宝玖瑠。然后机器要把这些东西标出来,这也是一个structure learning问题。

6.强化学习

Datawhale 李宏毅机器学习 Task1_第8张图片

我们若将强化学习和监督学习进行比较时,在监督学习中我们会告诉机器正确答案是什么。若现在我们要用监督学习的方法来训练一个聊天机器人,你的训练方式会是:你就告诉机器,现在使用者说了hello,你就说hi,现在使用者说了byebye ,你就说good bye。所以机器有一个人当他家教在他旁边手把手的教他每件事情,这就是监督学习。

reinforcement learning是什么呢?在reinforcement learning里面,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。若我们现在要用reinforcement learning方法来训练一个聊天机器人的话,他训练的方法会是这样:你就把机器发到线下,让他的和面进来的客人对话,然后想了半天以后呢,最后仍旧勃然大怒把电话挂掉了。那机器就学到一件事情就是刚才做错了。但是他不知道哪边错了,它就要回去自己想道理,是一开始就不应该打招呼吗?还是中间不应该在骂脏话了之类。它不知道,也没有人告诉它哪里做的不好,它要回去反省检讨哪一步做的不好。机器要在reinforcement learning的情况下学习,机器是非常intelligence的。 reinforcement learning也是比较符合我们人类真正的学习的情景,这是你在学校里面的学习老师会告诉你答案,但在真实社会中没人会告诉你正确答案你只知道你做得好还是做得不好,如果机器可以做到reinforcement learning,那确实是比较intelligence。

四.学习总结

大概理解了一些字面意思,还算是有一个不错的开始吧。

参考资料:
​​​​​

李宏毅机器学习

Datawhale 笔记资料

回归分析中的“回归”是什么意思? - 又又里的回答 - 知乎


 

你可能感兴趣的:(Datawhale,李宏毅机器学习,人工智能)