李宏毅《机器学习》Introduction

李宏毅《机器学习》Introduction_第1张图片

A. AI/机器学习/深度学习

AI是目的,机器学习是手段,深度学习是机器学习其中一种方法

B.机器学习是什么?

李宏毅《机器学习》Introduction_第2张图片

李宏毅《机器学习》Introduction_第3张图片

C.Learning path

 李宏毅《机器学习》Introduction_第4张图片

 C1 监督学习:

INPUT :大量资料

OUTPUT: 人工标注 (label)

C11任务:

回归/分类/结构化学习

分类:下围棋,可以看作十九乘十九个类别的分类问题

结构化学习:OUTPUT:结构性的对象(比如句子/分辨图片的结构)

C12 模型:

线性模型/非线性模型

非线性:SVM / deep learning/ decision tree/...

C2 半监督学习

OUTPUT 既有labelled 又有 unlabeled (对学习也可能有用)

C3 迁移学习

OUTPUT 既有labelled 又有 unlabeled 以及其他不相干资料 (对学习也可能有用)

C4 无监督学习

INPUT :大量资料

OUTPUT: 无

C5 强化学习

VS监督学习(训练过程中):INPUT,  OUTPUT:正确答案

强化学习(训练过程中):INPUT,OUTPUT:分数(做的好/不好)

若我们用Alpha Go当做例子时,supervised learning就是告诉机器:看到这个盘式你就下“5-5”,看到这个盘式你就下“3-3”

reinforcement learning的意思是:机器跟对手互下,机器会不断的下棋,最后赢了,机器就会知道下的不错,但是究竟是哪里可以使它赢,它其实是不知道的。我们知道Alpha Go其实是用监督学习加上reinforcement learning去学习的。先用棋谱做监督学习,然后在做reinforcement learning,但是reinforcement learning需要一个对手,如果使用人当对手就会很让费时间,所以机器的对手是另外一个机器。

图片,资料来自李宏毅《机器学习》

你可能感兴趣的:(机器学习,人工智能)