机器学习引言
人工智能(Artificial Intelligence) 是机器学习方法(Machine Learning) 追求实现的目标。
-
河狸造堤坝是生物的本能,机器学习的天赋则来自hand-crafted rules。
-
hand-crafted rules 的缺点在于它考虑不到存在情况的所有可能性,也永远无法超越人类,同时又需要耗费大量的人力。
-
未来机器学习方法或许不需要过多人力,而只需使用大量数据。
机器学习也可被视作从数据(data)中寻找函数(function)。
-
应用举例: (语音识别) Speech recognition /(图像识别) Imagine recognition /(对话系统) Dialogue system/ (游戏/围棋) Playing Go
-
一个简单的Framework 即从已有的 a set of function (model) 和 training data中来判断函数的好坏goodness of function,再在所有的function(model)中挑选出一个最好的function。
图片(from李宏毅老师的课程中的slides):机器学习的三个步骤
机器学习概览(Learning Map)
Task:
Regression
-
预测问题 输出是一个"scalar"
Classification
-
Binary classification (Yes or No)
-
Multi-class classification (多分类)
Structured Learning
-
让机器输出的是要有结构性(例如:输出句子)
Methods:
Linear model
-
统计的知识
Non-linear model
-
Deep Learning
-
SVM, Decision tree, K-NN
Scenario:
监督学习(Supervised Learning)
-
Training data (Input/output pair of target function/function output= label )
半监督学习(Semi-supervised Learning)
-
Unlabelled data 也帮助机器学习
迁移学习(Transfer Learning)
-
有一些不相关的数据 (Data not related to the task considered 标记与否都可以)
无监督学习(Unsupervised Learning)
-
无label 可以生成新的
强化学习(Reinforcement Learning)
-
无正确答案,只知道做得好或者不好,机器需要自己去反思哪里出现了问题
机器学习的场景取决于data无法自己决定,无论怎样的场景都是解决regression/classification/structured learning 三类task,在不同场景下解决不同问题使用的方法至关重要。
宝可梦训练师 类似于 人工智能训练师
人工智能训练师的工作就在于为机器挑选合适的model 和loss function,不同的模型和损失函数解决不同的问题。 在深度学习中的最优化需要有经验的训练师来处理。