1. Introduction

之所以有这个想法想分享自己所学习的知识,是因为一个很喜欢的导师说过:

检验学习是否真的掌握并应用的方式是分享

所以这是第一篇学习 MachineLearning ( Andrew Ng )尝试的分享篇~


Definition

目前关于机器学期比较公认的两种定义:

Arthur Samuel (1959) : Field of study that give computers the ability to learn without being explicitly programmed.

Arthur Samuel 主要想表达的是机器可以在无设定的条件下自主地学习,像人类对待未知的事物一样进行自主学习。这是一个对机器学习一个相对抽象的概述。

Tom Mitchell (1988) : A computer program is said to learn from experiece E with respect to some task T and some performance measure P, if its performce on T, as measured by P, improves with experience E.

Tom Mitchell 在这边提出了机器学习分别于三个参量E、T、P之间的联系,即机器不断从E活动中获取经验来更好地更有能力地完成任务T,P则是度量机器完成T的优劣情况。这就好比如人通过下 n 盘围棋来提高自己围棋的赢的胜算,P则是度量这个人下围棋的成功率。Tom Mitchell 将机器学习的定义更加细化了分工了,Amdrew Ng教授则诙谐地说这个定义可能是谐音有趣。

classification

机器学习算法主要有两大类:

—— Supervised learning (监督式学习)

         ( the idea is that we're goring to teach the computer how to do something)

—— Unsupervised learning (非监督式学习)

        ( the idea is that we're goirng let it learning by itself )

Others: Reinforcement learning, recommender systems

        

监督式学习主要是机器知道正确答案地学习,即邮件可判断为是垃圾邮件与否,标准答案已有,机机器则在已知答案的数据集中不断学习。

非监督式学习则不知道答案,只给数据集,让机器自主学习给出数据结构或解决公式。

Supervised Learning

Definition: in every example in our data set we are told what is the "correct answer" that we would have quite liked the algorithms have predicted on that examples.

1. Introduction_第1张图片
1-1 (来源Andrew NG)

在多个属性x的影响下,结果有圈有叉,圈与叉即为在不同情况的正确答案,机器便在这些已有的数据集中不断学习,“监督”主要体现在“正确答案”。

regression problem:  predict a continous(连续) valued output.

classification problem : predict a discrete(离散) valued output.

回归问题与分类问题主要区别是结果是连续的还是离散的。

Unsupervised Learning


1. Introduction_第2张图片
1-2 (来源Andrew Ng)

监督与非监督看是1-1 与 1-2 中的结果是否标识为不同的结果。

非监督式学习一般与分类算法一起运用。



好啦,第一次可能自己的理解表达有些生涩,表达得词不达意或者模糊的,后面自己好好加油~


1. Introduction_第3张图片
(来源网络)

你可能感兴趣的:(1. Introduction)