Stanford University《Machine Learning》学习笔记(1)- 什么是机器学习

机器学习是什么?

本次课程视频链接:https://pan.baidu.com/s/16BaT3zV8l0DeF4W0JhBYjQ
提取码:yxqc

实际上,即使是在机器学习的专业人士中,也不存在一个被广泛认可的定义来准确定义机器学习是什么或不是什么,现在我将告诉你一些人们尝试定义的示例。

第一个机器学习的定义来自于Arthur Samuel。他定义机器学习为,在进行特定编程的情况下,给予计算机学习能力的领域。Samuel 的定义可以回溯到50 年代,他编写了一个西洋棋程序。这程序神奇之处在于,编程者自己并不是个下棋高手。但因为他太菜了,于是就通过编程,让西洋棋程序自己跟自己下了上万盘棋。通过观察哪种布局(棋盘位置)会赢,哪种布局会输,久而久之,这西洋棋程序明白了什么是好的布局,什么样是坏的布局。然后就牛逼大发了,程序通过学习后,玩西洋棋的水平超过了Samuel。这绝对是令人注目的成果。尽管编写者自己是个菜鸟,但因为计算机有着足够的耐心,去下上万盘的棋,没有人有这耐心去下这么多盘棋。通过这些练习,计算机获得无比丰富的经验,于是渐渐成为了比Samuel 更厉害的西洋棋手。上述是个有点不正式的定义,也比较古老。

另一个年代近一点的定义,由Tom Mitchell 提出,来自卡内基梅隆大学,Tom 定义的机器学习是,一个好的学习问题定义如下,他说,一个程序被认为能从经验E中学习,解决任务T,达到性能度量值 P ,当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。我认为经验 E 就是程序上万次的自我练习的经验,而任务 T 就是下棋。性能度量值 P 呢,就是它在与一些新的对手比赛时,赢得比赛的概率。

我们假设您的电子邮件程序会观察收到的邮件是否被您标记为垃圾邮件。在这种 Email 客户端中,你点击“垃圾邮件” 按钮,报告某些Email 为垃圾邮件,不会影响别的邮件。基于被标记为垃圾的邮件,您的电子邮件程序能更好地学习如何过滤垃圾邮件。请问,在这个设定中,任务T 是什么?

任务T是分类邮件是否为垃圾邮件;性能度量值P是垃圾邮件分类的正确率;经验E是学习邮件的标记特点和习惯。

感谢中国海洋大学2014级博士-黄广海分享的课程视频,希望对大家有所帮助。

你可能感兴趣的:(Stanford University《Machine Learning》学习笔记(1)- 什么是机器学习)