五件套
获取,这里就不提供下载链接啦。
第一章PPT的导学与资源推荐部分尤其精彩,但不少博客文章对第一部分的非算法/代码的内容进行了删除,这对于新手而言,就不太友好。
机器学习算法是一类从数据
中自动分析获得规律,并利用规律
对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。
由该段可以看到,数据和规律是我们要接触的重点内容,不过由于现阶段,大多数研究人员关注的是规律(也可以延伸而称之为算法、模型),少部分人在进行数据收集(也就是创建数据集),但从人工智能的整个发展历程来看,好的数据,会带来革命性的促进作用,例如计算机视觉(CV)领域,就因为大名鼎鼎的Imagenet,而突飞猛进,足够多、足够好的数据,才能让我们对规律
产生无限的想象空间。
图1 Imagenet(14,197,122 images, 21841 synsets indexed )
另一方面,在NLP的对话系统领域,至今没有令人耳目一新的突破,很重要的一个原因就是,数据集不够大、不够丰富、质量不够好。
因此,不管是数据
还是规律
,作为研究人员,都不应该忽视,另外,在研究过程中,也不能盲目相信已有数据集,要多研究思考给定的数据集的特征与缺陷,之后才是考虑规律
,否则,生硬套模型,难以真正获得稳定且优质的结果。
斯坦福机器学习:
http://v.163.com/special/opencourse/machinelearning.html
CMU 机器学习课程:
http://www.cs.cmu.edu/~epxing/Class/10715/
http://www.cs.cmu.edu/~epxing/Class/10708/
http://www.cs.cmu.edu/~epxing/Class/10701
https://sites.google.com/site/10601a14spring/syllabus
相关学术文章下载资源:
COLT和ICML(每年度的官网): http://www.cs.mcgill.ca/~colt2009/proceedings.html
CV:http://www.cvpapers.com/index.html
NIPS: http://books.nips.cc/
JMLR(期刊): http://jmlr.csail.mit.edu/papers/
个人认为,对于普通本科学生而言,可以适当关注推荐的课程,不必花过多时间关注推荐的学术文章,而研究生则可以密切关注推荐的几个学术文章下载网站!
机器学习有下面几种定义:
从上面的三种定义中,我们都可以看到,机器学习的定义离不开“经验
“二字,因此,贯穿机器学习的整个研究过程,我们的算法都不是凭空出现的,它必须是设法找到某种经验,为我们所用!
从这个方面来看,我们读万卷书行万里路,对自身来说,也是一种”机器学习”。
对历史的研究,总是有意思并且能促进我们去思考的,我建议大家阅读这篇博客文章《机器学习的发展历程》以及《机器学习发展历史回顾》。
而课件中提及的新的方向:
而课件提及的国内外的研究者M. I. Jordan、Andrew Ng、Tommi Jaakkola、David Blei、Eric Xing、D.Koller
2001年IJCAI计算机与思维奖:TerryWinograd、David Marr、Tom Mitchell、RodneyBrooks等人之后的第18位获奖者
Peter L. Bartlett、J. D. Lafferty
国内:李航,周志华, 杨强,王晓刚,唐晓鸥,唐杰,刘铁岩,何晓飞,朱筠,吴军,张栋,戴文渊,余凯,邓力,孙健
则可以找到他们的google学术主页,最好关注一波,或者收藏他们的主页,这无疑有利于自己关注大牛的最新研究成果!
机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。
研究方法差异
维度差异
Reinforcement learning:强化学习——强化学习最早可以追溯到巴甫洛夫的条件反射实验,它从动物行为研究和优化控制两个领域独立发展。让计算机实现从一开始完全随机的进行操作,通过不断地尝试,从错误中学习,最后找到规律,学会了达到目的的方法。这就是一个完整的强化学习过程。让计算机在不断的尝试中更新自己的行为,从而一步步学习如何操自己的行为得到高分。它主要包含四个元素,Agent、环境状态、行动、奖励,强化学习的目标就是获得最多的累计奖励。
第一章内容还没有结束,但考虑到大家的阅读时间,在这里将第一章拆分为两部分。
[1] https://github.com/wzyonggege/statistical-learning-method
[2] https://github.com/WenDesi/lihang_book_algorithm
[3] https://blog.csdn.net/tudaodiaozhale
[4] 李航. 统计学习方法第二版[M]. 北京: 清华大学出版社, 2019.
[5] https://github.com/fengdu78/lihang-code
【作者简介】陈艺荣,男,目前在华南理工大学电子与信息学院广东省人体数据科学工程技术研究中心攻读博士,担任IEEE Access、IEEE Photonics Journal的审稿人。两次获得美国大学生数学建模竞赛(MCM)一等奖,获得2017年全国大学生数学建模竞赛(广东赛区)一等奖、2018年广东省大学生电子设计竞赛一等奖等科技竞赛奖项,主持一项2017-2019年国家级大学生创新训练项目获得优秀结题,参与两项广东大学生科技创新培育专项资金、一项2018-2019年国家级大学生创新训练项目获得良好结题,发表SCI论文4篇,授权实用新型专利8项,受理发明专利13项。
我的主页
我的Github
我的CSDN博客
我的Linkedin