如何阅读机器学习相关文献

阅读多少文献,才算是在某个领域有了一定的理解

阅读5~20篇文献,可能能做项目,但达不到研究的程度;当阅读到50~100篇文献时,才算是在某个领域有了较为深入的理解

阅读文献的方法

  1. 首先,列出阅读的论文清单,先把每篇读个大概,然后去掉不好的文献;精读好的文献,甚至可以从好文献的引文中找补充阅读,来完善自己的认识
  2. 怎么读一篇文献:
  • 错误:from the first word to last word,从头到尾
  • 正确步骤:

(1)先读title、abstract、figure(例如关键的神经网络架构图)
(2)再读介绍、结论、数字(这些都是作者非常小心的总结的);可以跳过相关工作(尽管可能有用,但是如果不熟悉文献很难看懂)
(3)跳过数学部分,读完再回来理解;跳过没有意义的部分,精读创新的部分(伟大的研究意味着在边界上发现事物):例如LeNet-5的论文有一半是关于其他部分的,这些可以不读
(4)如果论文真的困难,需要我们追查所有的相关资料,并学习很多其他的东西

  • 看完论文后考虑三个问题:

(1)作者想要完成什么?
(2)完成的关键要素是什么?
(3)我可以用到文献中的什么?

面对迅速发展的机器学习,where do you go?

  • 利用各种各样的学习途径

(1)博客、twitter(Kian、Andrew Y Ng以及他们关注的人)、ML subreddit
(2)一些顶尖的机器学习大会:NIPS、ICML、ICLR
(3)与朋友建立社区或者学习小组
(4)arxiv sanity

  • 从两方面深入提升机器学习水平:

(1)文献的math部分。通读math部分,详细记录、推导;然后尝试从头重新推导数学流程。这样有助于理解算法
(2)代码。下载并运行开源原码,从头实现,表明已经真正理解

机器学习生涯的长期规划:工作、深造或者教授
  • 如何获得职位:成为T型人才,了解的领域广泛(ML、DL、PGM、NLP、CV、AI),但是某一个领域深入研究。可以通过开源创作、实习、项目、实验室,来深入研究
  • 几种糟糕的生涯规划

(1)死学习,GPA高,不会实践
(2)作为新生,基础知识没学,领域了解的不广泛,就深入某个领域。这样效率太低
(3)这个领域一个小项目,那个领域一个小项目,只有数量,但不深入

你可能感兴趣的:(机器学习)