机器学习论文怎么读?大神给你三步妙招

读论文绝对是个技术活,无论是机器学习,还是密码学分布式共识算法,或者神经网络什么的,要想真正对计算机学科的某个领域有专业的理解,你必须紧跟这个方面最新研究。对相关专业有专业严谨的评估,是我们必备的能力。

只要有耐心并多加练习,以及很多很多的咖啡,你一定可以掌握高效读论文的方法。

我每周通常会每周读10-12篇研究论文,以紧跟计算机领域的潮流。随着时间推移,读论文的能力也越来越好。

找机器学习论文时最爱的资源是Reddit,在他的机器学习板块,每天都有好多人发表很有趣的论文,还有很酷的周报,显示你这周读了哪些论文,哪些最让你感兴趣。另外还有个很棒的网站arxiv-sanity.com,由大佬Andrei Karpathy开发,它会帮你寻找aRxiv上你最感兴趣的或者最热的论文,此外,谷歌和DeepMind也会在各自的网站上发表研究成果,并且在《nature》这样的期刊上也很容易找到顶级的论文。

那么,应该如何阅读论文?

最好带着目的去读,比如学习更好的激活函数,或者能帮我使用注意机制的概率模型等等。等明确目标后,就很容易确定读论文的策略,使我们直奔目标。只是从数学上看懂机器学习论文并不是我们的理想目标,能让自己有耐心有动力读下去更为重要。

下面是我读论文的三步矫正法

  • 第一步:仅浏览论文,理解论文大意。

首先看论文标题,要是觉得有意思,好了,可以开始了。然后看摘要,摘要是论文中研究工作的简短和独立的总结,可以用他作为文章的综述。然后仔细阅读段落和小节的题目而不管剩下的部分,主要是忽略数学部分。然后读末尾的总结,可能会扫一眼引用的论文,看看有没有已经看过的。在第一步,我会假设数学部分是正确的,这步的主要目的是弄懂作者的目的,论文的主要贡献、论文想解决什么问题以及我是否真的感兴趣。

在完成这一步后,我会回头看看别人怎么评价论文,把我的初步想法和大家对比一下。

这一步的主要目的就是确保论文是我想看且需要的,人生苦短嘛,毕竟还有好多东西要看。

  • 第二步:重新阅读

更严谨的读论文,并做笔记。我会读全部的内容,并尽力高度理解数学部分,并尽力评估实验结果,是否重复?结果有明显的证据支撑吗?然后去GitHub上找找是否有已实现的相关代码,自己读一遍然后运行一遍,复现结果。通常代码中的注释会帮助我理解,此外我还会搜寻其他有助于我理解代码的东西,比如文章、总结、教程等。通常一篇很火的论文会有很多人分享对他的见解。

  • 第三步:关注数学细节

拿出笔来自己解析论文里的公式,同时也会借助百度帮我理解公式。并用论文给出的参数尽可能的复现代码。

 

 

你可能感兴趣的:(人工智能,论文,人工智能,论文)