科研入门 - 如何通过论文学习并评价研究问题的价值

如何通过论文学习并评价研究问题的价值

  个人是从事深度学习NLP方向研究的一名新研究生,同时侧重于推荐系统研究,主要原因是因为实验室导师就是这个方向,于是就跟着导师学习了。有的人问我这么选择方向是不是有些草率,其实我倒觉得跟导师统一方向是很重要地,如果自己在一个导师也不太明白的方向展开工作事实上是很吃力的,一方面你的提出的idea无法验证价值,这就意味着可能你花了很久很兴奋的去研究一个点最终发现其实是个BD,但时间成本确已经浪费了;另一方面,老师如果在这个领域已经有成果了或者很了解了,那么交流会很顺畅,或许一开始可能会被训斥,但是等到入门就会发现,导师对这个方向的经验会慢慢影响到你,然后你也就有了自己的方向了,这会比自己摸索入门快得多。

  随着期末考试的结束,个人的研究生第一学期也已经基本结束,目前科研进展缓慢,但在导师的帮助下算是勉强入门,在此跟大家分享一下自己一学期看paper以及找方向的心得和体会,其中有一部分是当时听一位清华大学老师讲座记在书上的,觉得很有帮助也拿来分享给各位,希望各位沿途顺利,少走弯路。

  首先跟刚入门的同学分享一下看论文的心得,然后再谈谈如何评价研究问题的价值和标准。

一、如何科学的“看”论文

  其实,一开始做科研都容易陷入一个误区,那就是逮到一篇论文就开始没头没脑的精读,很多时候这篇论文可能价值不是很充分,之前看清华的教授说,大部分论文其实没必要完全读透,只需要大体理解方法和思路就可以甚至只是阅读一下标题就可以。他给出了这样一个界定:论文由粗到精,80%的论文只看title(泛读),14%看title和abstract就可以,偶尔可以读一下introduction或者去了解一下数据集(粗读),而剩下的6%,前5%看论文的摘要及正文(精读),而剩下的1%才需要你不仅通读全文,而且要搞懂所有的模型细节和代码实现(完全精读+代码复现)。

  也就是说其实,方向明确的情况下去,进行泛读很大概率下就停留在标题和摘要的阶段,我尝试过即便只去了解abstract,经常读了好几个小时,也就把了了几篇paper大概搞清楚了,这是不值得的,也就是说,如果是为了发现一个好的方向或是点子的话,泛读就可以了。需要尽量减少粗读的比例来节约时间。

  因为一旦我们决定了要去针对那个方向展开精读的时候,我们要花大量的时间去搞明白作者在正文中的措辞,有的时候英文文献的直接翻译会带来极大的歧义,所以建议大家,如果决定精读,不要使用翻译,或者至少不要单纯使用翻译版本理解,一定要学习直接读英文原文。这一点我的导师曾经批评过我,我一度沉迷知云文献翻译不能自拔,还认为自己找到了宝,结果后来才知道,有朝一日自己需要撰写文章的时候,里安常用词和关键词都不认得,都得先翻译才知道原来这就是自己平日里翻来覆去讨论的那几个点。很多时候模型的细节需要反复阅读才能参透一二,并且搞清楚模型的逻辑结构后,再去实现和看别人的代码又是另外一回事了。很少有作者会很好心得提供完全开源的代码给你,即便有也不会给你加很详细的注释。一方面,可能在试验设计参数设计上最优结果可能存在争议,另一方面,模型实现已是不易,为了争分夺秒的公布成果,争取早日见刊,谁会闲着没事去加注释呢。这就意味着我们需要很多时间去研究模型和代码。

  这时候的研究不是孤立的,毕竟我们要提出自己的改进,才能创造自己的方向,所以可以尝试多找几篇相似可借鉴的文章进行阅读。此时阅读的深度就自己把握了,如果你希望提供一个idea来解决目前的瓶颈,那么粗读,或者精读就可以。而假如你是为了解决代码的提升问题,那可能就也需要进行复现,或者至少要复现出对应的模块儿。

  以上是我的一家之言,好像说的有点儿多……回到主题,清华的教授说,科研本质上也讲究二八原则,所以构建知识体系,加深理解才是我们读论文过程中的收获,同时伴随的要独立思考,有保持比较好的思维开放性。找到自己的方向就不太难。

二、评价研究问题(idea)的标准

  先贴上清华教授的理论:教授认为评价的过程中要从10个方面去评价研究问题,分别是问题的重要性15%、创新性15%、前沿性15%、探索性10%、基础性10%、复杂性10%、系统性10%、可行性5%、承接性5%、适合性5%。我来结合自己的理解翻译一下吧,不然单看数据太晦涩了。

  首先,我们评价的时候要先看看这个问题是否是本领域或者本学科中比较重要的问题,这是很重要的,问题驱动的idea很多就是这么来的,从最紧需的角度出发去思考来产生idea是个不错的角度。

  创新性也很重要,idea能否为学科创造比较新的知识也是一个很重要的评价标准,不过这个角度比较难,需要灵感和天分,或者导师的灵感和天分。

  前沿性就不用多说了,越是前沿越有可能引领未来的科研潮流,也就越容易中刊,中顶会。

  而探索性,指的是是否该问题角度尚未得到充分的探索,这点其实有必要尽早的进行确认,它是一个比较基础的问题,但却有时会被大家忽略,而导致高兴了半天,别人也做过了,或者别人做的比你快这种尴尬的发生。

  同理,基础性表示的是,该idea能否对相关方向产生足够的影响,这是衡量idea的根本之一。

  复杂性,是教授自己提出来的一个观点,当然也很有道理,他说我们其实应该考虑一下我们提出的模型的复杂性,或者说它是不是具备三年探索的体量和潜力。

  系统性,其实和复杂性有点儿重复,它的意思主要是该问题能不能拆解成多个子问题,当然是希望能拆解的程度越高越好,复杂性越高越好。目标是在未来三年的研究过程中最好能一直围绕着第一篇paper展开,这也是选择长期方向的意义所在。

  可行性,是从另一个角度来评价了,可行性分析关注的是idea是否具备短期实现的可行性,也就是paper能不能快发,说实话,从idea产生开始,就要争分夺秒了,快发是科研人的基本素质,夜长梦多,早发早中,晚发一分被抢的概率就又高了一分。

  承接性,承接性评价的是idea是否具有良好的前期成果积累,也就是这个idea是否是无中生有,是否能够引用很多经典,是否有很好的理论支撑和基础。支撑和基础越多,审稿人也就越青睐,也就越好中,ps:投稿最好能够找到所投期刊的早年相关文献拿来引用,加分哦。

  最后再考虑适合性,也就是这个领域能不能发挥自己的能力。这个问题事实上是最后考虑的,因为毕竟最开始,对自己能力的评价往往不够客观,我们可以先尝试,或者跟随导师的思路确定好方向和idea,在在过程中发现自己是不适合深入研究。如果合适,那刚才评价复杂性和系统性的结果就乐观了,未来三年你就研究这个了。要是发现不感兴趣,不合适,发完这篇在迭代的去找新的idea吧。

  以上就是我对本学期零碎的科研经历的总结和归纳,希望对大家能有点帮助,我会持续更新本文,每过一个学期就加入些新的理解进来,希望能对大家有帮助。

你可能感兴趣的:(前沿方向研究,科研分享,论文,人工智能,其他,面试,nlp)