《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢。由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学术路上期待与您前行,加油。
前一篇带来李沐老师对论文写作和科学研究的分享,介绍如何跟读者建立联系(Research,Researchers,and Readers),更好地让读者信服我们的论文及创新。这篇文章将详细讲解找问题和明白问题的重要性(Asking Questions, Finding Answers),其核心是说先找到大小合适的话题,然后问一些问题,再把一个读者认为值得去了解答案的问题抽出来,做成一个研究问题并找到问题对读者的影响,以及怎么样找到对应的资源并读懂别人的工作。核心为Topic、Question和So What三点,希望这篇文章对您有所帮助。一方面自己英文太差,只能通过最土的办法慢慢提升,另一方面是自己的个人学习笔记,并分享出来希望大家批评和指正。这些大佬是真的值得我们去学习,献上小弟的膝盖~fighting!
参考李沐老师github和原视频地址,感谢、感恩和推荐大家阅读:
前文赏析:
本书第2部分的核心是:
找问题去解决是研究领域一个独有的事情,但是在做一件事情之前,想清楚这件事情的意义是非常重要的,它具有一定的普适性。在生活或工作中,做任何事情之前,都可以想想如果把它做了,那么它的意义在什么地方,如果每次去想这个事情,既会让你把一些事情做得更好,又会让你发现很多事情其实没必要做,从而节省时间。
From Topics to Questions。本章将讨论怎么样找到一个感兴趣的话题,然后在话题上做研究,并提出一些问题来指导你做研究。
In this chapter, we discuss how to find a topic among your interests, refine it to a manageable scope, then question it to find the makings of a problem that can guide your research.
正文开始时,作者提到自由(freedom),即做研究的时候,大家可以自由地选择话题。其中,学术界自由度相对更高,工业界会低一些。同时,自由也会带来选择困难症,或者说大家可能就在那边东逛西逛,也不知道到底要做什么,最后定不下来具体要做什么事情。这是每个人进入一个新的行业或刚开始做研究都会遇到的问题。是不是想到了我们自己,哈哈!
首先定义一些术语。
问题:你为什么要选择话题呢?
因为你很难有一个研究是针对整个研究领域来做的,当然存在某篇论文开创了某个研究领域,但就算是这样的论文,它其实最开始的出发点,也是比较小的,所以你一定要在自己的领域中找到一个话题,再继续深挖。
话题并不是把这个领域的范围变小,而是一个使得你可以在里面问一些问题的途径,如果这个问题你回答得比较好,整个领域的研究人员都会对它感兴趣,而且好的答案能够在一定程度上推进整个领域往前发展。
话题本身,也可能比较大也可能比较小。大就是说,在整个研究领域中很常见的一个话题(比如心理学中害羞或愿意冒险是人类学来的还是天生的);小众一点的也可以,但只有某些特定的研究人员感兴趣(比如把咖啡放在桌上之后留下的印子为什么一定是个圆形)。当然,大家都感兴趣的话题,肯定会有更多人参与研究,所以竞争更加激烈一点;比较小众的话题在里面做出比别人更好的工作的概率更高一点,但是会导致你就算做出来受众没那么广,最后你要做一个权衡。
不管你的话题大还是小,最关心还是对这个话题问一些问题,然后是你问题的答案,别人可能会觉得比较重要,甚至这个答案在一定程度上能改变整个研究领域。
知识点:区分Question和Problem?
往细地说,一个疑问不一定会带来一个问题,一些问题回答与否,并不都会带来什么后果,但有些问题的回答可以解决很大的问题。
两者是可以区分开的,也就是针对一个话题,要问很多问题,然后找出里面到底谁值得去回答,最终解决Problem。
该部分主要讲解怎么样从兴趣找到一个话题。核心思想是说你可能会有一些兴趣,或者通过读一些文章去发现你的兴趣,然后在你的兴趣中找到一个话题。
由于本书写作针对很多本科生,比如本科课程教大家如何做研究再做一个报告,但里面的问题是没有人告诉你要找什么样的话题,你可以随便找,却会导致你每次要花很多时间去想到底要干什么事情。因此,话题就来自你的兴趣,通过阅读深挖。当然大部分做研究的时候,你还是有一个大概的方向,比如你的导师做某一块的研究,或者你师兄师姐做哪一块研究。很有可能,你还是只给定了一个领域,需要在里面找到一个话题。
总之,话题主要取决于自己的兴趣。比如李沐老师喜欢怎么样将一个算法做得比较快或比较大,他在读文章时通常会思考这个算法会不会跑得很快,会不会做不大,如果我们要改进的话怎么样去做,这样才能发现一些话题。
对于技术领域而言,需要考虑的就几件事。
大家看到一个技术点或话题,通常会考虑上述四个点。然后,你看看自己对什么东西感兴趣,并针对这些兴趣去找到对应的话题。这本书介绍了很多东西可以去看一看,但主要还是偏文科的,跟我们理工科还是有不一样的地方。
该部分介绍如何将大话题变小,变到一个真的可以做研究的东西。 首先给出例子:
接着作者给出怎么样促使一个话题可能会导致一个比较好的研究工作,其采用的方法是能不能把这个话题换算成一个论点,该论点看上去有一定价值值得去讨论。先看两个泛化的话题:
当找到合适话题的时候,就要问一些问题了。
综述文章思考: 同时,反过来讲,当你打算去写综述的时候,你其实已经问了一个问题,即:
作者接着给出一些方法去提出这样问题,整个方法比较偏文,对技术而言,需要考虑的是3.1小节的四个问题。
因此,你可以从这四个大的方向去找出一些合适的问题,然后带着这些问题再去读你的文章。
当然,你可以提出很多问题,其核心是说怎么样评估你的问题。李老师认为本节是讲得最有用的,即你最后的最后要问自己一个问题——So What?
上一章我们讲过,最后需要写一个文章出来,让别人去读并且觉得值得去读。所以,你一开始得想清楚,别人为什么觉得它值得读,也就是So What这件事情。
此外,这件事不仅对研究有用,对日常生活和工作也有用,如果我想要让这件事情变得更有价值,我应该怎么样往前做。或者说,这件事我看不清楚对自己或别人有什么样的价值,这时候可以选择不做这件事情,把时间空出来做一点别的更有意义的事情。
就像作者说的一样,要对自己tougher(狠一点),这样子才能比较客观。因为你总是会为自己辩护,做事总会下意识找理由来支撑你这件事的意义,但很多时候有些事情是没有太多意义的,如果你能及时认识到这件事,把时间放到更有意义的事情上,你的时间利用率会更好。或者今天你失去什么觉得特别难过,做什么事情觉得特别尴尬,你也可以问一下So What,我做这么傻的事情别人Care吗?别人可能不Care,或者我失去这个东西十年后我也不Care。
因此,时不时很tougher的问一问自己So What这个问题,能够帮助你的生活变得更加简单,你会发现很多事情其实没必要做,也会发现一些更有意义的事情。大家应该坚持做有意义的事情,把所有的精力和时间都投入进去。
后续作者提供包含三小步的方法来帮助大家理解:怎么样找到你的问题,以及怎么样去问so what。
继续回到So What问题。
但是,很多时候其实你并不知道这个东西为什么重要(Why does this matter?),特别是偏理论点的研究或者是很开放性的问题(如文学),你并不知道这个东西到底有没有用。在这个情况下一开始是OK的,就是说一开始并不知道为什么要做这个事情,随着研究慢慢深入,我们不断的去问自己说,找出或发现的这个东西到底有没有用,别人到底在不在意。
所以,当你不断的去想这个事情,也会指导你的研究方向。当我们没有想清楚这个事情的时候,很有可能这个研究是不能停的。只有当我们大概是知道为什么别人觉得这东西有用的时候,我们才可以把研究停下来,开始写论文。如果你没有想清楚这个问题,那么你写的论文很有可能是别人不Care的。
最后总结下3个步骤:
本章给出一些小技巧来帮大家找话题(Finding Topics),具体给了两块:
(1)如果你去参加一个科研实践课程,在你的兴趣点里面找到一些话题来研究。
(2)如果已经有了一个研究领域的话要去怎么样找话题。
人工智能领域:
当然,如果具体到人工智能领域的话,网上会有很多讨论以及各种报告、博客,大佬也会谈一谈什么东西比较重要,未来五年、十年人工智能的走向。你还是能够找到比较大的话题,李老师个人看法如下:
除非你在一个比较大的团队中,有很多人一起做一个事情,以及有大的数据或者有比较多的计算资源,否则一般来说尽量不要去碰那种大家都在谈的特别大的领域。因为这里面的人特别多,比如图片分类问题、目标检测问题,以及现在大家都在做的那些特别大的transformer模型。因为就算有一个很好的想法,但是要把文章写出来的话,需要大量的实验以及大量的精力去调这种东西,要做出效果的话,不是一个人很短时间就能做出来的。
反过来讲,可以去关注一些稍微小一点的问题,从小的地方开始,也许可以往大的方向靠。那么怎么样找小的问题,可以在网上找一找(reddit上面很多这样的讨论,大家会分享一下自己的一些经验)。
可能比较好的一个办法是说:如果有时间的话,可以去公司里实习,去看一下整个工业界中在应用人工智能的时候,遇到的一些痛点。很多时候工业界的人,他自己可能没这个想法,反正就这么痛,用过去就已经习惯了。但是你作为一个刚进去的实习生,是个外来者,可以去仔细的观察大家是怎么样用的,遇到了什么问题,去把这些小的事情抽象出来,总结出来就变成了一个研究的问题。然后只要观察仔细的话,其实是会发现很多这样子的问题,这里面的小问题很有可能是能支撑我们几年的研究的。
写到这里,本节内容讲解结束。本节核心思想如下:
From Questions to Problem。该章节主要讲解怎样将大家问出来的问题(question)变成一个值得解决的问题(problem)。作者把问的问题question和值得解决的问题problem给区分开来,帮助我们新手去了解一个思考的过程。虽然我们关心的只是值得解决的问题(problem),但这个从question到problem的过程同样重要。而且这个思考的过程不仅对新手有用,以后如果你要指导别人做研究的话,也需要了解这个过程来帮助别人来更好的思考。
In this chapter, we explain how to turn a question into a problem that readers think is worth solving. If you are an advanced researcher, you know how essential this step is. If you are new to research, we hope to convince you of its importance, because what you learn here will be essential to all your future projects.
这本书第3章和第4章都是讲工作的动机及意义,第四章会告诉大家一个值得研究的问题长什么样子。首先回顾上一章所提出的三步公式来解决问题:
如果你从第1步挪到第2步,那你不仅仅是一个简单的数据收集者,而是一个研究者去了解一个特定的问题;如果你从第2步走到第3步,那么你就进入一个研究领域而且去了解从别人眼里来看这个问题的价值在什么地方。
因此,当你完成上述工作,能从别人角度来看解决这个问题的重要性,那么你就创建了一个跟读者非常强的联系,因为当他们读完你的报告能有更深入的理解。总之,通过本章能找到值得解决的problem,别人也会认可你的问题。
理解研究问题。问题通常有两类:
(1)实际问题(practical problem)
比如说一个算法跑得比较慢,解决它需要让它跑得更快;或者一个任务在某个数据集上的精度不是很高,可以提出一个新的算法解决它;或者这个领域没有一个很好的数据集能够让大家更好的去评估这个问题,那我提出个数据集;这都是解决一些实际的问题。目前读的很多论文都是去解决实际问题。
(2)概念问题(conceptual problem)
这些问题不是要去解决某一个实际的痛点,而是说如果我们回答它的话,会对某一个事情或者这个世界有一个更好的认识。在科学领域,绝大部分问题是这种概念上的一些问题,帮我们更好的理解某一个东西。比如物理学理解这个世界。
但是在技术领域,更偏向实际的问题。当然也有很多偏理论的问题,比如说了解batch normalization为什么能够工作,以及说深度学习为什么能工作,甚至机器学习为什么能工作。这里面有很多的理论工作,但是我们目前为止,没有太多的去涉及这些论文,所以导致大家可能觉得这些东西不多。但实际上在整个人工智能领域特别是机器学习,可能是在深度学习之前,可能至少有1/3的论文是关于这样子的一些概念性的问题。
接着作者画了一个图,告诉大家问题是怎么样来的。
本小节最后介绍为什么要有问题?
如果你没有问题的话,可能你整个论文写出来就是很多数据在里面,很多证据摆在里面,但是别人看上去就没有能找到你的观点(point)在哪里。很多新手写作就是没有把东西聚焦在某一个问题上,使得读者跟不上你的节奏,也不知道到底在问什么问题,所以还是需要有一个问题,你的研究不管大或小,不管是小小的技术报告,还是一个跨领域时代的大论文,或者引用上10万的论文,其实你最后都是要解决一个问题,只是说你解决问题的大小而已。
该小节介绍一个问题的结构通常是什么样子的。 作者说到,不管是实际的问题还是概念上的问题都有一个下面的结构:
你的状况和你的代价的不同,导致的两类问题是不一样的。
接着给出实际的问题示例。
需要注意的是所谓的代价,其实是读者关心的,不是我们自己要付出的代价而是他们(你的读者)要付出的代价。
接下来讲解怎么样从读者的角度去找出这样子的代价:
因此,你需要从读者角度不断地问So What问题,直到你觉得可以停止,停在的那个点就表示你可能找到了一个问题。
接下来看看概念性问题会有什么样的。
作者画了幅图来说明:去了解我们的第一个问题(研究要去回答的问题),能帮助我们了解一个更大的问题(Q2),就是从Q1一直到Q2,只要Q2足够大而且确实是能过去的话,那么这还是有价值的。
如何更好的去找到这样的一个后果呢?
整体而言,概念性的问题比实际的问题在问上会更虚一点,因为看不到一些事实上可见的代价。很多时候这些问题最后也只是满足了人类的一个好奇心。比如宇宙终极目的是什么,人的存在意义是什么,好奇心推动人类科技的进步。所以,我们在做研究的时候,特别是对概念性问题的研究,其实就是满足人类的好奇心,特别是对本质上的好奇。
Distinguishing “Pure” and “Applied” Research.
纯研究通常会出现在比如说自然学科领域,在学术界会多一点。在工业界的话,大部分的研究是应用性的研究,当然在学校也是一样,偏技术类的研究通常都是应用性的研究,就是去回答一些实际的问题。
具体的区别就是说最后你的重要性(significance),也就说so what这个问题是要去回答一个问题,满足大家的一个好奇心(纯研究);还是说去解决一个实际的问题,降低某一个代价(应用研究)。举例:
同样主题的东西,最后的significance不一样,导致了在纯研究和应用研究的差异。应用性的研究,大家可能会觉得问题不大,反正因为能看到实际的一些结果。但是对纯研究的话,很多时候大家对上面不是那么的理解。如果是做纯研究领域的话,想让大家能够更好的理解你研究价值,也可以往实际的那些应用去靠,举例纯研究与实际应用挂钩,并加强两者的联系。
思考建议
很多时候大家在写纯研究论文的时候,其研究问题是更大领域问题的一块,但你没有有效地将两者的联系写出来,导致读者会有一点困惑。但反过来讲,如果我们是读者的话,在去读纯研究论文的时候,我们要去理解它背后想回答更大的问题是什么,虽然它看上去只解决了一个很小的问题,但是你一定要想清楚它能够拓展到一个什么样更大的问题。从而它从那个更大的问题中获得了意义、获得了价值。
在讲完这两种不一样问题的结果后,作者提出了一些比较实际的点——怎么样找到一个好的研究问题。
整体而言,找到一个好的问题,是一个研究者可能需要花很多年的一个事情,需要跟可能比我们更善于去找好问题的研究者去合作,从他那里学习不断的去学习怎么样找到这个领域的好的的问题,也不是短短十几分钟能讲清楚的。大家需要意识到这个问题的存在,然后不断去练习。
本小节主要讲解:在真的去解决一个问题之前,不要去想说能不能解决它。能不能解决它其实是后一步的事情,先要问的问题是说读者认不认为这个东西值得解决。
本书作者直接把后果说了出来,假设我们不这么做的话,那么很有可能读者会不在意(care)我们的工作,这也是得到的最差反馈。换句话说,作者告诉大家为什么在做一个问题之前,一定要想清楚读者会不会觉得这个问题值得解决。
作者给出一些简单的建议:当你是新手或新入某个领域时,其实你并不知道一个问题重不重要,你会有一定的焦虑,那么,怎么样摆脱这样的焦虑呢?
老师补充几个办法:(真心受教)
不要等到真的把研究做完、论文写完,再去给别人看说这个东西值不值得做。要在一开始的时候,尽量的在有想法的时候,跟别人交流,跟你的同学谈也行,同事谈也行,老师谈也行,甚至是可能针对的用户谈也行,就看看他们关不关心这个事情。
不要等到你的研究真的做完,可以是做了中间一半比如说1/3或者1/2的时候,准备一个10分钟、20分钟的小报告,然后在本地的一些研究小组里面给大家讲一讲,看一看大家的一个反馈。如果讲完之后,大家觉得没什么意思,很有可能你做的东西大家不感兴趣。同时,计算机领域很多会议会有workshop,workshop不一定需要把研究做完,您可以做一点点时就写个2-5页报告然后提交,你可以在workshop上面投稿,看看圈子里大家的想法,并参与讨论,
在工作中,在公司的时候,想做任何研究的时候,在做它之前一定要想清楚说哪个产品团队或哪个客户可能会需要这个东西,他们会不会把这个研究工作做进产品里面。在做之前先别急着动手,先想清楚你要做什么样的问题,可能用什么方法,然后你去跟这些未来可能存在的合作方去聊,告诉他说:我准备做这个问题,你感不感兴趣,你感不感兴趣把这个东西放进你的产品里面。但需要把握对方真实的想法,是否真的感兴趣,而非客气,你可以说要不你们出一个人我们也出一个人跟进合作之类的。
核心是说要在做研究的过程中,要不断的跟潜在的读者或用户沟通,使得可以根据这个交互来帮助我们改变整个研究的一个方向,也是确保在研究做完之后,最后是有人关心有人买账。
本章小结:
本章主要将怎么样是一个很好的问题,从一个话题到提出一些疑问,怎么样把值得回答的疑问变成一个读者关心的问题。
在有了问题的时候,怎么样去找资源(书中偏文科,在技术领域比较简单,仅简要介绍)。 技术领域找相关论文的方法如下:
第6章主要讲:当你有了资源的时候,怎么样读它,怎么样评估一篇论文的好坏。 其实李老师之前所有读论文系列都是在帮大家去学习第6章讲的一个事情,即给一篇文章怎么去读懂它,然后去发散,去了解它背后的一些东西,这里就不再详细介绍了。
怎么评估一篇论文的好坏,具体方法如下:
写到这里,李老师就讲完了第2部分,该部分的标题叫做“问问题然后找到答案(Asking Question,Finding Answers)”。其核心是说先找到大小合适的话题,然后问一些问题,再把一个读者认为值得去了解答案的问题抽出来,做成一个研究问题,我们的研究问题可能是实际的,也可能是概念上的。不管是哪类问题都要想清楚:
后面两节是说给一个问题怎么样找到资源,就找到前面的工作;然后怎么样读懂别人的工作,以及把自己的工作放在别人的工作之上。核心是说要学懂前面两章讲的东西,就是话题、问题以及他的后果。
最后你的摘要也好,Introduction也好,你会发现基本是就是讲这三句话,因此你一定要想清楚。但后面我们讲到实际写作的时候,再带大家回来看怎么样把想清楚的3个东西变成一个故事,写到你的文章里面。
再次感谢李沐老师的分享,推荐大家多看看李沐老师的视频和分享,值得大家学习,学无止境,受教受教。
三月应该是今年最忙碌的一个月了,好多事情。希望一切顺利,更希望四月后能沉下心来读论文和写论文,继续加油,只争朝夕。这篇文章就写到这里,希望对您有所帮助。由于作者英语实在太差,论文的水平也很低,写得不好的地方还请海涵和批评。同时,也欢迎大家讨论,继续加油!感恩遇见,且看且珍惜。
作者论文分享github地址:
(By:Eastmount 2023-04-21 周五夜于武汉 http://blog.csdn.net/eastmount/ )