导师一般事务繁忙,没办法手把手教授科研的理念和经常解答疑惑,在此总结遇到过的一些问题以及优秀的回答。当做自己日常输出的方式。
提出问题是解决问题的一半!
(Q1)你觉得什么才是研究?
(Q2)你觉得什么才是研究的表现形式?
(Q3)你觉得什么才算是高水平的研究?
(Q4)你觉得什么样的学者才是真正有水平的学者?
要点总结:
(1)每天阅读文献,批判性阅读。了解本领域最近进展,只看文章的标题和Abstract,遇到感兴趣的和重要的留下来重点关照。
(2)尝试了解本领域全世界的著名课题组、教授或团队,各自的风格和长处是什么。尝试与这些人包括论文中的大牛见面,聊天,甚至建立更深入的联系。这是对科研人脉圈的训练,未来在博士以后去找pos-doc,教职,工业界工作甚至申请国外绿卡都会帮到大忙。
(3)博士期间,多参加学术或行业会议。演讲训练,如做presentation的能力。
(4)心态的训练。抗压能力得训练。在面对拒稿、卡壳、被抢发等外力因素时保持平常心,不被负面情绪(如嫉妒 不甘)降低效率。
(5)画图的训练。
(6)实验记录的训练。
(7)英语表达:熟练完整地进行日常对话、写作、阅读。
(8)搜集信息的能力:能快速准确找到自己需要的论文、知识点或代码,切忌浪费时间重复劳动前人做过,或者用正确但过时的工具事倍功半。
(9)交叉力:能发现跨领域或者不同工具或者不同流派的交集 从而完成交叉类研究。
(10)研究格局:注重研究的深度 专注痛点问题而非无关紧要的交叉概念/涨点/调参/做小改进。
(11)时间管理:包括对课业、研究、审稿、助教、 阅读文献、演讲、实习、合作者之间时间管理,不会错过deadline。
(12)精力管理:保持体重稳定、睡眠充足、不产生心理和精神问题。
(13)项目管理能力:统筹研究工作。
方法一:大牛挖坑,小牛灌水,菜鸟找坑。找个好老板。
方法二:找领域内学术水平比较好的学校,比如前20前30的学校,去查他们最近2-3年新招的博后、ap的资料,看他们导师是谁、主要做什么领域,publication大致看一看。“结果反推原因”——能找到大牛校职位的新人做的方向,往往就是比较主流、大家普遍认可的方向。而且有时候看他们导师是谁,你基本能发现这个领域是哪几个大佬有能量,能搞定自己学生的出路。
1.1 施一公:如何提高英文的科研写作能力
要点总结:
(1)养成阅读英文文章的习惯,从英文报纸到新闻再到杂志。
(2)科研论文,逻辑最重要。按照思路来作图,然后写作。
(3)先写一个一个框架然后迅速完成初稿。第一稿不追求词语的华丽,主要关注逻辑,注意前后句的逻辑关系、相邻两段的逻辑关系。
(4)筛选本领域优秀的论文,然后从这些范文里学习。
1.2 科研论文要回答什么?
(1)创新点是什么。论文要清晰地表述所提出的新发现、新假设和理论,界定相应概念和变量的内涵和外延;
(2)为何要提出此创新点。论文要交代创新点提出的实际或理论背景,既说服自己也让读者感到这样的创新点的确有学术和实际意义,值得费精力去研究;
(3)回答这个创新点是否成立的质疑。提出证据和论据来支持论文的创新点。为了回答上述问题,相应有三方面的内容,即创新点的表述,创新点的理论和实际背景评述以及创新点的论证。表述反映论文的贡献所在,背景评述衬托出论文的价值,论证则表明创新点的可信程度,三者缺一不可。只提出某种观点、说法或模式而缺乏背景评述,读者难以了解其创新的份量和作者工作的价值,而有价值的假设或理论还需充分的论证支持,否则,读者将难以置信,不能放心引用。
2.1 Academic Phrasebank:SCI专用写作句型和短语
2.2 Thesaurus:同义词替换
2.3 Grammarly:语法修改
3.1 何谓创新?
一类创新:新问题,新方法;从实际问题中,提炼出新的科学问题,也采用了全新的方法,构建了新的体系和框架;
二类创新:新问题,老方法;从实际问题中,提炼出新的科学问题,但是机灵地运用成熟的技术解决这类问题;
三类创新:老问题,新方法;别人提出很久的问题,有一定的研究成果;在此基础上,你利用新的理论再一次解决了它,给出了另一个视角的解决思路;
四类创新:老问题,老方法;在原有问题上修修补补,进一步完善。
3.2 如何问一个好的科研问题?
研究的问题是什么(What is the question)?科研问题往往是一个课题的开始,是所有实验设计围绕的主旨,也是最终要通过实验结果来达成的目标。
(Q1):我的科研问题是否问得太小?
一个好的评判研究问题是否太小的标准是:看了你的研究问题后,会有多少人感兴趣。这样的问题是否足够支撑实验室未来10年的发展呢
(Q2):我问的问题是否能够被实验所回答?
(Q3):我的问题中的每一个用词是否准确?
3.3 国外博士培养的理念
(1)提出的博士论文题目一定要有“哲学”内涵,也就是一定要上升到方法论的高度,为人类知识库作出贡献。
(2)实用性的,技术性的工作是硕士做的。博士的工作高于硕士的地方就在于它研究的是普遍的,基本的方法和理论,而不是这些方法和理论的某一个实践。
(3)要求读很多真正意义上的哲学书籍。
(4)特别重视博士论文的完整性以及内在逻辑。
3.4 如何想出不错的idear?
总结:
写作之前,先问问自己如果这篇文章写好以后给整个领域(community)的贡献是什么,这实际上是整个文章的灵魂,也就是你解决某个问题(problem)的方案(idea)。想清楚以后把它们按照重要性顺序写下来,这些就是你在Introduction里面告诉读者包括审稿人的contributions。文章的contribution一定要准确清楚地指名出来,比已有工作的显著贡献在哪儿。包括在intro,related work, disussion或者conclusion里面充分阐明文章所提出的方法具有的潜在的影响力,相较于已有工作的亮点(可以不局限于文章本身针对的应用)。
Related Work不是记流水账(e.g.,甲用了idea A,乙用了idea B,丙用了idea C),而是要比较这些论文,阐述她们各自的优缺点。Related Work写完后,你需要写一个Overview来总括你的问题和解决方案。
根据上面的例子,你需要写的是如何从实验数据中展示你的解决方案支持一二三四并且性能不错。支持一二三四这种是或否的问题比较容易说,但是性能不错就需要和前人作品做大量比较了。柱状图,折线图,表格等等数据展示手段,只要能说明问题都可以采用。这里需要注意的是,只要你写在论文里面的文字或者是图表,你都要想清楚背后的原因,最好能在论文里做充分的解释。比方说,你采用了新的算法,性能见表1,原因是复杂度降低了;你采用了新架构,性能提升见图3,原因是新架构节省了内存拷贝。
通常来说,新算法或者架构会总体上提升性能,但也可能会有异常情况,即新方案比不过老方案的地方。这时需要格外注意,因为这是你的weaknesses,你需要用令人信服的说法向读者展示这些异常情况存在的可能性较低,或者可以通过某种简单方式避免。如果写到这里你还有充足页面可用,你可以试图写一个discussion章节来讨论你的方案的缺点,以及未来有可能的改进情况。不要怕展示缺点,你越诚恳审稿人对你印象越好。如果你是故意遗漏新方法的一个很显然的缺点,这会给审稿人非常不好的印象。
你不能只是去吹你的成果多厉害,而是要把背后你要解决什么问题、这个问题有哪些难点、你是怎么解决的、你的方法的核心点在哪里,都要说清楚(而且还要让人看得懂),最后的实验来给出更为详实的证据,加深大家的理解。别人读完你的论文,对某个领域有了新的理解、学到了新的知识或者解决问题的方法。
先构思论文的结构,再填内容。问题介绍部分,就是要在一个大背景之下,限定这篇论文要解决的问题,并且说明这个问题的重要性。 框架的构思, 注意十二个字: 环环相扣、步步坚实、逻辑严密。前有伏笔、后有填坑。比如在问题介绍部分,你指出某个领域有A、B、C三个重要问题,但是你后文只打算解决问题A,那么在问题介绍部分你就需要解释为什么不解决B、C。如果你有证据证明B和C不太重要,是可以的。或者解决问题A的贡献足够构成一篇论文,那么你可以明确表示本文只解决A,B/C以后再说。不要前面挖了坑,后面不填,还有就是必须要保证每一步的证明都是能说服审稿人的。
实验,一般是1-2个大实验让审稿人相信你的方案确实可以,然后3-4个小实验作为佐证或者分析一下分支问题。注意,这里每个实验也都是和前面的问题分析、提出的解决方案要对应起来的,前面有铺垫、后面要填坑。论文中的每一段都要师出有名。
比如你发明了A方法解决B问题。如果B问题是已知的问题, 你就要解释为什么现在的解决方案都不好或者为什么还没有解决方案。如果B问题是未知问题、你自己发现的新问题,那么你就要解释这个问题有多重要。这一阶段,你并没有提出任何解决方案,但是一定要有自己对问题的insight。 注意这个词,insight! 如果你被拒稿多次,你一定被审稿人批判过没有insight。对要解决的问题有深刻的认知并且有自己独特的见解,是一篇论文的基本要求,有时候指出问题比解决问题还要重要。
多看论文,总结经验。写论文一定要多看别人的论文、多反思自己的论文。看的时候要带着思考,想想别人为什么这么写、想想审稿人为什么拒绝你。
另外有一个经验就是,不要高估审稿人的耐心值,也不要让审稿人帮你总结contribution。在每一章的开头处用3-4句话总结这一章要说什么、把我的核心contribution列出来。对于每一章的每一段,都在开头或者结尾点下题。
要被A类的会议收,宁肯文章只有一个亮点,但没有明显的缺点。就算你的文章有很多亮点,但如果能找到1,2个明显的缺点,就算这些缺陷不影响文章主要的贡献,就录取可能性而言会低很多。要在讨论这一步把缺陷讨论清楚。
实验验证的数据集在可能的情况下,一定要2个或以上。
在具体阐述自己提出的方法的任何一个小步骤时,先讲是基于怎样的observation或者intuition,然后再根据这个intuition设计某种具体的算法纳入整个方法流程,最后再在实验验证部分针对这个小步骤做专门的验证。这里第一步的intuition要尽量使用大白话和例子让非你小领域内的审稿人也能理解,这样即使他看不太懂你的具体算法设计,一般也会认可你的工作。还有一个很能加分的点,就是如果能把intuition和某种社会学,经济学等非计算机领域的经典理论扯上点关系,能为文章增色一大块。
不要着急地转投,如果可以解决的问题一定要在下一次投稿之前尽量解决。
投稿中与不中,其实是取决于与审稿人的博弈。
从三个纬度来衡量一个工作的质量:(1)创新性,(2)理论证明度,(3)实验效果。
文章的干货包含三种,第一种是针对一类新问题提出了一种新颖的解决问题的方法,并用此新方法得到了该新问题一个好的结果,这是最顶级的干货,也是学术界顶级大佬的成名作中最常见的成果。第二种是方法并没有创新,无非是把前人的若干方法结合了起来,然后解决了一系列问题,并得到了较好的结果。这种类型的干货也是目前绝大多数trans论文中的成果。第三种是针对一个没有解决的open problem,提出了新的方法把该问题向前推进了一步,这种类型的干货也是非常棒的,足以在任何档次的trans上发表。
对于同一件事,每个人的看到的都不同。
1.陈天奇:机器学习科研的十年
总结:
(1)研究视野。如何选择一个新颖的研究问题,如何在结果不尽人意的时候转变方向寻找新的突破点,如何知道整个领域的问题之间的关系等等。
(2)研究的品味。在已经发表的论文基础上,静下心来做发大的,“只做best paper水平的研究"。
做什么样的问题,可以值得自己深入付出,做扎实有影响力的工作。研究的乐趣不光是发表论文,更多还是可以给别人带来什么,或者更加大胆地说 – 如何一起改变世界。
(3)对于论文。论文并非越多越好,相反你可能要尝试优化你的论文里面最低质量的那一篇。保证每一篇论文的质量接近单调提升,已经是一件难以做到但是又值得最求的事情。
(4)要做难而正确的事。选择做什么眼光和做出好结果的能力一样重要,眼界决定了工作影响力的上界,能力决定了到底是否到达那个上界。交大时敖平老师曾经和我说过,一个人做一件简单的事情和困难的事情其实是要花费一样多的时间。因为即使再简单的问题也有很多琐碎的地方。要想拿到一些东西,就必然意味着要放弃一些其他东西,既然如此,为什么不一直选择跳出舒适区,选一个最让自己兴奋的问题呢。
2.李沐:博士这五年
总结:
(1)努力程度。一周七天工作无休的节奏。每周至少80个小时花在学校。
(2)对于投稿的文章。一篇好文章自然需要有足够多的“干货”,或者说信息量, 但一篇能被接受的文章需要满足下面这个公式:文章的信息量 / 文章的易读性 < 审稿人水平 * 审稿人花的时间。对于信息量大的文章,就需要努力提升易读性,包括清晰的问题设定,足够的上下文解释等等。
(3)论文的深度。一个误区是只关注自己做了什么,结果多么好。这些确实能证明个人能力,对于想重复这个工作的人来说会有很大帮助。但更多的人更关心的是适用范围在哪里,就是什么情况下效果会减弱;为什么结果会那么好;insight是什么。这个需要更多深入的理解和思考,而不是简单的展示结果。这个对写论文也是如此。只说自己的结果比基线好多少只能说明这是不错的工作,但结果再好并不能意味这个工作有深度。