顶会论文写作建议

转载:https://zhuanlan.zhihu.com/p/593195527

顶会论文写作建议

这几条建议将分成上下两篇,每篇聚焦于如何避免收到一条致命的 “恶评” ,分别是:

  • (上)This paper is hard to follow(宏观层面,谋篇布局,优化论文结构,卖出核心贡献

  • (下)The readability can be greatly improved(微观层面,精耕细作,少犯常见的小错误


本篇先从 “hard to follow” 开始。

  • 缺乏经验的同学收到这样的恶评外加一个 strong reject 之后可能会感到迷惑和委屈

所以本文首先从审稿人的角度来:

  1. 分析他们为什么会对你的文章作出这样的评价
  2. 然后通过两个例子给出相应的写作建议

一、审稿人视角

这个评价可能表示论文的宏观组织形式内容分布与审稿人所期望的有较大的差距,所以他在耐心耗尽前没能搞懂你做了什么

  • 对同一篇文章,审稿人想的跟作者想的到底差在哪呢?

 

一位同学可能会对自己刚完成的论文很满意,因为:

A. 在对一个重要问题的研究过程中:

  • 我遇到了几个复杂的子问题,我一环扣一环地解决了这几个问题,最终得到了一个巧妙的解决方案
  • 我记录了这个精彩的过程,审稿人应当为这一方案的系统性和自洽性折服。

B. 我讨论的问题有点难以理解:

  • 但只要脑子里转过那个弯儿来,经过一系列挑战性十足的思想游戏,就可以把这个问题转化为另一个简单的问题,那么解决方案就自然呼之欲出了。
  • 我用两页纸的篇幅进行了这一思辨,逐步推出了最终的结论,审稿人肯定会受到灵魂的启迪。

C. 我在别人的工作上加入了本质的创新:

  • 变成了全新的东西,最终的效果很好,如假包换的SOTA。
  • 审稿人只要能看懂实验结果,就应该给我accept。

 

那审稿人是怎么看的呢?

审稿人根本就不在乎。

审稿人点开了你的文章,边看边想:

A. 他到底要解决什么问题?

  • 怎么一个问题又一个问题?到底哪个是他要解决的?
  • 哪个方法是common practice,哪个是他提出来的?

B. 这两页纸在写什么东西?

  • 前面没总起,后面没总结,中间又是假设又是推论的在干什么?
  • 这个结论是怎么回事,这不是很显然的吗?磨叽了两页纸,就这?

C. 哦,这个懂了,yet another AAA + BBB,我跳过中间四页直接看看效果吧。

  • 这张表里面的这个指标是啥意思,就比别人高了0.2,这个差别很大吗?

二、审稿人期望的是什么呢?

审稿人想要的是迅速搞明白你提出了什么新东西

  • 不是听你娓娓道来、抽丝剥茧,跟着你一起由浅入深地感受那四方求索、最终豁然开朗的成就感。 【重点】

写论文的目的在于向读者介绍工作的最终形态,而不是记录研究过程

  • 有的同学会在文章里描述自己从最初的idea艰难跋涉直到最终结果的心路历程,这多半是没用的。

 

审稿人不会逐字逐句地看论文,他希望他直接跳到任何一页上之后都能在所有人都习惯的地方迅速找到他想要看到的内容

  • 所以,如果你的论文组织形式不太常规,审稿人可能根本就懒得看。

很多人是为了学到新东西才来审稿的。

  • 如果你把一些反直觉、有趣或很实用的结论摆在显眼的地方给他看,他可能会感到有收获。
  • 不要期望每个审稿人都愿意从你的大段文字和意义不明的图表中自己经过思考得到这些结论。

例子1:不要完整还原研究的心路历程 【重要!!!】
  • 我为了解决一个重要的已知问题(问题甲)提出了方案A(跟其他人的方法相比变化很大),发现方案A不够好,研究一下为什么方案A不够好呢,发现这是因为方案A引入了另一个问题(问题乙);
  • 我研究了一下如何解决问题乙,最终提出了改进版方案B(在A的基础上改动很小,加一个trick),所有问题都解决了。而且这个trick用在其他方法中也有提升。
  • 我提出了两个方案,还发现了一个别人没发现的问题,我觉得这篇文章很稳。

审稿人是以不同的视角来看这篇文章的,他并没有亲身经历我的研究过程,不可能像我一样清楚重点在哪里

他可能会问:

  • 如何证明方案A不好使的本质原因是问题乙?
  • 方案A也有一定效果,如何证明这是因为解决了问题甲?
  • 方案B相对于方案A只有很小的差别,怎么就这么点novelty
  • 你说B的改进用在其他方法上也有提升,那我为什么还需要A?A不也没比其他方法好到哪去吗?

我觉得很冤:

  • 这篇文章的最终结果明明是方案B,B是A的巧妙升级版,差别当然很小了,但是A也是我提出的呀!
  • 还有,为什么要纠结A和问题甲的关系,这很重要吗?

如果审稿人能听到我的抱怨,他会说:

你全篇都在鼓吹方案B,你没有强调A,我怎么知道它也是这篇文章主要内容的一部分

就算A是你提出的,它也没有解决你强调的问题乙啊,难道它也算主要贡献

既然A不算主要贡献,那你所强调的B可不就是只有很小的改动吗


辩经是没有意义的,我们只能在写作时注意避免引发这种无意义的争论。

如果我们稍微改变一下写作的方式,审稿人就更容易看懂了:
  • 提出了一个全新的方法来解决一个重要问题
  • 这个全新的方法包括一个全新的框架和一个通用的trick
分别证明二者的有效性:
  • 用这一框架而不用这个trick会导致效果相对变差;
  • 这是因为另一个有趣的问题(做一些分析);
  • 这个trick用在其他方法里,也可以有一定的提升
  • 二者结合,效果才是最好的。

为什么审稿人喜欢这样的组织形式呢?
  • 因为他一眼就看出你提出了什么东西,以及它们各自有什么作用
  • 他只需要判断你提出的东西技术上是否正确和效果是否显著就可以了。

 

例子2:不要轻言“based on”和“A+B”

“提出了基于AAA和BBB的XXX”是本科毕业论文里常用的说法,适用于需要稳妥安全而不怎么需要创新性的场合。

在顶会论文里这么写,可能会把本来还不错的创新性给写没了。

在大多数情况下,不要轻言自己的工作“based on”,你完全可以说:

  • 自己注意到了某个重要问题,琢磨明白了背后的原理,想到了一个解决方案,提出的是一种新的东西
  • 这种东西自然地用到了AAA和BBB,而不是简单地改了改人家的成果

设想一下,把ResNet的写作改成 “based on” 和“A+B”的形式,是不是就把创新性写没了?


《ResNet: Yet Another Simplified GoogLeNet》 :

  • 我们基于GoogLeNet和VGGNet设计了一种大量用3x3卷积(借鉴VGGNet)和并行shortcut(简化自GoogleNet)的模型超越了GoogLeNet和VGGNet。

为什么效果这么好呢?

  • 因为VGGNet和GoogLeNet珠玉在前,Batch Norm也很好用
  • 反正这个工作就是这么简单,我们没有想到理论上有什么创新性,但我们给后续的工作搭建了一个好的baseline

这样的文章能让读者学到多少东西呢?

ResNet实际上是怎么写的呢?

各位想必都知道当今有个重要的问题:模型越深,居然会越掉点。

  • 我们提出的解决方法惊人地简单:将模型中的映射形式从y=f(x)改成y=f(x)+x,也就是所提出的“残差学习”,就能解决这个问题。
  • 这是因为模型容易拟合f(x)=0,不容易学出f(x)=x。

残差学习非常容易实现,效果非常好。

提出问题——抽象出背后的原理——提出自己的解决方案和具体的实现——实验验证,这才是更符合人类认知规律的论文写法


有的同学觉得,一篇贡献没那么大的论文硬要写成这样是在“讲故事”

  • 但只要实事求是,只要实验证据能够支撑你的故事
  • 这样的故事既有利于审稿人给你打出高分,也有利于读者学到新知识
  • 更有利于你的观点的传播,属于是赢麻了。

 

三、总结和其他建议

上面说的第一件事其实也跟ResNet有关:

  • 真实历史上的ResNet来自于对GoogLeNet的拆解研究,并不是突然发现了“残差学习”的原理才有了ResNet,
  • 而是孙剑老师带领的团队先通过拆解GoogLeNet发现shortcut结构好用后思考出来的解释

我们上面设想的 “丐版” 写法虽然是反映了真实的研究过程的,却并不利于背后原理的深挖和核心思想的传播

这个实例正好能够支持本文的观点:研究怎么做和论文怎么写,是两码事。

  • 研究怎么做和论文怎么写,是两码事。
  • 研究怎么做和论文怎么写,是两码事。
  • 研究怎么做和论文怎么写,是两码事。

论文是传播知识的工具,是方便别人省时省力地学到新东西的标准化交流方式,不是个人展示个性的舞台。

  • 审稿人(读者)习惯于看什么样的论文,我们就写什么样的论文。
  • 这本质上跟流行歌曲和通俗小说是一样的,费尽心机来迎合受众而已,不寒碜。

没必要在文章结构上寻求创新。

大多数文章都可以写成的形式:

  • 1 Introduction
  • 2 Related Work
  • 3 Method
  • 4 Experiment
  • 5 Conclusion

如果你提出的不是单一创新点而是一揽子小改动的组合,可以学习 S h u f f l e N e t v 2 ShuffleNet v2 ShuffleNetv2 是怎样写的。


Be explicit

你不强调的东西,不要指望别人自己悟出来。

要在一个地方集中地完整描述你提出的东西,不要散落得到处都是

不要假设一个读者会有耐心看完50%的篇幅才理解你做了什么。


四、我的收获(本文作者H-T):

感谢 丁霄汉(https://www.zhihu.com/people/ding-xiao-yi-93) 老师

1 审稿人想要的是迅速搞明白你提出了什么

审稿人想要的是迅速搞明白你提出了什么新东西,而不是听你娓娓道来、抽丝剥茧,跟着你一起由浅入深地感受那四方求索、最终豁然开朗的成就感。

2 把一些反直觉、有趣或很实用的结论摆在显眼的地方给他看,审稿人可能会感到有收获

很多人是为了学到新东西才来审稿的。如果你把一些反直觉、有趣或很实用的结论摆在显眼的地方给他看,他可能会感到有收获。但不要期望每个审稿人都愿意从你的大段文字和意义不明的图表中自己经过思考得到这些结论。

3 不要完整还原研究的心路历程

审稿人是以不同的视角来看这篇文章的,他并没有亲身经历我的研究过程,不可能像你一样清楚重点在哪里

4 改变一下写作的方式,审稿人就更容易看懂

辩经是没有意义的,我们只能在写作时注意避免引发这种无意义的争论。如果我们稍微改变一下写作的方式,审稿人就更容易看懂了:

  • 我提出了一个全新的方法来解决一个重要问题
  • 这个全新的方法包括一个全新的框架和一个通用的trick
  • 分别证明二者的有效性:用这一框架而不用这个trick会导致效果相对变差;这是因为另一个有趣的问题(做一些分析);这个trick用在其他方法里,也可以有一定的提升;二者结合,效果才是最好的

5 不要轻言 “based on” 和 “A+B”

在顶会论文里这么写,可能会把本来还不错的创新性给写没了。

在大多数情况下,不要轻言自己的工作“based on”,你完全可以说:

  • 自己注意到了某个重要问题
  • 琢磨明白了背后的原理,想到了一个解决方案,提出的是一种新的东西
  • 这种东西自然地用到了AAA和BBB,而不是简单地改了改人家的成果

6 符合人类认知规律的论文写法

提出问题——抽象出背后的原理——提出自己的解决方案和具体的实现——实验验证,这才是更符合人类认知规律的论文写法。

7 研究怎么做和论文怎么写,是两码事。

论文是传播知识的工具,是方便别人省时省力地学到新东西的标准化交流方式,不是个人展示个性的舞台。

  • 审稿人**(读者)习惯于看什么样的论文,我们就写什么样的论文**。
  • 这本质上跟流行歌曲和通俗小说是一样的,费尽心机来迎合受众而已,不寒碜。

“丐版”写法虽然是反映了真实的研究过程的,却并不利于背后原理的深挖和核心思想的传播。

这个实例正好能够支持本文的观点:

  • 研究怎么做和论文怎么写,是两码事。

你可能感兴趣的:(程序人生,人工智能,职场和发展,学习方法,机器学习)