写在前面:本文主要介绍了学术论文的写作准则和方法,目标不仅仅在于阐述论文应该怎么写,更期望能够说明白为什么要这么写,明白“为什么”其实更重要。在我听过的看过的诸多有关写作的报告中,不乏有介绍论文写作的前期准备的,有介绍好论文的“评价标准”的,也有明确具体地指出论文中每个部分应该有什么和不应该有什么的。但是只有明白了“为什么”才能从根本上做到自主把握论文的质量,也只有明白了论文为什么要这样写,才能正确的开展研究工作。当然,笔者“研龄”不高,能力有限,只能尽量写出当前的一点感悟,日后有新的理解还将持续更新。本文当前的写作目的很多:第一,为了完成课程任务和报告任务;第二,这些“干货”是我师积累了十几年的精华,在平时的科研工作中跟我们反反复复传授过很多遍,希望我们真正记住,理解,并用起来。我记性不好,脑子又一根筋,整理消化一下,自己以后用着方便,也不辜负我师反反复复的教诲;第三,未来的某天,被屏幕前的你看到,假如对你有一点点的帮助或启发,也是好的。
论文写作指导思想:站在读者的角度写,符合大多数正常人的认知。
很显然,论文写作一个很重要的目的就是为了能够跨域时间和空间的距离进行学术交流。通俗的说,论文写出来就是让别人看的。看的人可能是大同行,也可能有小同行,有资深的科研人员,也有刚入门的小白,但好的论文,应该是不论谁看都能看懂的。因此,写作过程中,无论是需要抽象概括、层层递进、兴趣吸引等这些技巧,还是避免突然出现陌生名词和过早提及技术细节等的误区,只要把握这个指导思想,一般不会有太大偏差。
计算机领域,无论是哪个方向的学术论文,通常都需要包含以下几个部分:论文题目,摘要,引言(背景,动机,挑战,解决方案,实验结果),相关研究工作,问题定义,解决方案,实验,参考文献。下面我将逐一进行分析。
1. 论文题目
在看我的分析前,读者可自行思考几个问题:论文题目是干嘛用的?好的论文题目是怎样的?
论文题目是论文的极致概括,一篇论文从投出去、审稿、发表到后续读者在数据库中查询、阅读和引用,论文题目在很多时候都直接代表了这篇论文,决定了这篇论文会吸引什么样的读者。例如,reviewer在选择论文时一般只看题目,什么样的题目决定了你的论文会被什么样的reviewer评审,大同行还是小同行?题目起的宏观一些,被大同行评阅的可能性高一些,对论文的理解门槛就需要低一些,因此就要求写作上更加概括和提炼。
要吸引什么样的读者,取决于我们对论文的理解和定位,即研究工作在相关领域的定位。做到这点其实很难,需要作者在某个领域深入研究多年,对该领域有足够全面的把握,建立了完整的研究体系,明确知道当前的工作处在什么位置,弥补了学术研究的什么空缺。其实,这些要求不仅仅对确定题目很重要,在研究工作开展过程的每个环节都很需要。资深的科研人员通常能有较清楚的认识,对于“研龄”不大的研究者来说,需要进行综述,整理研究现状,明确当前研究工作的定位。由此,才能确定论文的核心内容,即清楚明白论文是在什么场景下做了什么事。
怎样能更好的吸引我们想要吸引的读者呢?题目的新颖性和创新性能使论文更具吸引力。题目的新颖性是要基于已有的和当前热门的研究工作而来,能反映研究领域当前被广泛关注的焦点;题目的创新性其实来自于论文的创新点,是论文的卖点,能反映当前研究工作的特色。
因此,好的论文题目应当能够准确反映当前工作的研究场景和研究问题,独特新颖,且反映创新之处。
2. 摘要
摘要是干嘛用的?摘要是帮助读者快速了解文章主要内容的。为了快速阅读,因此摘要篇幅不能太长,通常仅200词左右。如何在较短的篇幅内,让读者准确理解本文的研究工作,这是摘要写作所要考虑的问题。
所谓准确理解,有两层含义,一层是在内容上,摘要涵盖了论文的研究问题和贡献;另一层是在表达上,需要让读者能够读懂。这就好比作者是个厨子,论文的主要内容就好比各种食材和佐料,想要完成一道菜端到食客面前,还需要烹饪的过程。写作与烹饪,异曲同工,我们慢慢分析慢慢理解。作者与厨子,首要面临的问题便是“食材”的选取,即摘要应该选取哪些内容?俗话说,浓缩的都是精华。篇幅极短的摘要,应该全部选取文章最精华的东西。文章最精华的东西,莫过于是文章的创新点了,可以是某个思想上的开拓创新,也可以是算法性能的提升。除了创新点以外,研究问题在摘要中也是必不可少的。此外,为了说明本文创新点的价值,往往需要说明研究问题有多么需要被解决以及解决起来有多困难,这便是研究动机和研究挑战。因此,摘要中的“食材”应该包括研究问题,研究动机,研究挑战和创新点(理论和实验)。如何让读者能够读懂呢?要想让读者看懂,那必然是要符合普通人的逻辑认知水平的。也就是说,需要作者按照一定的逻辑顺序将这些内容呈现出来。具体的要求大致列出几点,逻辑尽量做到简单清楚,不要绕来绕去很复杂,尽量不要出现需要读者去查询才能理解的概念词,需要对各部分高度概括,至少达到大同行所能理解的程度等。
3. 引言
与摘要类似,引言也是对论文的概述,如果说摘要是对题目的扩充,引言在一定程度上可以算是对摘要的扩充。但引言的写作目的与摘要不同,更多的是为了引出本文对具体内容的阐述,需要说明研究工作的起因、发展与结果,因此引言中的概述更具系统性与完整性。我师曾说过,一篇好的引言就是一篇独立的作文,它独立完整地阐述了一件事情。完整的研究工作是要包括背景与研究问题、研究动机与研究目标、研究挑战、解决方案(创新点),实验与结果的。
3.1 背景与研究问题
引言写作中铺陈背景的目的是为了引出研究问题,要让读者从他熟悉的场景中去慢慢接受你的研究问题。
背景通常分为大背景和小背景。大背景即研究工作所在领域较为宽泛的背景,例如某模式挖掘研究的大背景可以追溯到大数据采集设备的出现及广泛应用。小背景通常是研究问题具体的应用背景和研究背景。
引言中背景的写作通常有两种方式:直接从小背景写起或由大背景逐渐过渡到小背景。这是论文中最终呈现的效果。但作为一名作者,思考的过程往往与表达的过程相反,需要从研究问题开始不断地倒推,即从研究问题倒推其应用背景与研究背景,并不断倒推至一个大家普遍意义上能够接受的背景中。
3.2 研究动机与研究目标
如前文所述,研究动机是为创新点服务的,通过说明本文的研究问题有多重要来为本文创新点的价值奠基。因此,要让读者明白这个问题是非常值得被研究的。
研究动机通常从两个层面进行分析:一个是应用层面,即该研究具有非常实际的应用价值;另一个是技术层面,即该研究在技术上存在一定的不足。应用层面很容易理解,例如指纹识别在支付、解锁等日常生活场景中具有广泛的应用。但具有应用价值的问题,不代表学术界应该对其关注并研究,也许对它的研究工作已经很成熟,也许现有技术还远远不足以支撑对它的研究等。可见,技术层面的研究动机应该基于当下的研究现状进行分析,选择有利于突显本文创新点的现状进行分析。具体来看,对已有的研究工作进行分类和总结,指出当前的不足之处,可以找某个或某些顶级的研究工作作为靶子凸显本文的创新等。要注意,在对当前研究工作进行评价时要采用更客观的表述,例如使用“不涉及”而不是“不考虑”。
另一方面,研究动机分析也是为了引出本文的研究目标。换句话说,研究目标是平衡了“理想的应用需要”与“现实的技术水平”之间的差距后设置的一个相对合适的目标,从而使研究问题在当前更具研究意义。
此外,在呈现形式和逻辑表达方面,研究动机可以围绕题目中的关键词展开分析,针对题目里与创新点相关的关键词,思考并回答“为什么”。例如,题为《路网环境下移动对象汇聚模式挖掘算法研究》的论文中,关键词显然为“路网环境”和“汇聚模式”,因此研究动机可以围绕“为什么研究汇聚模式?”和“为什么在路网环境下研究?”展开;再例如,题为《Distributed Streaming Set Similarity Join》的论文中,关键词为“Distributed”、“Streaming”和“SSJ”,因此研究动机主要回答“为什么研究SSJ?”、“为什么在分布式环境下研究?”和“为什么在流式环境下研究?”三个问题。
3.3 研究挑战
同样地,研究挑战也是在为创新点进行铺陈,即通过说明达到研究目标有多难来凸显创新点的价值。因此,要让读者明白达到本文的研究目标或实现研究问题的有效解决是非常困难的。
研究挑战同样可以从两个层面来分析:问题层面上,是否从来没有针对该问题的定义和解决方案;技术层面上,是否现有的技术达不到本文的研究目标。如果研究问题是个新的问题,那么对问题本身的形式化描述就可能存在挑战,而且通常是因为研究对象的属性难以被符号化描述。为了分析问题层面上的研究挑战,作者需要分析研究问题,明确其中的研究对象,分析并提炼研究对象的属性特征。从问题解决的角度来看,挑战主要来自于想要达到的理想效果与现有技术水平的差距。因此,为了分析技术层面的研究挑战,还需基于现有的相关工作,思考分析已有的方法用于本文的研究问题中达到研究目标时有何具体的不足之处。当然,多数情况下,不同研究工作中的研究问题不会完全相同,因此,要想准确发现现有方法的不足之处,还需将本文的研究问题与相关工作中的研究问题进行异同的比较。
由此来看,研究目标其实是研究动机,研究现状,研究挑战动态平衡下的产物,需要基于理想的应用需求和现实的技术水平进行分析而确立。
3.4 解决方案(创新点)
这一部分一方面是对研究挑战的回应,另一方面是对全文解决方案的提炼与总结。引言中的解决方案不是要详细的展现问题解决的过程,而应该突出重点,即其中的创新点,让读者体会到解决方案的合理性和创新性。
解决方案可以从三个层面进行分析:思路、子任务、技术实现。首先,概述本文问题解决的思路,让读者从宏观的角度把握其思想,因此要求文字表达上概括提炼出本质,例如对于读者来说,要理解移动对象簇则需要有相关知识背景,但簇的本质是一种划分,改用移动对象的划分则更通俗易懂。其次,阐述解决方案的子任务划分,同样从宏观的角度阐明各个子任务的目标。较为简单的做法是说明子任务的输入和输出,该方法放在“解决方案框架”中同样适用。此外,相当重要的是要阐明进行如此划分的原因,即合理性。通常有两种做法,一种是在给出子任务前对问题进行简单的剖析,将子任务作为解决问题的核心过程,自然地引出子任务;另一种是在子任务与子任务衔接时,阐明其之间的关联。最后,点出子任务中的技术创新,从实现的角度阐明本文采用的技术方法。
实验结果同样能证明解决方案的合理性和创新性,因此在该部分要概括说明本文的实验结果。注意要围绕着对之前挑战的应对来说,例如挑战中提到对效率的要求,则实验结果可以是“通过实验证明了本文算法的效率优于已有算法”。如果是个公开问题,且具有显著地效果提升,则一定要明确点出来,例如提高了多少个数量级和百分点。
对于引言的写作,仍然需要注意以下几点。第一,为了便于读者阅读,在关键性位置需要出现一些提示性的“主题句”使论文具有较好的可读性。第二,注意每个段落之间的逻辑关系,做到将每段的主题句单独拎出来组成一段文字,从逻辑上是通顺的。第三,每一段的段尾是对主题句的回应,同样也是对下一段的引入,具有承上启下的作用。
4. 相关研究工作
相关研究工作部分对本文研究问题相关研究现状进行介绍。相关研究工作写作的目的有两个,一方面是表明作者对当前研究工作的了解情况,让审稿人感受到本文是在全面充分地了解已有工作的基础上展开的,增加可靠性;另一方面是对引言中研究现状分析更为详细的介绍,是对引言中结论性阐述的支撑,辅助让读者感受到本文研究问题的研究价值。
相关研究工作通常有两种形式:阐述研究问题相关研究工作的历史发展情况,按照时间和方案改进的逻辑关系进行阐述;阐述与本文研究相似的工作,分类别进行介绍。
相关研究工作的位置可以放在引言之后问题定义之前,也可以放在实验之后。其不同之处在于,放在前面的相关研究工作一般是问题层面的相关研究,而放在后面的一般是方法层面的相关研究,其中部分方法需要在实验中进行比较后并在此进行总结。
相关研究工作的选取通常为最近三五年内的顶级工作,数量不能太少。
5. 问题定义
对问题进行形式化描述,让读者站在数据世界的角度清楚明白研究问题究竟是什么。
该部分重点说明问题的输入和输出。输入包括输入的数据、参数,以及输入的形式(数据库、流式、在线、增量等);输出包括输出的结果以及输出的形式。
问题的形式化定义中通常含有多个本文中提出的概念,也需要在该部分进行说明。从写作的角度来看,需要将问题定义涉及到的诸多概念按照一定的逻辑关系作出定义。通常有三种逻辑顺序,一种是从大概念到小概念,一种是从小概念到大概念,还有一种是对这些概念分类别给出,例如浙江大学高云君、陈璐等人在2019VLDB上发表的《Real-time Distributed Co-Movement Pattern Detection on Streaming Trajectories》中对概念分类定义。
还需要注意问题定义写作的规范性。问题定义是符号化的,在学术领域,某些符号已经具有一些特殊的含义。因此从避免歧义的角度来看,需要作者谨慎地查阅数学和计算机的参考书,规范各个概念的符号标记。
问题定义的符号化描述往往给人带来一种枯燥无味的抗拒感,为了增强其可读性,可以添加一些示例,搭配一些图示。从一致性和节省空间的角度来看,非常建议使用的示例能够贯穿全文。
6. 解决方案
对研究问题的解决方案进行详细的阐述。
解决方案主要包括四个部分:第一,是论证分析,即阐述为什么要这么做,为后续本文解决方案的详细步骤做铺垫,让读者能够自然地接受。通常包括目标、常规做法、挑战、代价和本文解决方案的重点思路。第二,是怎么做的,包括详细的步骤,并配合伪代码进行阐述。第三,举例。通过图文结合的示例对解决方案进行说明,更加形象生动。第四,是对相关性质定理及其证明的说明,作为解决方案的理论支持。
解决方案的写作切记直接阐述步骤,需要先从宏观层面阐述方案的思想,这是读者更容易接受的。
7. 实验
实验写作的目的,一方面是从实践的角度对本文的创新点进行验证,另一方面是要保证读者能够重现,这是实验部分的写作要把握的核心思想。
实验部分通常包括四部分,即环境配置、数据集、评价方法和实验结果分析。环境配置中说明实验平台和运行配置,越详细越好。公开的数据集最好注明URL,非公开数据集需要说明出处。有明确公共评价标准的研究问题在评价指标中只需表明评价指标即可,对于无公共标准的问题需要表明作者进行实验的严谨公正态度及其合理化的解释。通常包括三个部分:第一,阐明与本文工作进行比较的baseline是什么;第二,本文是采用哪些指标进行评估的;第三,为什么采用这些指标。在实验结果分析中,应当重点回应引言中的贡献点,突出贡献点的创新性和有效性。
实验分析中通常包括大量的绘图工作,可以使用Origin等绘图工具,需要保证放大后不失真,打印后能够看得清楚,图片格式统一,字体和符号大小适中,图标位置相同,图片中用纹理而非颜色进行不同部分的区分。
8. 参考文献
参考文献主要注意数量和格式两个方面。
数量上不同类型的论文要求不甚相同,会议论文限于篇幅,通常不需太多,但时间应当最新,论文级别应当最高;期刊论文参考文献应当尽可能详实,数量相对更多,涵盖范围相对更广。
格式上也需要根据不同会议或期刊出版社的要求来定,通常需要做到格式统一,字体大小适度,必要内容包括作者(前三)、文章标题、机构全称(或简称)、页码,目的是让读者能够自行检索到该论文。
在写作时,参考文献列表可通过dblp下载bib信息,在LaTeX中编辑生成。
最后,重申一下论文写作的指导思想,即站在读者的角度写,多多问自己读者看到此处会有什么疑惑。此外,一定要把握文章主推的核心内容,以此为主线,全文围绕着它展开。
愿每个写手都能拥有自己满意且他人欣赏的文字啊!
我是Jaling,喜欢就点赞评论关注吧 :)