本科毕业论文是用word写的,基本都是把一个样本论文拿来,格式不变,内容修改成自己的,遇到格式问题要修改很久。上了这门课之后,才发现用Latex写论文十分方便,也不用花太多精力在格式问题上。同时,每种期刊都会提供一个或多个格式文件, Latex 源文件只需要进行少量改变,,就可以获得完全不同的版面。比如cls文件:控制论文的总体格式。bst文件:用于控制参考文献的格式。
在上门课之前,对与论文写作只是停留在本科毕业论文写作的层面上,如何写学术论文基本不了解。在这门课中,通过 what, why, how, when, where五个方面,了解了学术论文是什么,怎么写以及一些小技巧。在我看来,学术论文按照八股文的方式写,也就是每个部分内容有固有的要求。对于写论文的人而言,论文不需要文采, 只需要正确的内容放在正确的位置。对于读者而言,固定的格式能够方便找到自己需要的内容。
通过这门课对于研究生写论文的时间也有了清晰的认识,能尽量早点写就早点写,最好在研一写作完成,并且要高质量完成不能强行灌水。因为从投稿到出版可能要花费一年的时间,研二写完投稿一旦被拒,就可能要延毕。
阅读论文要看一些顶刊顶会的论文或者是近几年的高被引论文,因为计算机技术更新换代很快。在读的时候,可以摘抄一些常用的词句,后面写论文时可能用得上。在阅读时,也可以通过论文复现的方法,快速掌握论文的主要内容。
通过这门课的学习,了解到写论文时也要注意词语的使用,比如未出现在任何学术论文中的单词,不可以使用。然后,通过闵帆老师的讲解,了解了一些词的用法,比如Only这个词,在写作时把 only 放到一个尽可能靠后的位置。同时,也了解到如果有两个相似的词汇,使用时出现纠结,我们可以通过查询 这两个词在 https://www.linggle.com 上的使用频率,选择使用频率高的词汇。
空格的错误比较常见,也比较容易犯,闵老师在课堂上总结了几种常见的情况,比如标点符号前(后)多(少)空格,小括号前没空格,参考文献引用的方括号前面没有空格等。还有就是数学符号,要保证在同一篇论文中的一致性,同一个符号的不同写法代表不同的意思,比如 x , x , x x, \mathbf x, \bm x x,x,x代表不同的意思。数学符号直接在Latex中写,在word公式编辑器写再粘贴到Latex中,会出现很多额外控制,导致不规范。
句子的完整和易读也是很重要的一点,写论文跟写英语作文的思路完全不一样,英语作文的高分是要求复杂的语句和不常用的单词等,但学术论文恰好相反。因为学术论文的主要功能是进行读者与作者之间的交流, 句子太长以及太复杂反而会影响读者的阅读。 在写论文时,句子也要注意格式和语法。尽量避免写长句,避免阅读的不便和出现歧义。同时,要注意不完整的句子以及中式翻译,比如缺少主语。还有就是同一词组要避免在同一句子中重复出现。避免这些语法错误的方式主要是将写好的句子,放到翻译软件上进行检查。
论文中的符号和数学表达式主要有以下注意事项:
解决这一些问题,闵帆老师提出了一个很好的方法,就是找一篇已经发表的论文的 .tex 文件来学习数学表达式。
表格的控制主要有以下的方法:
如果表格内容不多, 可以用如下语句控制宽度。
\begin{tabular*}{12cm}{@{\extraclosep{\fill}}lll}
如果数据太多装不下,也可以用如下语句控制宽度,但表格中字体会自动缩小。
\resizebox{12cm}{!}{}
这个主要是解决我们英语句子写的不好,闵帆老师主要提出了借鉴法和倒腾法两种方法。借鉴法需要积累很多的句式,是一个漫长的积累过程,但是随着阅读的文献阅读,积累的越多,越写越顺手,查阅句式的速度也会变快。倒腾法写一个表达自己意思的英文句子,用谷歌翻译在中文和英文之间多次翻译,直到中文句子和英文句子都不再改变 。优点是完全按照自己的本意来写。缺点是来回倒腾花费的时间长,效果可能还不怎么好。
写论文的时候要换位思考: 如果我是审稿人或读者, 我会怎么批评这篇论文? 闵帆老师强烈建议写完论文之后不要急着投, 在手里放一周,然后给自己写一个尽可能详细的审稿意见。拒稿原因也给出了一下5个方面的内容:
会议论文均有篇幅要求,一般比期刊论文篇幅要短。会议论文没有没有章节组织描述、相关工作描述比较少、实验比较少、不讨论 future work和参考文献较少。会议论文一定是针对某个学术会议投稿,并且由学术会议的会务组决定是否录用;期刊论文肯定是针对某学术期刊投稿,而且是期刊编辑部决定是否录用,而不是审稿专家,审稿专家只是审稿并返回意见,真正决定录用权在期刊编辑上。
审稿人看摘要,就能把你的文字水平、逻辑能力摸得清清楚楚的。摘要通常会出现大量的问题,由于文字性的问题在正文中也会同时出现,闵帆老师主要罗列了以下几种问题。
闵帆老师建议的是先采用自底向上的方式堆材料, 有了初稿再采用自顶向下的方式把控全局。
闵帆老师也进行了总结,主要为以下几种问题:
论文的题目也是一个关键点,换个角度思考,假如是你,看到一个普普通通、平平无奇的题目,估计自己也很难想看下去吧,这里闵帆老师总结出的出彩的论文题目的注意事项非常精炼:
从中文的角度, "摘要"就是把论文重要的内容摘录出来;从英文的角度,Abstract 就是把重要的内容抽取出来。它通常包括三个部分: 已有工作的评述,本文工作的描述,实验结果。
闵帆老师总结可以通过以下几个方面来写摘要:
(1)问题及其重要性,可以说明问题所属的领域,解释最重要的概念,或者强调问题的重要性。
(2)已有工作,可以描述该问题的流行解决方案。
(3)已有工作局限性,以 However 开头, 需要注意指责不要太强烈, 要尊重别人的劳动;本句干的事情是挖坑, 要保证自己的方法能把坑填上;实在不行也可以不写本句,但这样显得没有底气。
(4)本文工作,以 In this paper 开始,是题目的扩展,可以出现算法的缩写。
(5)本文方法的第 1 个技术/步骤/方面/优势/贡献。
(6)本文方法的第 2 个技术/步骤/方面/优势/贡献。
(7)本文方法的第 3 个技术/步骤/方面/优势/贡献,如果不能扯出 3 个方面, 论文的工作量就显得不够。
(8)实验设置,给出数据的领域、来源、数量。
(9)实验结果,提高了准确性、效率等等。
(10)提升,吹嘘一下论文的意义: 为该领域打开一扇门之类。
关键词常被看作摘要的一种补充;一般需要 3-5 个关键词;关键词一般由 1-3 个单词构成;将关键词按照字母表排序。
"引言"的本意是为论文作一些铺垫,然而,在计算机英文论文中,Introduction 需要讲述完整的故事。近年来,一些好的中文杂志也逐渐采用了这个风格。
计算机领域 (特别是顶会) 流行在引言里面放 “开局一张图”。这里闵帆老师着重介绍了开局一张图的重要性。画好了,读者仅仅通过该图就迅速理解论文,节省时间。但是如果画的不好,不如不画。
如果采用这种风格,在In this paper 之后就应该围绕该图进行解释。“一幅图胜过千言万语”,该图可以帮助读者花最少的时间理解论文的主要内容。 该图可以展现核心技术、算法框架、小的运行实例、效果对比等等。
以年份为主线的综述也不值得提倡,主要是计算机技术更新的太快,每一年可能有许多相关的论文发表出来。这里闵帆老师提了一个例子,对年份引用与序号引用进行了对比。
对于计算机专业的学生而言,数学语言的运用通常有一定困难。这是因为很多人在学习数学的时候,只是想办法应付考试,而没有思考内在的涵义。
闵帆老师总结的一般性的准则如下:
需要特别注意第三条准则,在写结论和理论时,需要特别的注意。
算法伪代码是论文的核心之一,在使用Latex书写时,也需要注意格式问题。
数据集信息关系实验的成败与否,一个实验如果数据集不好或者太少,那么实验结果的鲁棒性可能较弱。闵帆老师总结了以下关于数据集方面的信息:
(1)数据集越多,覆盖领域越广,结果就越可信。数据集大些更好。在多数情况下, 12 至 20 个公开数据集就足够了. 然而, 对于一些领域和问题而言, 数据集却非常珍贵. 可以使用人造数据集, 或者数据集随机采样成多个, 来缓解该问题.
(2)获取自己主要参考文献中的数据,有利于进行比较。
(3)要么获得对比算法的源码,要么实现它们。由于使用平台不同, 数据采样不同, 有时候你重现别人的实验, 会发现结果不大一致. 如果没有特别的原因, 就使用自己实现的版本.
(4)同一结果不应该在图和表中同时出现,这样就重复了。
内部比较的动机包括:
(1)展示参数变化所导致的性能变化。二维图一次只能展示一个参数和一个性能指标。因此,如果有很多参数,就只能讨论最重要的几个,否则图太多。
(2)展示主要方案与其变种相比的优势。有时候我们有好几种可选方案,通过比较,可以获得最佳那个。
外部比较也就是与已有算法进行对比。
实验结论是对实验的总结以及未来可以改进的方向,读者和审稿人都会详细看。
参考文献中的错误有很多,在上课时,注意到以下几条可能是写论文时常犯的错误:
(1)将等号进行列对齐。这和我们写程序一样,需要良好的习惯: 保证格式正确. 否则会隐藏一些错误。
(2)名字要有意义。必须保证不同的参考文献具有不同的名字。
(3)作者名不要缩写成 “F Min” 或 “Fan Min”。Latex 自己会进行必要的转换。
(4)页码之间应使用两个连词符 -,最终的效果就是一条比较长的横线。
(5)除最后一行外,其它行应以逗号结束。
(6)为了保证格式的正确性,应检查生成的 pdf 文件。
闵帆老师总结:一幅图胜过千言万语。将一幅图解释清楚,这样读者和审稿人阅读时,方便易懂,不必再通篇阅读,节省时间。
有时候,写完第一篇论文后,不知道第二篇论文怎么写。闵帆老师总结了三个角度来解决问题:问题的角度、算法的角度和应用的角度,每个角度都根据第一篇论文的内容或者学过的内容进行拓展。思路不够宽广,最大的可能是读的文献太少。因此应该在第一篇论文的基础上进行探索,写个文献综述(不求发表,只求把思路捋清楚),就有可能从 1 篇论文发展到 N 篇。
在上完闵帆老师的论文写作课后,感觉自己在这堂课上收获颇多,从学术论文的定义,到写计算机学术论文的方法以及注意事项,再到写作流程以及写论文工具等都有一定程度的了解,感谢闵帆老师的耐心讲解。