对于一个本科没怎么接触论文且英语水平很渣的学生来说,写论文的道路必定会走不少弯路和踩各种各样的坑,闵老师结合自己多年来写论文的经验和踩过的无数坑,总结出来了一套自己的论文写作技巧。这次课相当于闵老师把自己充满了无数血泪史的经验传授给我,让我们在论文的写作过程中少走弯路。
在这次课上我的一个重要体会就是:论文就是对自己研究工作的一个总结,论文的目的就是让业内同行了解你的工作,也可以让后人在此基础之上继续研究。所以论文应该清晰易懂、句子构造简单、直接明了在此基础上遵照一定的论文格式和论文技巧把整个研究工作表示清楚。
其中的论文格式和技巧就是闵老师总结的武功秘籍,通过这篇文章我在一定程度上总结一下闵老师的上课内容。一、作为自己课程的一个复习,二、以供以后翻阅。
目录
准备工作
寻找研究方向
阅读论文
通用格式
词和词组
符号和方程书写规则
句子写作注意
空格用法
引用句子-避免抄袭
编写简洁的句子
句子格式
Title
摘要
关键词
引言
相关工作
数学定理
伪代码
实验部分
数据集信息
问答
内部比较
外部比较
总结和未来的工作
其他部分
插图
表格
Bib文件
对待待审稿人的回复
写在最后
多听导师意见老师跟多讨论。
借鉴实验室师兄研究方向,站在巨人的肩膀上成长。
自己确定方向,在确定方向的过程中也需多听从导师的意见,以免陷入冷门方向或者容易来回换方向。
在写论文之前建议阅读至少50篇以上高质量论文,只有阅读大量的高质量的论文才能写出来高质量论文。
高质量论文常见会议AI、TPAMI、AAAI
不得的期刊和会议有不同的格式,可以下载相关会议期刊的论文,模仿相应的格式来快速开始自己的第一篇论文
在论文中注意一些常见词的应用,一些词不应该出现在论文中这部分词应该引起注意。下面列举一些常见的词的应用:
Novel应少用,用New较好
Have’t and don’t少用 “have not” and “do not”
and不用于句首,and只能用来连接不同的部分如data mining and machine learning而data mining and algorithm design不好
Only用法
Address vs solve一般用Address
related work比related works用得更多
避免特殊的控制符号
避免使用Winword编写方程而采用latex
变量用斜体,常量和运算符不用斜体用$确保格式的正确
集合、数组、向量必须加粗
每个方程必须要有编号
数学表达式过长时应该进行拆分
方程是句子的一部分,方程后面应该跟一个半角的逗号或者句号,使用句号时后面应该的句子用小写字母的单词不应该换一个段落
latex一行一句很容易统计句子中词的个数,如果要在两句之间加入空格则应该在%前插入空格。
句子是论文的基本元素,写句子的时候会有很多注意我们将从下面几个方面来总结写句子的注意方面。
空格的错误用法
1、句号,分号,逗号前面不应该有空格
2、相邻句子之间应该用空格分开
3、引文前后有空格
4、相邻的引用之间不应该有空格
1、加入饮用语句如 The rest of the paper is organized as follows.
2、加引号,不建议用这种方法
句子的编写对于英语比较差的同学来说,句子写复杂了很难确保句子的准确性,我们有如下几个方法来使自己的句子尽量简洁
1、每个句子15个单词内
2、简单句只包含一个动词
3、减少相同含义的句子从复
4、采取简单的主谓宾结构
句子的常见格式基本上来源于优秀的论文,有一个方法就是用谷歌翻译来回的翻译直到句子不在变化
1、标题要吸引力,需要需要指出新问题或者新的方法,问题要具有挑战性且有趣、方法应该有提高准确或者高效
2、标题应该易于理解,应该用经常出现的词语和短语,不要用有歧义的句子
3、多用业界流行单词和短语,易于搜索和引用,引用数量对论文非常重要
4、基于统计40-60个字符长度title的论文被录取的占比最大,标题太短可能是突破性的论文,对我们来说肯定是不可能了,另一方面读者可能认为新颖性不高
5、标题中避免使用based on读者认为你不够自信或者论文贡献不大
6、使用 “through,” “with” 来指明技术
7、当论文的主要贡献是一个新算法时,可以用一个缩写来为算法命名
摘要对一篇论文至关重要,读者是否会深度阅读一篇论文,摘要起决定性的作用。摘要必须直接指出论文解决的核心问题和方法,典型的结构分为三部分,现有工作、论文工作、实验结果。一般分为10句来写,接下来我们对这10句的格式和内容进行一个说明。
1、阐述问题及其重要性。这样可以确定问题的领域,解释主要概念或问题的重要性
2、现有工作,描述目前最新的方法和问题
3、指出现有问题的缺点,态度不要太强烈,有可能会是论文作者四审稿人。一般用However引出该句,表示转折
4、该篇论文的主要内容,最好和论文title呼应,并且在20个单词以内
5、算法的第一个阶段/技术/方面
6、算法的第二个阶段/技术/方面
7、算法的第三个阶段/技术/方面
8、实验相关东西,阐述实验数据的领域、来源、数量等
9、结果,阐述实验的结果包括精度的提升和运行效率的提高等
10、该论文打开的新领域,装逼必备语句
关键词主要是用来被搜索,同样也很重要。
1、关键词一般选取3-5个词
2、关键词不应该范围过大和过小
3、一般根据字母排序
引言部分主要是介绍论文的故事通常采用自然语言的方式叙述,可以和摘要相互呼应,引言的写作因注意一下几点
1、引言应该包含足够多的细节,审稿人通常阅读引言后决定是否接受论文。有可能不会详细的阅读后面的东西,所以有好的优秀的部分必须要放在引言部分突出出来,不应该放在后面。
2、可以和摘要一个节奏,将摘要的每一句分成一段,第一句是摘要的声明,其余为声明的证据或者详细说明。
3、一段一般5到10句,一共50-150个单词,过短的句子应该合并
4、一种流行的方法是展示算法图和运行示例,在“In this paper”后侧重对图表的解释,这种方式读者可以通过图快速掌握论文的主要思想和算法的主要优点
5、最后一段一般用The rest of the paper is organized as follows作为开头
有些论文会把该部分单独拿出来,有一些论文会在引言部分。这部分的写作应该注意如下方面
1、相关的引用应该分类,不应该简单的堆积。这样有两个好处,一,简单的堆积会让审稿人觉得作者没有参考文献的真实含义。二、分类有助于作者定位论文
2、句子如果去掉引用部分也应该是通顺的,引用不应该放到句首,这种情况下应该添加双引号
3、一个地方最多能出现三个引用
4、应该强调引用的优势和重要性,讨论缺点时应该用温和的词语
1、定理完整
2、符号因保持相同的形式
伪代码必须结构清晰,代码 简单,可读性好,并且类似自然语言。伪代码的写作应该有如下注意
1、明确的输入输出
2、展示主要的步骤
3、方法名可选
4、15-30行不必要的步骤应该删除
5、不要超过三个算法,应该一个主算法两个次要算法
6、应该分析时间和空间复杂度
对机器学习相关论文来说,实验部分可能占据了一半的篇幅
1、更多的领域更多的数据集实验结果越有说服力,一般12-20个数据集已经足够多了。但是在缺乏数据的场景下可以采用综合数据和样例数据来解决
2、首选较大数据集,最好超过1W数据量和100属性的数据
3、相同的数据集上更有说服力,且更加容易比较
4、应该得到现有算法的源码,或者实现现有算法。由于平台和数据采样的原因可能造成与参考文献的不同,为了对比应该采用新的
5、相同的结果不应该同时展示到图和表格中,应该选择合适的方法展示
实验的目的是为了回答一些问题。我们可以采取自问自答的方式,在实验结果之前提出一些问题
论文内部的算法的比较,如该算法不同的超参数、变体之间的比较
主要是和现有算法的一些比较
1、和经典、baseline、benchmark还有sota的一些算法的比较
2、常用柱状图比较
2、数据多时采用表格进行比较
1、一般用五句话总结,如果没有太多总结之前应该插入讨论部分
2、不要出现和摘要相同的句子,总结的句子结果性更强
3、进一步工作可以带来一些引用,论文引用比发表更重要
1、必须用矢量图,矢量图可以由Matlab、Visio 甚至 Excel 生成,用eps 或 pdf 格式存储
2、图的标题足够明确
3、尽量不要用彩图,用不同形状的图表示最好,如虚线、直线、带点的虚线等
4、引用图时,在句首应该用“Figure 1” ,其他地方用“Fig. 1” 或者“Figure 1” 都可以
1、表格宽度应该为12cm
2、数据过多时调整字体
3、注意应该用左对齐方式
4、±表示偏差
5、粗体和斜体风别表示最好和次好
6、数据集排序
7、数据大雨1000后每三位数用逗号分隔
写Bib文件最重要的是细心
论文名字注意等
审稿人的意见就像是帮助我们成长的游戏副本一样,里面有各种经验包。我们应该认真对待每一位审稿人的评论和意见。很少了一次就被录取的论文,论文总在不断的改才能改好的。
1、认真回答每一个问题
2、响应时间不应该太长
3、修改部分应该用蓝色突出
科研和写论文是一个持续的事情,有时会有低谷,在低谷阶段不要气馁。在做科研的路程中要多和导师、同行、同学交流。保持一颗积极向上的心态,最后愿大家都写出高质量论文。