秋季论文写作课程总结

写在最前面
秋季论文写作课程顺利结束了,让我本来停留在本科毕业论文的认知前进了一步。俗话说,“知行合一”,论文写作就是“知”的第一步,下一步就是尝试“行”了。在本次的博客中,我将在课程中的感悟一一列举出来:

目录

    • 1. 研究是一项创造性的任务,而在计算机科学领域撰写技术论文则不是。
    • 2. 学习如何写论文的最好方法是阅读好论文。
    • 3. 好的论文阅读多少比较好
    • 4. 写论文的工具
    • 5. LaTex、CTex与TexStudio、TexLive有什么关系?
    • 6. 感悟集

1. 研究是一项创造性的任务,而在计算机科学领域撰写技术论文则不是。

Research is a creative task, while writing technical papers in computer science is not.

这里描述的是,在研究的时候,你在找创新点的时候可以尽可能的华丽,但是论文不行。因为论文的本质就是想让人读且读懂的,所以我们会发现论文的格式都是千篇一律的,这样就可以极大的方便读者找到自己想要的,方便读者快速的了解论文作者表达的意思。

2. 学习如何写论文的最好方法是阅读好论文。

The best way to learn how to write a paper is to read good papers.

万事开头难,如何写论文其实不是现在的拦路虎,找到自己的研究方向并且找到创新点才是。但是饭总是要一口一口的吃嘛,要学会站在巨人的肩膀上。对于好论文的定义,当然是顶刊顶会的,比如说:Science, Artificial Intelligence (AI), IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), the Association for the Advance of Artificial Intelligence (AAAI)。这里阅读还是应该带着目的,怀疑的眼光去看,不要光顾着给论文作者call 666 去了。

3. 好的论文阅读多少比较好

To get started, graduate students in good laboratories usually read more than 50 good papers, including some reviews.

前提条件是‘good laboratories’,这个还是要量力而行呀。在初期,阅读论文比较吃力,一个原因就是英语水平是不太够的,还有一个就是数学表达式的理解不到位。当然,不是好的论文都要阅读,和自己研究方向契合的才是最好的,在找论文的时候,首先要通过摘要来初筛论文,和方向契合度搞的论文就要精读,和方向契合度不那么高的论文就要粗略的读了。

4. 写论文的工具

作为计算机的编程人员来说,向来是不喜欢‘所见即所得’(What you say is what you get)的编辑器的,从他们对于Markdown编辑器的喜爱来说,确实是这样的。如果你不喜欢像word这种所见即所得的编辑器,就可以使用Latex。LaTex作为一款排版系统,格式控制、公式编辑方面比Word好用。LaTex生成的文档比Word文档更美观。但是LaTex的入门门槛比较高,使用LaTex不仅要编辑文本,整理文档格式,还要处理编译过程中出现的bugs,如果使用中文,更要注意GBK,UTF-8等文档编码这些琐碎问题。word更为重要的缺点是它可能出现版本不兼容出现的排版异常。

5. LaTex、CTex与TexStudio、TexLive有什么关系?

概念 解释 python Latex
编译器、解释器、引擎 负责处理输入代码并呈现输出结果的程序 python.exe pdflatex/xelatex/…
宏、软件包 用户、社区编写发布的实现特定功能的代码 Pytorch/matplotlib/… amsmath/xeCJK
编辑器、IDE 用来写代码的工具 Pycharm TeXstudio/winedit/…
发行版 编译器和配套软件的集合(安装包) Anaconda Tex Live/MikTex/CTex套装

总结一下就是,就像python一样,只需要Anaconda和Pycharm就可以开发了,Latex也是这样,Tex Live + Texstudio就可以开始写论文了。

6. 感悟集

按照之前的写法,我担心目录会爆炸。标题6 就作为感悟的集合吧,这里的感悟也会比较零碎,后续的感悟还会在上面添加。

  1. 每个期刊,会议都有自己的格式文件,其中这些包括一个标识论文格式的cls文件,以及指示参考书目格式的bst文件。
  2. 在相关领域的论文中从来没有出现的单词使用要慎重,如果使用,大概率会是错误的。
  3. ‘Novel’的使用要慎重,它表达的是突破性的进展。然而大多数时候,我们的工作只是在巨人的肩膀上上升了一小点,这个时候用‘new’会比较好。
  4. “Haven’t”, "Don’t"的用法是不正式的,如果要使用的话,“have not”, "don not"会更好。
  5. “and”的使用尤其要慎重,"and"连接两个句子,两个句子之间的关系就会变得模糊,无法表达具体的先后,目的,原因等具体关系。最为重要的是确保"and"连接的短语是严格的排比句式。
  6. 使用“address”而不是“solve”。“solve”表达的是解决,相当于这个问题已经结题了,不用再研究了。事实上,在机器学习中,很少有问题能够被“解决”。
  7. 在数学公式的书写中应该注意的问题,集合,数组,向量应该用粗体表示,比如说: A = { 1 , 2 , … , n } \mathbf{A} = \{1, 2, \dots, n\} A={1,2,,n}
  8. 在latex中,所有的等式都应该标号,换句话说就是在等式前面添加 \begin{equation}。
  9. 等式是句子的一部分,所以后面应该有一个逗号,一个分号,或者一个句号。当使用逗号时,下面的“where”应该以小写字母开头。
  10. 在latex编辑器中,每句话都要换行,这样也便于对每句的字数进行计算。
  11. 剽窃在论文写作中是最为严重的。大多数情况下,对于剽窃的定义是,从现有论文中抄袭句子,除非是常用句子或者使用双引号。
  12. 在论文写作中,简洁的句子是必要的,每句不应该超过十五个单词。一个原因是太长容易表达不清楚,还有一个就是越长就越容易犯错。
  13. 在同一个句子中,应该避免使用同一个单词,如果必要,可以使用同义词替代。
  14. 主谓宾这样结构的句子是最简单的。后面的表达更为推荐。
  • for the most sparse dataset MovieLens1, it has the most number of concepts.
  • the most sparse dataset MovieLens1 has the largest number of concepts.
  1. 在写论文的初期还是应该学习已有论文中的句型。创造句型是高级学者的工作,在前期就不要好高骛远了。
  2. 在阅读论文的时候,好习惯是记录下在论文中看到的好的句式,厚积而勃发。
  3. 标题是论文的眼睛,是一篇论文极为重要的部分。
  4. 标题应该是有吸引力的,是容易理解的,是容易被检索到的。
  5. 标题的长度应该控制在40到60个字符,太短的标题会被认为是突破新的进展,而且读者会认为不够新颖,这对于本来就是给读者阅读的初衷显然是不符合的。
  6. 使用“with”, "through"来指出你在算法中使用的技术,避免使用“base on”, 这个会被认为论文只是已有技术简单的拓展与应用。
  7. 对于论文摘要,摘要应该体现论文的核心问题和方法。
  8. 对于论文摘要,它通常包括三个部分:现有的工作(existing work),论文的工作(the work of the paper)和实验结果(experimental results)。
  9. 一些学者根据关键词搜索论文,关键词通常是被看作是摘要的补充。
  10. 关键字3到5个为最佳。
  11. 关键字应该按照字母表升序排列。
  12. 审稿人通常会决定在阅读引言后接受论文。如果介绍是很好,他会找到一些理由接受的。否则他会找到一些拒绝它的理由(方程、算法、结果、拼写错误等)。
  13. 读者,通常在阅读了引言后决定是否引用论文。因此,如果你把一些东西藏在论文的其余部分,就会很简单忽略了。
  14. 引言可以遵循与摘要一样的节奏。我们可以扩展每个句子在引言中,将摘要改为一段文字。
  15. 每段应该有5到10个句子,这样,这段话就有50到150个单词了,两个相邻的短段落可以合并。
  16. 在引言中,一种流行的方法是放一张算法图或者运行示例。
  17. 对于计算机科学的有些学生来说,论文中的推理部分比较难写,比较好的建议是仔细的阅读《离散数学》。
  18. 在论文的推理部分,理论应该是完备的
  19. 在论文的推理部分,符号应该是统一的。在论文的上下文,都应该有自己统一的符号表。
    Γ ( z ) = ∫ 0 ∞ t z − 1 e − t d t   . \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,. Γ(z)=0tz1etdt.
$$
\Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,.
$$
  1. 在算法部分,算法的输入和输出应该详细说明,
  2. 在算法的伪代码的主要部分需要添加相关注释。
  3. 算法伪代码部分应该控制在15到30行。注意重复解释的部分应该被删除。
  4. 算法的时间,空间复杂度分析是必须的,如果分析困难,可以通过试验数据表格的形式呈现出来。
  5. 论文的实验部分,在有些机器学习的论文中,它占据了几乎一半。
  6. 在更多的领域有更多的数据集的结果更有说服力。在多数情况下,十二到二十个数据集是足够的。
  7. 大型的数据集用在实验部分会更受欢迎。大型数据集是指一万个实例以上,一百个属性以上。

你可能感兴趣的:(论文写作,论文写作,latex,texLive)