总结一下做文章的方法

 

   作为一个PhD学生来说,写文章的技巧自然是自己的看家本领。总体说来,想写出好的文章,必然是要多读,多写。首先谈谈关于论文阅读的选择。从我们CS的 学生来说,最好直接就从最顶级的学术会议,诸如ACM和IEEE的会议论文开始看起。会议论文相对期刊文章来说要简短一些,不至于花太长的时间。一个 master学生刚开始看这些文章,肯定会遇到不懂的地方。不过在现在这个互联网发达的时代,学会用Google没有查不到的东西。当然,这里说的 master学生必然是已经具备了教科书上的基础知识。 所以,读懂一篇顶级会议的文章,对于一个新手有着很大的提高。至少它能不断巩固以前的基础知识。 读懂一篇文章的motivation和solution是最重要的。以前有些师兄建议每读一篇文章,都写读书笔记,那么motivation和 solution应该就是最重要的部分。此外,对于想进入一个研究领域的新手来说,读一下Related works,看看顶尖的高手对于诸多前人工作总结也是一个快速的查找相关文献的方向。对于一个master学生来说,english往往都不是什么大的问 题,主要的词汇问题应该都是专业名词的解析。幸好,现在wiki已经可以查了,那么wiki应该可以说是查这些专业词汇最好的去处。

    至于说写文章,就没有固定的模式。以前在MSRA的时候听沈院长说过三种学者的区分。“第一流的就是提问题的人,第二流的就是解决问题的人,至于第三流的 就是改善前人解决方法的人。”新手肯定是从第三流开始做,那么无非就是见缝插针的方法。也就是说,大量阅读最新的论文,看看别人的方法有什么地方值得改进 的,哪怕改进的思想是前人早就提出的,无非就是新瓶装旧酒的方法。为什么要最新的论文,因为最新的论文上提出的问题被研究得相对少一些,而经典的问题就可 能已经被前人研究过无数回次了,你能想到的,别人多半早就想过了。举例来说,如果做空间索引,R-TREE之类的,在上个世纪80年代就已经很多文章了, 如果现在你要做一篇,你得证明你比以前所有的方法都好,光是写各种R-TREE的变形就足够累死人了。另外,论文的框架也很重要。初学者可以直接拿一篇相 关的,ACM,IEEE顶级的会议论文做模仿。比如第一节Introduction怎么写Motivation,Challenge, Contribution,然后第二节如何写Related Works。。。其实论文的框架是很死的,灵活的地方在于阐述的思想。最后是关于如何写实验的部分。以我们数据库,数据挖掘来举例,实验部分是相当重要 的。一般12页的文章,起码有3-4页都是阐述实验部分。很多国内做文章的学者关注于算法,理论,却不能很好写code,这是很不好的。如果只是测试算法 的有效性,我建议最好大家都用matlab。甚至可以说,matlab应该是每个计算机研究生必掌握的一门工具。大家可以不会写C/C++,也可以不会写 Java,但是不能不会写matlab。以前似乎有个网站专门统计过什么语言的程序员薪水最高。虽然大家都觉得写C/C++的最牛,但结果是写 matlab的。因为写matlab的往往是两种人,一种是scientist,一种是金融分析员。毋庸置疑,这两个级别的人物薪水远比一般做 software engineering的要高出很多。在国内,大部分人都用Microsoft Office,所以大家喜欢使用excel来做图。不过我还是建议大家都用matlab做图,更好一些。matlab可以说是集成了数据存储,程序算法, 作图的三合一的开发工具。当然,对于一些做performance的test,以及系统testing的文章来说,用C/C++开发一个原型系统是必须 的,这个自然就不能使用matlab来模拟了。

   以学者写文章的境界来说,大概是这样的。初学者写出来的论文就好比BBS上的帖子,没有像样的招式。然后需要花很多时间去学习如何形式化地描述一个思想。 简单来说,就是用数学语言去阐述一个道理,而且要严谨。当他能够运用自如写数学语言之后,就是,剩下的就是如何美化文章。比如说,如何巧妙地写 motivation, example,和作图。有很多三维空间图,如果不用matlab,是很难手工绘画出来的。当文章能够以严谨的数学语言阐述道理之后,又能参入各种生动的 motivation, example,直观图表,这个时候的文章要中一般的三流国际会议是没有问题的了,也足够让国内的博士们在1-2年之内毕业了。如果这个学者继续修炼,就 是将“花哨”的文章回归“淳朴”。也就是说,以很淳朴的语言,没有炫目的图表,example来阐述一个道理。但是,文章的idea,solution都 是如此地perfect,以至于仅仅文字,数学公式就能打开读者大脑里面的图表。并且,这些文字和公式,能够激发读者针对此类问题更多,更高一层的思考。 读者能够在字里行间里面感受到他深厚的学术功底,即使成语“厚积薄发”的意思。当学者达到这个境界了,我想离美国的大学博士毕业标准已经不远了。

你可能感兴趣的:(算法,数据挖掘,matlab,语言,performance,开发工具)