跨入硕士研究生的学习感想

跨入硕士研究生的学习感想

. 基础课程

刚上研一以来,课程就挺多的。主要都是一些基础课程,比如数据库理论,计算机网络这些。很多都是在本科时期都学习过,而研究生时期,主要是对深度进行了扩展。唯一一门觉得新的就是数字图像处理的课程。数字图像处理主要是信号处理技术展开,从简单的空间滤波到频率滤波,老师十分注重数学公式的推演,于是内容上就比较少,大部分的东西需要自己下来去看,课上的东西讲解到傅立叶变换就结束了。而诸如小波变换这些东西,就需要靠自己去看了。我的感觉就是,这门课程不是一学期就可以学完的,内容实在太多了。本打算还自学机器视觉相关的内容,不过最后看到小波部分,就进入期末了。

研一的课程总体说来比较基础,很对都是要照顾本科时期非计算机专业的学生。但是,如果想学好,其实一学期选个3-4门,就已经很饱满了。而诸如我这种,除了学习理论知识外,还喜欢动手写一些实验性的项目来“学而实习之”,那么3门课程一学期,实在已经是忙死了。当然,我这里说的3-4门,主要是专业课程,而不包括英语和政治这些。

说到英语,因为我申请免修英语,也是就基本没有去上过英语阅读课,而只去上了老外开的英语听力课。总体上来说,都能够听得懂,不过还是自己动口的机会少了,希望在下学期的口语课程中能够好好锻炼一下口语。

 

二.专业方向

       我的研究方向是数据挖掘,而我早在本科做毕业设计的时候,就大概读过数据挖掘的教材,对于基础的数据挖掘知识也有一定的了解。开学以来,持续参加实验室的讨论班。所谓实验室的讨论班,其实就是由师兄门上去讲解一篇数据挖掘相关的论文。这学期的论文都来自VLDB,SIGMOD,ICDE这些比较顶级的数据库学术会议,于是基本上,能够听懂的也没几篇。刚开始的时候,通过预习,然后加上师兄的讲解以及老师的最后点评,还是能够了解大概的思想,到了后面,基本上就很模糊了。

      以前从来没有看过如此多的顶级学术论文,这学期讨论班每周一篇,算是开了眼界。VLDB,SIGMOD的论文,都能给于人一种赏心悦目的思维启发,而且解决的问题都还是实际有用的,绝非为了做学术而做学术。总体说来,能够从论文中学到的知识其实远不如课本上的精华和浓缩,但是最值得学习的地方是论文的思想。同时,看最前沿的学术会议论文,还能够了解到前沿的研究领域,对于自己要做论文的选题也是很重要的。

 

三.科研项目

      暑假还没进实验室的时候,就开始帮实验室的师兄在做一个研究领域相关的项目。到了开学的时候,基本也完成得差不多了。做这个项目,除了了解到实验室以前的主要研究内容,还可以为自己将来的简历增加一些内容,同时也还能够缓解一下生计问题,可谓是一举三得。到最后这个项目做出来后,大家觉得效果不错,就和实验室的另外一位老师合作投了一篇SIGMOD 2007Demo。我从来没有投过论文,没想到第一篇论文就是投的SIGMOD这样数据库最顶级的会议论文。

      后来利用空余时间,还把本科毕业设计的OpenMiner申请到了SourceForge全球最大的开源软件网站的空间,也对OpenMiner进行了大范围的改动,变得更加优美和协调。在师兄的建议下,我们把OpenMiner提到到第二届中国开源软件大赛去参赛,希望能够获得一个小奖就足够了。

      期间学院的一个老师还在实验室来想找人,去做一个地质局的国家级科研项目,不过我当时没有兴趣,也就没有去了。后来,实验室还和华西医学院一起申请到了国家卫生部的一个“十五”科研项目,也是一个国家级的科研项目,不过这主要是依托华西医学院的优势才申请到的。由于这个项目要持续2年,就只能找实验室硕一和博一的新生来做,于是就让我来做核心的系统架构了。做科研项目这种事情,往往都是一举三得的,我当然是不会推却的了。

 

四.兴趣爱好

      OpenMiner算是当时自己比较用心去打造的一个数据挖掘引擎。我自己是很想把这个东西发扬光大的,因为现在似乎还没有一个真正的独立,可扩展的,数据挖掘引擎。很多数据挖掘的软件,都是嵌入在数据库和统计软件之中,能够真正使用的,专注于数据挖掘的引擎,还没有看到过。

      草草写了份OpenMinerIntroduction,没想到第二天就能够申请成功全球最大的开源软件网站SourceForge的空间。通过SourceForge,可以向全世界展示我们的OpenMiner数据挖掘引擎了。不过后来由于时间太忙了,始终没有机会把这个作品代码提交上去。

      基于内容的图像搜索,Content-Based Image Retrieval也算是现在我比较感兴趣的东西。恰好这学期的数字图像课程的期末考试,就是自己选择一个图像处理的方向,然后做一个实验报告。我毫不犹豫地选择了“基于内容的图像搜索”。

      Image Retrieval是一个很古老的研究课题了,不过基于内容的,做起来实在是比较困难,我也不奢求能够一下子就做出超越所有前人的东西,只打算做一个将就能够用的Demo程序出来就OK了。数字图像的老师也晓得,这个领域是所有选题最困难的,于是给我们做报告的时间也是放在了最后。基于内容的图像搜索,其实最困难的地方是如何理解图片。而理解图片,也不仅仅是数字图像的课题,更多是机器视觉的内容,而机器视觉的难点,最终又回到一个人工智能的问题。如何表示“知识”,如果使用“知识”?这个问题没有解决,机器视觉的问题永远不可能得到妥善的解决 。

 

 

你可能感兴趣的:(数据库,数据挖掘,image,扩展,引擎,图像处理)