研一上学期各门考试吐槽---师兄只能帮你到这里了

时间:2014年11月16日第十周周末研一上半年

考试科目:《数据挖掘》

考试形式:开卷

内容:4道大题,全英文。答卷也要全英文。

  • 第一道:chiMerge算法。用chiMerge对某个属性的不同值合并,坑爹啊,老师只是提了下,ppt上也没,书上(《数据挖掘 概念与技术原书第3版》第77页chiMerge方法)也没相关的例子,只有那么简短的介绍,咋整?平时没注意到,根本猜不到会考这算法。好吧,这道题是用来区分学霸与学渣的。区分高分和低分的。。。。其他题目只是为了让我们学生过而已,太简单了,只有这道题,不明白原理,丫的不知道怎么动手。提到卡方想到第三章,于是在书第三章的文献参考里找到chiMerge,对应的找到了77页,看得不是很明白,结果在试卷上乱扯了点。
  • 第二道:频繁项集apriori算法。跟中文版书上161的例子差不多,英文版的250-251页可破此题。另外数据集是用了苹果香蕉咖啡那个数据项的,以前见过,但给忘了。考试前就预测会考apriori了,肯定会考了,结果当然是真考了,因为本科上《数据挖掘》的时候也考了这道题。
  • 第三道:贝叶斯分类。本科时依然考过。同中文版书上229页的例子,英文版353页可破此题。数据的话,妈蛋,又是见过的,卧槽,考完一翻书,果然,是课后习题,只不过是求第三问,第一、二问不用。妈蛋,而且本科的时候这第八章的homework就是这道题:8.7,我说怎么数据集这么熟悉,算着算着是161就知道了,本科的时候还记得,谁叫这数据特么不漂亮,来个161。
  • 第四道:K-Means算法。又是预料之中的好么。不过没想到的是,数据集是做过的第三次实验的数据,好在在昨天把K-Means算法实现了,,,不过K-Means太简单了,都不想看了。自本科理解了后,没忘过好么,天空飘来五个字:这都不是事儿。另外的话,书上没有例子,不知道怎么写下去以及描述自己的想法。英渣表示很受伤。还是找几个例子看看,而且是英文的当然更好。
总的来说,问题不大,丫的根本不太可能会让你挂掉好么,而且像是数据挖掘肯定都会考三大块:分类、聚类、频繁项集。而这三大块关键算法分别是贝叶斯、K-Means、apriori,另外关键的是这三种算法在书上都有详细例子,根本不是问题的好么,所以说无论怎样都会考的好么,实际上本科与现在也都考了。另外,老师虽然在ppt上有很多张SLIQ、AdaBoost等算法的解析过程,考前在担忧着会不会考那些,因为那些算法都还没看懂,有些担忧。但实际上根本不会考好么,一大群人,几乎有一半人都没看懂,考了一大部分人不会做,,,所以说不可能考好么。好吧,《数据挖掘》这门课该做的实验做完了,只剩下project了。一些资料什么啥的,寒假回家再传到百度云上。。。


//-----------------------------------

待续。。。。。

你可能感兴趣的:(研一上学期各门考试吐槽---师兄只能帮你到这里了)