数据挖掘期末知识复习2022/11/22

我们这一年三个题型——概念、简答、综合题。下面分别从这三个方面说一下考试重点。

目录

考试重点

复习重点

复习建议


考试重点

概念题:五个题,一个4分,主要就是考的名词概念,给大家划个重点:机器学习、网络爬虫、信息熵、数据挖掘、数据仓库的概念。

问答题:两个题,一个10分,主要重点是:聚类的优缺点和现实应用、时间序列挖掘的定义,DIANA的伪代码输入输出等。

综合题:六个题,一个10分, 主要重点是:十大经典算法,比如ID3,Apriori,EM,PageRank,K-means,KNN,DBscan这些,我们是考了Apriori的计算题,PageRank的伪代码,ID3的计算题。

以上是这一年的,而且是A卷的,计算机学院的同学们别只专注于我的这个重点,每一年的不一样,同学们还是应该复习好每一年老师划的重点。


复习重点

上面的重点是重中之重,这里不再赘述,只简单罗列。

  1. 大量的数据、强大的算力、实际需求
  2. 十大经典算法英文/中文,应用,伪代码,定义及优缺点
  3. 什么是时间序列以及时间序列挖掘的作用
  4. 混淆矩阵
  5. 分类,Apriori算法->close算法,这两个算法都要掌握
  6. 聚类,ID3,C4.5的计算题和伪代码
  7. 贝叶斯分类
  8. KNN算法的应用,伪代码,优缺点,定义
  9. EM算法的步骤
  10. 分裂和凝聚的伪代码和定义
  11. 聚类的定义及应用
  12. 基本的定义、英文

复习建议

以上是计算机学院数据挖掘大三的重点汇总,最后希望大家好好复习,多听老师的重点。

你可能感兴趣的:(数据挖掘课程,数据挖掘,人工智能)