笔试

以下哪些分类方法可以较好地避免样本的不平衡问题(a)

A KNN

B SVM

C Bayes

D 神经网络

2. 什么是KDD?(a)

A 数据挖掘与知识发现

B 领域知识发现

C 文档知识发现

D 动态知识发现
解题思路:知识发现(KDD : Knowledge Discovery in Database )是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。


3. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签约数据与带其他标签的数据相分离?()

A 分类

B 聚类

C 关联分析

D 隐马尔可夫链

信管网参考答案:B聚类

4. 在有指导的数据挖掘中,有关测试集的说法错误的是(a)

A 测试集与训练集是独立同分布的

B 测试集是用以测试模型的数据集

C 通常测试集大约占总样本的三分之一

D K-次交叉验证中,测试集只有1个、训练集有K-1个

5. 假设12个销售价格记录组已经排序如下:5、10、11、13、15、35、50、55、72、92、204、215使用如下每种方法将它们划分成四个箱。等宽划分时(宽度为50),15又在哪个箱子里?(b)

A 第一个

B 第二个

C 第三个

D 第四个

6. 下面关于时间系列分析与回归分析的关系中,错误的是(D)

A 时间序列分析方法明确强调变量值顺序的重要性,而回归分析方法则不必如此
B 时间序列各观察值之间存在一定的依存关系,而回归分析一般要求每一变量各自独立

C 时间序列分析根据序列自身的变化规律来预测未来,而其它统计分析则根据某一变量与其它变量间的因果关系来预测该变量的未来

D 时间序列分析就是以时间变量为自变量、时间序列为因变量的回归分析

7. 在图集合中发现一组公共子结构,这样的任务称为(b)

A 频繁子集挖掘

B 频繁子图挖掘

C 频繁数据项挖掘

D 频繁模式挖掘

8. 以下哪些算法是分类算法(b)

A DBSCAN

B C4.5

C K-Mean

D EM

你可能感兴趣的:(学习心得,Or,测试Or笔试)