大数据与数据挖掘考试题_《大数据时代下的数据挖掘》试题及答案 -

C.聚类分析 D.偏差分析

9) 以下各项均是针对数据仓库的不同说法,你认为正确的有(BCD )。

A.数据仓库就是数据库

B.数据仓库是一切商业智能系统的基础

C.数据仓库是面向业务的,支持联机事务处理(OLTP) D.数据仓库支持决策而非事务处理 10)联机分析处理包括( BCD )基本分析功能。

A.聚类 B.切片 C.转轴 D.切块

11)利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是( BD )

TID 1 2 3 4 5

A.啤酒、尿布 B.啤酒、面包 C.面包、尿布 D.啤酒、牛奶

12)下表是一个购物篮,假定支持度阈值为40%,其中( AD )是频繁闭项集。

ID 1 2 3 4 5

项集 面包、牛奶、尿布 面包、牛奶、尿布、啤酒 牛奶、尿布、鸡蛋 面包、尿布、啤酒、鸡蛋 啤酒、鸡蛋 面包、牛奶 面包、尿布、啤酒、鸡蛋 牛奶、尿布、啤酒、可乐 面包、牛奶、尿布、啤酒 面包、牛奶、尿布、可乐 项集 A.面包、牛奶、尿布 B.面包、啤酒 C.尿布、啤酒 D.啤酒、鸡蛋 13)Apriori算法的计算复杂度受( ABCD )影响。

A.支持度阀值 B.项数(维度) C.事务数 D.事务平均宽度 14)以下关于非频繁模式说法,正确的是( AD )

A.其支持度小于阈值 B.都是不让人感兴趣的 C.包含负模式和负相关模式 D.对异常数据项敏感 15)以下属于分类器评价或比较尺度的有: ( ACD )

A.预测准确度 B.召回率 C.模型描述的简洁度 D.计算复杂度 16)贝叶斯信念网络(BBN)有如下哪些特点。 (AB)

A.构造网络费时费力 B.对模型的过分问题非常鲁棒 C.贝叶斯网络不适合处理不完整的数据 D.网络结构确定后,添加变量相当麻烦 17)如下哪些不是最近邻分类器的特点。 (C)

A.它使用具体的训练实例进行预测,不必维护源自数据的模型 B.分类一个测试样例开销很大 C.最近邻分类器基于全局信息进行预测 D.可以生产任意形状的决策边界 18)以下属于聚类算法的是( AB )。 A.K-Means B.DBSCAN

C.Apriori D.KNN

19)( CD )都属于簇有效性的监督度量。

A.轮廓系数 B.共性分类相关系数

C.熵 D.F度量

20)( ABCD )这些数据特性都是对聚类分析具有很强影响的。 A.高维性 B.规模

C.稀疏性 D.噪声和离群点

21)在聚类分析当中,( AD )等技术可以处理任意形状的簇。 A.MIN(单链) B.MAX(全链)

C.组平均 D.Chameleon 22)( AB )都属于分裂的层次聚类算法。 A.二分K均值 B.MST

C.Chameleon D.组平均

23)数据挖掘的挖掘方法包括:( ABCD )

A.聚类分析 B.回归分析 C.神经网络

D.决策树算法

24)Web内容挖掘实现技术( ABCD )

A.文本总结 B.文本分类 C.文本聚类 D.关联规则

25)基于内容的推荐生成推荐的过程主要依靠( ACD )

A.内容分析器 B.推荐系统

C.文件学习器 D.过滤部件

26)云计算的服务方式有( ACD )

A.IaaS B.Raas C.PaaS D.SaaS 27)文本挖掘的工具有( BCD )

A.SPP Text Mining

B.IBM DB2 intelligent Miner C.SAS Text Miner D.SPSS Text Mining

28)推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、( D ),推测客户将来可能的购买行为。

A.客户的朋友

B.客户的个人信息

C.客户的兴趣爱好 D.客户过去的购买行为和购买记录 29)数据预处理方法主要有( ABCD)。

A.数据清洗 B.数据集成 C.数据变换 D.数据归约

30)与传统的分布式程序设计相比,Mapreduce封装了 ( ABCD )等细节,还提供了一个简单而强大的接口。

A.并行处理 B.容错处理 C.本地化计算 D.负载均衡

你可能感兴趣的:(大数据与数据挖掘考试题_《大数据时代下的数据挖掘》试题及答案 -)