1.下列属于数据挖掘任务的是( )
A、根据性别划分公司的顾客
B、计算公司的总销售额
C、预测一对骰子的结果
D、利用历史记录预测公司的未来股价
正确答案: D
2.下述四种方法哪一种不是常见的分类方法( )
A、决策树
B、支持向量
C、K-Means
D、朴素贝叶斯分类
正确答案: C
3.将原始数据进行集成、变换、维度规约、数值规约是哪个步骤的任务( )
A、频繁模式挖掘
B、分类和预测
C、数据预处理
D、数据流挖掘
正确答案: C
4.KDD是( )
A、数据挖掘与知识发现
B、领域知识发现
C、文档知识发现
D、动态知识发现
正确答案: A
5.下列有关离群点的分析错误的是( )
A、一般情况下离群点会被当作噪声而丢弃
B、离群点即是噪声数据
C、在某些特殊应用中离群点有特殊的意义
D、信用卡在不常消费地区突然消费大量金额的现象属于离群点分析范畴
正确答案: B
6.从海量数据中提取有用的信息,所面临的困难有( )
A、数据量太大,无法使用传统的数据分析工具和技术处理它们
B、数据本身不是非传统数据,不能使用传统的数据处理方法进行处理
C、在某些情况下,面临的问题不能使用已有的数据分析技术来解决
D、数据量太大,没有足够的存储空间
正确答案: A
7.关于数据分析与数据挖掘的区别,正确的是( )
A、数据分析和数据挖掘处理的数据量都是海量的
B、数据分析与数据挖掘的目标都是明确的
C、数据分析的侧重点在于对未知的情况进行预测和估计
D、数据挖掘的侧重点在于对未知的情况进行预测和估计
正确答案: D
8.下列任务中,数据数据挖掘技术在商务智能方面应用的是( )
A、顾客分析
B、定向营销
C、商店分布
D、欺诈检测
正确答案: B
9.下列任务中,属于数据挖掘范畴的是( )
A、预测1位新的顾客是否会在一家百货公司消费100元以上
B、使用数据库管理系统查找个别的记录
C、通过因特网的搜索引擎查找特定的Web页面
D、根据性别划分公司的顾客
正确答案: A
10.关于数据分析与数据挖掘的联系,下列说法正确的是( )
A、数据分析的结果往往需要进一步的挖掘才能得到更加清晰的结果
B、数据挖掘发现知识的过程不需要对先验约束进行一定的调整而再次进行数据分析
C、数据分析可以将数据变成知识,而数据挖掘将知识变成信息
D、仅靠数据挖掘就可以从数据中发现知识
正确答案: A
11.采用适当的统计分析方法对收集到的数据进行分析、概括和总结,对数据进行恰当地描述,提取出有用的信息的过程是( )。
A、数据统计
B、数据分类
C、数据分析
D、数据挖掘
正确答案: C
12.下面哪一个不属于知识发现过程( )
A、数据预处理
B、数据挖掘
C、知识表示
D、数据计算
正确答案: D
13.指全局或局部范围内偏离一般水平的观测对象的是( )。
A、偏离点
B、差异点
C、离群点
D、不稳定点
正确答案: C
14.下图所示属于那种数据类型?( )
A、数据流数据
B、图和网状数据
C、数据仓库数据
D、数据矩阵
正确答案: B
15.关于数据库系统与数据仓库说法错误的是( )
A、数据仓库是为了解决数据处理方面的问题而建立起来的数据处理系统
B、通过数据仓库,可以在不同的维度合并数据,形成数据立方体,便于从不同的角度对数据进行分析和挖掘。
C、数据仓库更加注重便于用户创建、维护和使用
D、数据库系统汇集了来自多个不同数据源的数据
正确答案: A
1.数据分析与挖掘的数据类型有( )
A、数据库数据
B、数据仓库数据
C、树状数据
D、图和网状数据
正确答案: ABD
2.数据挖掘算法要解决的问题有( )
A、算法的可伸缩性
B、异种数据和复杂数据
C、数据的所有权与分布
D、非传统的分析
正确答案: ABCD
3.数据挖掘任务主要分为哪两类( )
A、计算任务
B、预测任务
C、描述任务
D、评价任务
正确答案: BC
4.数据仓库是一个什么样的数据集合,支持管理者决策过程( )。
A、面向主题的
B、集成的
C、面向对象的
D、非易失的
E、时变得
正确答案: ABDE
5.下列属于分类与回归的方法有( )
A、决策树
B、支持向量机
C、朴素贝叶斯分类
D、规则分类器
正确答案: ABCD
1.常见的机器学习方法有监督学习、无监督学习、和____。
正确答案:
第一空:
半监督学习
2.____是指在数据集中频繁出现的模式。
正确答案:
第一空:
频繁模式
3.____是指全局或局部范围内偏离一般水平的观测对象。
正确答案:
第一空:
离群点
4.____是通过建立模型预测离散的标签,而____则是通过建立连续值模型推断新的数据的某个数值型属性。
正确答案:
第一空:
分类
第二空:
回归
5.数据库是面向____的设计,数据仓库是面向____设计的。
正确答案:
第一空:
事务
第二空:
主题
6.通常,数据仓库用称做____的多维数据结构建模。
正确答案:
第一空:
数据立方体
7.数据挖掘功能用于指定数据挖掘任务发现的模式。一般而言,这些任务可以分为两类:____ 和 ____。
正确答案:
第一空:
描述性
第二空:
预测性
8.一种类似于流程图的树结构,其中每个结构代表在一个属性值上的测试,每个分支代表预测的一个结果,而树叶代表类或类分布的是____。
正确答案:
第一空:
决策树
9.数据仓库技术包括____、____ 和 ____。
正确答案:
第一空:
数据清理
第二空:
数据集成
第三空:
联机分析处理
10.OLAP操作的例子包括____和____。
正确答案:
第一空:
下钻
第二空:
上卷
11.通常,一个关联规则被认为是无趣的而被丢弃,如果它不能同时满足____和____。
正确答案:
第一空:
最小支持度阈值
第二空:
最小置信度阈值
12.一组类似于神经元的处理单元,单元之间加权连接的算法是____。
正确答案:
第一空:
神经网络
1.无监督学习可以在没有标记的数据集上进行学习。( )
正确答案:√
2.聚类就是把一些对象划分为多个组或者聚簇,从而使同组内对象间比较相似而不同组对象间差异较大。( )
正确答案:√
3.事务数据库的每个记录代表一个事务。( )
正确答案:√
4.数据仓库和数据库其实是相同的,都是数据或信息的存储系统。( )
正确答案:×
5.离群点因偏离一般水平而不需要考虑和研究。( )
正确答案:×
6.数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。( )
正确答案:√
7.数据仓库一般存储在线交易数据,数据库存储的一般是历史数据。( )
正确答案:×
8.数据库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。( )
正确答案:×
9.数据仓库就是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。( )
正确答案:√
10.数据仓库中间层OLAP服务器只能采用关系型OLAP。( )
正确答案:×
11.数据仓库系统的组成部分包括数据仓库,仓库管理,数据抽取,分析工具等四个部分。( )
正确答案:×
12.在应用工具上,数据挖掘一般要通过自己的编程来实现需要掌握编程语言;而数据分析更多的是借助现有的分析工具进行。( )
正确答案:√
13.数据挖掘和数据分析都是对数据进行分析、处理等操作进而得到有价值的知识。( )
正确答案:√
14.SQL、C++、Python、Matlab等是数据挖掘常用的编程语言。( )
正确答案:√
15.数据挖掘需要掌握一定的机器学习模型例如贝叶斯方法、决策树、监督学习模型。( )
正确答案:√
16.监督学习不具有对未知数据进行分类的能力。( )
正确答案:×
17.无监督学习的应用场景不包括关联规则的学习。( )
正确答案:×