数据挖掘与知识发现第一章答案

1、 什么是数据挖掘?什么是知识发现?简述KDD的主要过程

  1. 数据挖掘是从大量数据中通过算法搜索隐藏于其中的信息的过程
  2. 知识发现:指的是从大量的数据中提取有效的、新颖的、潜在的有用的,最终可悲理解的模式的非平凡的过程。
  3. KDD过程:数据整理,数据挖掘,结果的解释评估

         将从各个设备上收集到的数据根据要解决的问题进行整理,剔除无用数据,得到达到需要的目标数据,然后对目标数据进行预处理,处理掉空值以及一些不准确的数据。处理过后的数据再用于数据挖掘,之后再进行解释评价。

2、  简述数据挖掘涉及的数据类型以及这些数据的聚合形式

  1. 数据类型:非数值数据,离散数值数据和连续数值数据;结构化数据和非结构化数据,超文本数据,多媒体数据,空间数据

     2. 数据的聚合形式:构造数据立方体

3、 简述数据挖掘的相关领域以及主要的数据挖掘方法

  1. 相关领域:数据库,统计学,基于规则的系统,可视化技术,高性能计算,模糊集,知识表示,机器学习,粗糙集,模式识别,人工神经网络。
  2. 数据挖掘方法

                统计方法:

                        回归分析:多元回归,自回归

                        判别分析:贝叶斯判别,费歇尔判别,非参数判别

                        聚类分析:主成分分析,相关分析

               机器学习方法

                      归纳学习方法:决策树,规则归纳

                      基于范例学习

                      遗传算法

          神经网络方法
                  前向神经网络:BP算法等。
                  自组织神经网络:自组织特征映射、竞争学习等。
          数据库方法
                  多维数据分析
                  OLAP技术

          此外还有面向属性的归纳方法等

4、 如果面对学校数据库,你认为数据挖掘的目标是什么?

答:面对学校的数据库,可以挖掘出学生的学习情况,学习能力,以及老师的科研能力。例如:

  1. 通过对学生的四六级成绩的挖掘,可以判断出哪个系科英语水平更高
  2. 通过对各科老师发表的论文的挖掘,可以挖掘出老师的科研能力

你可能感兴趣的:(数据挖掘,机器学习,人工智能)