数据仓库与数据挖掘-绪论 个人笔记

声明:文中内容基于山东某高校数据挖掘课程的课件,本系列文章为课程内容的个人总结以及笔记内容。

数据挖掘

概念:数据挖掘是从大量的、有噪声的、不完全的模糊的和随机的数据中,提取出隐含在其中的、人们实现不知道的、具有前再利用价值的信息和知识的过程。

数据库中知识发现的过程(又称KDD)
输入数据→数据预处理→数据挖掘→后处理→信息

其中,数据与处理包括特征选择、维归纳、数据规范化、选择数据子集等。后处理包括模式过滤、可视化、模式表示等

数据挖掘的过程
定义问题→数据采集→数据与处理→数据建模→对模型进行评价→模型建立

数据挖掘所采用的算法
一部分是机器学习的理论和方法,如神经网络,决策树等。另一部分基于统计学习理论,如支持向量机、分类回归树和关联分析。
其中传统的机器学习和统计学往往不把海量数据作为处理对象。

数据挖掘的基本任务
1、分类预测
2、回归分析
3、聚类分析
4、关联规则
5、文本挖掘
6、离群点检测

你可能感兴趣的:(数据挖掘,神经网络,机器学习)