【SpamHunter】数据挖掘之基本概念——整理自书籍

  1. 输入数据->数据预处理->数据挖掘->后处理->信息
  2. 数据预处理:特征选择,维规约,规范化,选择数据子集。
  3. 后处理:模式过滤,可视化,模式表示。
  4. 数据挖掘挑战:可伸缩,高维性,异种数据和复杂数据,数据的所有权与分布,非传统分析(假设检验模式)。
  5. 数据挖掘=数据库技术+并行计算+分布式计算+统计学+AI+机器学习+模式识别。
  6. 数据挖掘任务:预测任务和描述任务。
  7. 预测建模:分类,用于离散目标。回归,用于连续目标。
  8. 关联分析:数据中强关联特征模式。蕴含规则或特征子集。
  9. 聚类分析:紧密相关的观测值组群。
  10. 异常检测:识别特征显著不同于其他数据的观测点。高检测率和低误报率。

你可能感兴趣的:(数据挖掘)