《数据挖掘导论》绪论

数据挖掘概念

        数据挖掘是在大型数据存储库中,自动的发现有用信息的过程, 是数据库中知识发现(KDD)的一部分。《数据挖掘导论》绪论_第1张图片

数据挖掘任务 

  • 预测建模: 训练一个模型,使目标变量预测值与实际值之间的误差达到最小。有两类预测建模任务:分类,用于预测离散的目标变量;回归,用于预测连续的目标变量。如,根据花的特征预测花的种类。
  • 关联分析:用来发现描述数据中强关联特征的模式。如,用来发现顾客经常同时购买的商品。
  • 聚类分析:旨在发现紧密相关的观测值组群,使得与属于不同簇的观测值相比,属于同一簇的观测值相互之间尽可能类似。如,新闻文章可以根据它们各自的主题分组。
  • 异常检测:识别其特征显著不同于其他数据的观测值,这样的观测值称为异常点离群点。如,信用卡欺诈检测。

你可能感兴趣的:(数据挖掘导论笔记,数据挖掘,python)