记-数据挖掘-数据挖掘概述认识

数据挖掘概述

数据挖掘概念

随着爆炸性的数据增长,我们拥有丰富大量的数据,但却不足以提供有用的信息。我们亟需一些工具帮助我们从海量数据中提取有用的信息。

数据挖掘就是从数据中发现有用信息,从而帮助我们决策的数据工具。

以上关键词:数据、有价值的信息、帮助决策

  1. 数据:往往是大量的、不完全的、有噪声的、模糊的、随机的等等
  2. 价值信息:隐藏在数据中,人们事先不知道,但又有潜在价值的信息和知识
  3. 帮助决策:从技术角度帮助人们决策,需要用到统计学、机器学习、人工智能等科学的技术和知识。

数据挖掘目标

预测数据 描述数据
监督学习 非监督学习
从标记的训练数据发现规律来推断预测 依据未标签化的训练样本进行模式识别
回归、分类 聚类、关联规则

详细划分

回归 分类 聚类 关联规则
样本映射到一个真实预测值 样本划分到几个预定义类的一个 样本划分为无预定义类的不同类 发现数据集中不同特征的相关性
算法应用 算法应用 算法应用 算法应用
Lasso回归 K-近邻 K-mean聚类 Apriori算法
弹性网络 逻辑回归 分层聚类 ...
支持向量回归 决策树 ... ...

数据挖掘及其他名词

数据分析

数据分析是一个比较大的概念,应该包括:数据统计、OLAP、数据挖掘等等

人工智能

人工智能应该目前所有名词的汇总。强调用计算机来实现人类智能。应该包括:数据挖掘、机器学习、深度学习等等。

机器学习

机器学习显然属于人工智能的一个分支,但却是人工智能的核心,也是数据挖掘实际应用的理论基础。

深度学习

深度学习作为机器学习的一部分,强调人工神经网络的算法。

参考图片

图片 1.png

小结

我们已经了解到数据挖掘及其相关知识,未来将围绕数据挖掘逐步介绍其算法应用,并且结合数据分析方法和可视化给予更生动的认识。

你可能感兴趣的:(记-数据挖掘-数据挖掘概述认识)