数据分析与挖掘简介

       20世纪40年代第一台数字计算机出现到 90年代中期之前,信息化建设可归为以单机应用为主要特征的数字化阶段(可称为信息化 1.0),而第一次的信息化浪潮,始自 20世纪 80年代个人计算机的大规模普及应用。

       从90年代中期开始,以美国提出“信息高速公路”建设计划为重要标志,互联网开始了其大规模商用进程,带来了信息化建设的第二次浪潮,即以联网应用为主要特征的网络化阶段(可称为信息化 2.0)。

        当前,信息化建设的第三次浪潮扑面而来。过去20余年信息科技和信息化的井喷式发展,信息技术的不断低成本化与互联网及其延伸所带来的无处不在的信息技术应用,宽带移动泛在互联驱动的人机物广泛连接,云计算模式驱动的数据大规模汇聚,导致了数据类型的多样性和规模的指数增长,积累了规模巨大的多源异构数据资源,产生了“大数据现象”。以此为标志,信息化正在开启一个新的阶段,即以数据的深度挖掘与融合应用为主要特征的智慧化阶段(可称为信息化3.0)。

        信息化发展的三个阶段,数字化、网络化和智能化。数字化奠定基础,实现数据资源的获取和积累;网络化构造平台,促进数据资源的流通和汇聚;智能化展现能力,通过多源数据的融合分析呈现信息应用的类人智能,帮助人类更好认知事物和解决问题。

        由于数据往往是大规模、时变、高维和多属性的, 将信息论、数据挖掘、机器学习等手段引入科学数据分析中,辅助分析人员对复杂科学数据进行半自动的分析,是一种有前景的解决方案。

        数据挖掘就是从大量数据(文本)中挖掘出来隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。它利用各种分析工具在大量数据中寻找其规律和发现模型与数据之间的关系过程,是统计学、数据库技术和人工智能技术的结合。

1、数据分析与挖掘过程

数据挖掘的一般过程

2、数据分析与挖掘的算法

(1)数据挖掘算法:

数据挖掘算法概况
分析与预测各类详细算法

你可能感兴趣的:(数据分析与挖掘简介)