大数据数据信息化

  这个定义是给予“大数据”研究组织Gartner。 “大数据”是一种信息资产,需要新的处理模型才能拥有更大的决策,洞察力和流程优化能力,以适应大规模,高增长率和多样化。
  麦肯锡全球研究院给出的定义是一个足以捕获,存储,管理和分析传统数据库软件工具功能的数据集合。它具有较大的数据规模,快速的数据流和多样性四种数据类型和价值密度特征较低。
  大数据技术的战略意义不是掌握大量数据信息,而是将这些有意义的数据专业化。换句话说,如果大数据被比作一个行业,那么这个行业的盈利能力的关键是通过“处理”来提高数据的“处理能力”和数据的“增值”。
  从技术角度来看,大数据与云计算之间的关系与硬币的正面和背面密不可分。大数据不得由单台计算机处理,必须使用分布式架构。它为海量数据提供分布式数据挖掘。但它必须依靠云计算来实现分布式处理,分布式数据库和云存储以及虚拟化技术。
  随着云时代的到来,大数据引起了越来越多的关注。分析师团队认为,大数据通常用于描述公司创建的大量非结构化和半结构化数据,这些数据在下载到关系数据库进行分析时会花费太多时间和金钱。大数据分析通常与云计算相关联,因为实时大型数据集分析需要像MapReduce这样的框架将工作分配给数十,数百甚至数千台计算机。
  大数据需要特殊技术来有效处理随时间容忍的大量数据。大数据技术,包括大规模并行处理(MPP)数据库,数据挖掘,分布式文件系统,分布式数据库,云计算平台,Internet和可扩展存储系统。
  最小的基本单位是位,它按顺序给出所有单位:位,字节,KB,MB,GB,TB,PB,EB,ZB,YB,BB,NB,DB。泛站群

转载于:https://my.oschina.net/u/4126590/blog/3053788

你可能感兴趣的:(大数据,数据库)