何为大数据

  • 百度百科定义:
    大数据(bigdata),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

  • 四大特征:
    大容量(Volume)
    多样化(Variety)
    变化快(Velocity)
    质量弱(Veracity)

大容量:
“大”是相对的,和当时的计算机处理能力相关。
80年代,百万条记录是大;
00年代,TB级别是大;
10年代,100T以上,甚至PB级别才算大。

多样化:
数据种类的多样化,如文字、语音、图片、视频;
数据来源的多样化,如来自网络、来自文件、来自库表。

变化快:
数据快速增长,如火车票的开票时的高峰抢票流量、双十一的高峰抢购流量。对系统入库速度,可达到100GB/S。

质量弱:
数据质量不高,杂质多,如不完整数据、不正确数据、不一致数据、不精确数据。

你可能感兴趣的:(大数据)