2019独角兽企业重金招聘Python工程师标准>>>
—— 原文发布于本人的微信公众号“大数据与人工智能Lab”(BigdataAILab),欢迎关注。
一提到大数据的特性,很多人马上就会想到3V、4V,那么大数据究竟有多少个V呢?
在大数据的不断发展阶段,业界对大数据的特征认识也在逐步完善,涵盖范围也更加全面。
1、3V
2001年麦塔集团(META Group)分析师莱尼在一份报告中对大数据提出了“3D数据管理”的观点,即认为大数据将往高速、多样、海量3个方向发展,提出了3个特性:高速性(Velocity)、多样化(Variety)、规模化(Volume),统称3V。
3V特性是大数据最具代表性的特性,被麦肯锡、IBM、微软等多家公司所认可并不断在大数据报告中提及。IDC(International Data Corporation,国际数据公司)在给大数据下定义时便是引用了3V的特性:“大数据技术是新一代的技术与架构,它被设计用于在成本可承受的条件下,通过非常快速(velocity)的采集、发现和分析,从大体量(volumes)、多类别(variety)的数据中提取价值”。
2、4V
4V也是广受认可的大数据特性,在3V的基础上再加上了价值(Value)的维度,主要强调大数据的总体价值大,但价值密度低。
规模性(Volume)、多样性(Varity)、高速性(Velocity)和价值性(Value),合称“4V”。
另外,还有一种大数据观点是“4V+1O”,在4V的基础上再加上1个O,即数据在线(Online),强调数据永远在线,能随时调用和计算,这也是有别于传统数据的特性之一。
3、5V、6V、7V、8V
随着大数据技术的不断发展,数据的复杂程度愈来愈高,不断有人提出了大数据特征新的论断,在4V的基础上增加了准确性(Veracity),强调有意义的数据必须真实、准确;增加了动态性(Vitality),强调整个数据体系的动态性;增加了可视性(Visualization),强调数据的显性化展现;增加了合法性(Validity),强调数据采集和应用的合法性,特别是对于个人隐私数据的合理使用。
下图展现了3V到8V的特性图
欢迎关注本人的微信公众号“大数据与人工智能Lab”(BigdataAILab),获取更多资讯