浅谈大数据之Why

大数据

1.1 什么是大数据

1.1.1 大数据的5个V

大数据:顾名思义,就是拥有庞大体量的数据。业界将大数据的特点归纳为5个V。
1.Volume:指数据量大,数据量单位从TB,PB,EB,ZB,YB
2.Velocity:指数据生产速度快,数据要求的处理速度更快和时效性强,因为时间及时金钱,更快的数据处理速度可让我们基于最新的数据做出更加实时的决策。
3.Variety:指数据类型繁多。数据可以是数字,文字,图片,视频等不同形式数据源可能是社交网络,视频网站,可穿戴设备以及各类传感器。数据可能是Excel表格等高度结构化的数据也可以是图片,视频等非结构化数据。
4.Veracity:指数据真实性。一方面数据并非天然具有高价值,一些异常值会被参杂进来,例如,从不同源头爬取的数据,统计偏差,人的情感因素,天气因素,经济因素甚至谎报的数据等导致的异常值。另一方面数据源类型不同,如何将来自多样的数据源多元异构数据连接,匹配,清洗和转化,最终形成具有真实性的数据是一项非常有挑战性的工作。
5.Value:指数据价值。大数据已经推动了世界的方方面面的发展,从商业,科技到医疗教育,经济,人文等社会的各个领域,我们研究和利用大数据的最终目的是挖掘数据背后的深层次价值。

你可能感兴趣的:(大数据,大数据)