学习大数据HADOOP,不了解这些怎么行?

对于一些新手朋友来说,刚接触大数据不知从何学起,首先先了解下什么是大数据?大数据(big data,mega data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值密度)、Veracity(真实性)。

这里还是要推荐下小编的大数据学习群:532218147,不管你是小白还是大牛,小编我都欢迎,不定期分享干货,包括小编自己整理的一份2017最新的大数据资料和0基础入门教程,欢迎初学和进阶中的小伙伴。在不忙的时间我会给解答

简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。

大数据的5个“V”,或者说特点有五层面:

第一,数据体量巨大

从TB级别,跃升到PB级别。

第二,数据类型繁多

前文提到的网络日志、视频、图片、地理位置信息等等。

第三,价值密度低

以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。

第四,处理速度快

1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume,Variety,Value,Velocity。

物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。

下面附上一张大数据学习路线图,仅供大家参考!

你可能感兴趣的:(学习大数据HADOOP,不了解这些怎么行?)