大数据、云计算、Hadoop浅淡

大数据是什么、Hadoop是什么,云计算又是什么?

大数据不再仅用来描述大量的数据,还涵盖了处理数据的速度。

目前定义:大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具在合理时间内获取、管理、处理、并整理为帮助企业经营决策。

 

大数据目前分为四大块:大数据技术、大数据工程、大数据科学和大数据应用

 

其中云计算是属于大数据技术的范畴,是一种通过Internet以服务的方式提供动态可伸缩的虚拟化的资源的计算模式。它利用由大量计算节点构成的可动态调整的虚拟化计算资源,通过并行化和分布式计算技术,实现业务质量的可控的大数据处理的计算技术。

那么这种计算模式如何实现呢,Hadoop的来临解决了这个问题。作为云计算技术中的佼佼者,Hadoop以其低成本和高效率的特性赢得了市场的认可。

 

Hadoop是Apache的一个开源项目,它是一个对大量数据进行分布式处理的软件架构,在这个架构下组织的成员HDFS(Hadoop分布式文件系统),MapReduce、 Hbase 、Zookeeper(一个针对大型分布式系统的可靠协调系统),hive(基于Hadoop的一个数据仓库工具)等。

 

简单理解,Hadoop是一个开源的大数据分析软件,或者说编程模式。它是通过分布式的方式处理大数据的,因为开源的原因现在很多的企业或多或少的在运用hadoop的技术来解决一些大数据的问题,在数据仓库方面hadoop是非常强大的。但在数据集市以及实时的分析展现层面,hadoop也有着明显的不足。

 

所以,笔者认为:

    1.云计算属于大数据中的大数据技术范畴。

    2.云计算包含大数据。

    3.Hadoop是云计算的解决方案之一。

    4.云和大数据是两个领域。

  

 

以上理解若有偏误,欢迎进行批评指正。

 

你可能感兴趣的:(大数据,云计算,hadoop,big,data,分布式)