试读《Hadoop基础教程》

     自2012年起本人接触hadoop技术,到现在算起来也有两年了,也断断续续的在CSDN上面发表了一些文章,主要是自己兴趣使然,从网上找到相关资料进行自学,缺少一些基础理论知识,刚好现在有这本《Hadoop基础教程》,于是便拿来样章细细读来。

     样章只有第1章、第4章。第1章,主要是讲述了讨Hadoop出现的背景,并详细讲解Hadoop想要解决的问题和决定其最终设计的内在驱动因素,分以下几个部分:

  1. 概述大数据革命;--即大数据处理。
  2. 讲解Hadoop是什么以及如何从数据中获取有价值信息; --
  3. 探秘云计算并了解AWS(Amazon Web Services,亚马逊网络服务)的功能;
  4. 了解大数据处理技术与云计算相结合带来的巨大威力;
  5. 概述本书其余章节内容。

      文中论述了作为一个灵活而又功能强大的海量数据处理平台,Hadoop的产生历史和构建方式。还研究了云计算提供的另一种系统架构方式。这种方式从前期巨额成本和直接的物理责任转变为按需付费模式,并依赖云服务提供商来提供硬件、管理服务和扩展系统。讲述了什么是Amazon Web Services,以及弹性MapReduce服务怎样利用其他AWS服务实现云端Hadoop。

     第4章,以MapReduce为基础,介绍如何使用MapReduce解决实际问题。特别是,以更大规模的数据集为例,探索使用MapReduce提供的工具分析数据集的方法。分别讲述了Hadoop Streaming及其使用、UFO目击事件数据集、使用Streaming作为开发或调试工具、在一个作业中使用多个mapper、 在集群上高效共享实用程序文件和数据、 报告作业和任务的状态信息及可用于调试的日志信息。

    本书从Hadoop的基本概念,基本理论知识开始,由浅入深,娓娓道来,是一本系统完善的好书,值得一读。

你可能感兴趣的:(hadoop)