Apache Hadoop2.7,是经历多年企业生产应用和社区代码优化的稳定版。选用为BR-odp为基础大数据开发框架,既是大数据生态发展也是技术先进性突破。

组件生态:围绕Apache Hadoop为核心的顶级开源项目,其技术组件堆栈多达30多个组件,具备从运维管理、大规模计算、资源调度、分布式存储、多类型开发、弹性扩展、数据挖掘等全面的技术服务能力。
【数道云大数据】Apache Hadoop大数据生态_第1张图片
技术能力:Apache Hadoop 以HDFS 、Mapreduce、 YARN为核心的一个能够对大量数据进行分布式处理的软件框架,具有可靠、高效、可伸缩、可编程的能力。

软件开发:基于Map-Reduce计算范式的Java开发。

企业应用:如国外的亚马逊,Facebook,Cloudera,思科,惠普,雅虎,谷歌和Twitter等;如国内的阿里巴巴、百度、腾讯、中国移动/电信/联通、华为等。

技术联盟:Cloudera生态联盟和Hortonworks ODP联盟,涉及技术企业几千家。
【数道云大数据】Apache Hadoop大数据生态_第2张图片

来源:http://www.sdydata.com/gsxw/info_itemid_65.html