Hadoop十岁了,核心代码行数已170万+、贡献者800+

       Hadoop正式诞生于2006年1月28日,它是一个开源项目的生态系统,从根本上改变了企业存储、处理和分析数据的方式。跟传统系统的区别是,Hadoop可以在相同的数据上同时运行不同类型的分析工作。

  自2006年2月项目正式启动,短短的十年间,Hadoop逐步发展成为最近十年来最成功的开源社区的历程。

  核心Hadoop中目前的代码行数:170万+

  自2006年来对Hadoop的提交数量:12000+

  自2006年来对核心Hadoop的代码贡献者:800+

  Hadoop生态系统中的项目数量从2006年的2个到了25个

  总有那些时间节点事件让你难以忘却:

  2006年1月,Hadoop之父Doug Cutting加入雅虎;

  2006年1月,Cutting将Hadoop代码从Nutch中剥离作为一个新的子项目(常被称作Hadoop“创世纪”事件);

  2006年3月,Yahoo!创建了其第一个Hadoop研究集群;

  Google发布了最初的BigTable论文《Cutting:用于结构化数据的一个分布式存储系统》,启发了Hbase的创建;

  2008年1月,Hadoop成为了Apache顶级项目;

  2008年7月,Hive,第一个Hadoop的SQL访问框架(由Facebook发明),成为一个新的Hadoop子项目;

  2008年8月,Apache的Pig发布,第一个Hadoop的高级别非SQL框架;

  2010年5月,Hbase,自HDFS以来第一个新的数据存储项目,成为Apache顶级项目;

  2012年3月,HDFS HA,做为企业级应用的重要一步,并入了Hadoop支干项目;

  2012年8月,YARN(也是企业级应用的重要里程碑)成为Hadoop的子项目;

  2014年1月,Apache Spark,Hadoop新兴的默认执行引擎(MapReduce的补充),成为Apache的顶级项目;

  2015年10月,Kudu,自HBase以来第一个新的Hadoop存储项目,加入了生态系统;

  2015年11月,Impala和Kudu成为Apache孵化项目;

  

Hadoop十岁了,核心代码行数已170万+、贡献者800+_第1张图片

 

  如今,Hadoop已被公认为是目前最流行的大数据处理平台。Hadoop生态圈的各个项目,围绕着大数据的存储、计算、分析、展示、安全等各个方面,构建了一个完整的大数据生态系统,如今HDFS、YARN等项目更成为海量数据存储和计算资源调度上的事实标准。

你可能感兴趣的:(hadoop)