Hadoop 2.x 源码阅读的准备

简介

之前有阅读和分析过部分hadoop 2.x 的源码,但是没有进行整理,现在计划把源码进行重新学习和分析,分析顺序是MapReduce、HDFS、YARN。希望自己可以坚持下来。

阅读源码的步骤

  1. 官网下载Hadoop 2.x 源码包,解压。
    http://www.apache.org/dyn/closer.cgi/hadoop/common在此网站包含很多连接,选择想要阅读的源码版本下载,源码包名字包含src ,例如 hadoop-3.0.0-alpha1-src.tar.gz
    Hadoop 2.x 源码阅读的准备_第1张图片
  2. 用Intellij IDEA open 源码,点击pom.xml,打开即可。打开后maven会自动加载所需的jar包。可以安装配置自己的maven或者使用IDEA自带的插件,在IDEA里面配置maven,这里就不再过多描述。(注:加载完后,pom文件可能会有错误,这个自己调整下即可。)
  3. 如图,这就是源码的结构,
    Hadoop 2.x 源码阅读的准备_第2张图片

主要module

上图源代码结构中,源码主要module是hadoop-mapreduce-project、hadoop-yarn-project、hadoop-hdfs-project和hadoop-common-project这四个。

你可能感兴趣的:(Hadoop,2.x)