在docker中启动三个hadoop的伪集群

  1. systemctl stop firewalld 关闭虚拟机防火墙和本地window的防火墙

  2. service docker start 启动docker

  3. ./start-container 启动docker的三个容器

  4. 默认进入hadoop-master的容器

  5. 同步三个容器中的ntp时间。
    dpkg-reconfigure tzdata 选择Asia -> 再选择Shanghai -> OK
    sudo apt-get install ntpdate
    cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
    date //查看

  6. 将 ojdbc6-11.1.0.7.0.jar 这个jar包复制到到docker容器中
    docker cp ojdbc6-11.1.0.7.0.jar
    hadoop-master:/usr/local/hadoop/share/hadoop/common/lib

  7. 将导出的jar包拷贝到dokcer容器中hadoop-master节点的 /opt目录下
    docker cp mifss-datawork_KC86DATA_HDFS.jar
    docker cp mifss-datework_DiseaseStatistics.jar

  8. 执行jar包 hadoop jar mifss-datawork_KC86DATA_HDFS.jar将数据从数据库读取到HDFS

  9. 执行jar包 hadoop jar mifss-datawork_DeseaseStatistics.jar将数据从HDFS读取并分析到Oracle/MySQL数据库

你可能感兴趣的:(在docker中启动三个hadoop的伪集群)