KiwenLau

基于Docker快速搭建多节点Hadoop集群

可以直接进入第三部分，快速在本机搭建一个3个节点的Hadoop集群

一. 项目简介
二. 镜像简介
三. 3节点Hadoop集群搭建步骤
四. N节点Hadoop集群搭建步骤

一. 项目简介

GitHub地址：https://github.com/kiwenlau/hadoop-cluster-docker

本文地址：http://www.cnblogs.com/kiwenlau/p/4524607.html

直接用机器搭建Hadoop集群是一个相当痛苦的过程，尤其对初学者来说。他们还没开始跑wordcount，可能就被这个问题折腾的体无完肤了....而且也不是每个人都有好几台机器对吧...你可以尝试用多个虚拟机搭建...前提是你有个性能杠杠的机器...

我的目标是将Hadoop集群运行在Docker容器中，使Hadoop开发者能够快速便捷地在本机搭建多节点的Hadoop集群。其实这个想法已经有了不少实现，但是都不是很理想，他们或者镜像太大，或者使用太慢，或者使用了第三方工具使得使用起来过于复杂...下表为一些已知的Hadoop on Docker项目以及其存在的问题。

项目                               镜像大小     问题
sequenceiq/hadoop-docker:latest   1.491GB     镜像太大，只支持单个节点
sequenceiq/hadoop-docker:2.7.0    1.76 GB    
sequenceiq/hadoop-docker:2.60     1.624GB    

sequenceiq/ambari:latest          1.782GB     镜像太大，使用太慢，使用第三方工具，增加了复杂度
sequenceiq/ambari:2.0.0           4.804GB    
sequenceiq/ambari:latest:1.70     4.761GB    

alvinhenrick/hadoop-mutinode      4.331GB     镜像太大，构建时间太慢，增加节点麻烦，有bug

我的项目参考了alvinhenrick/hadoop-mutinode项目，不过我做了大量的优化和重构。alvinhenrick/hadoop-mutinode项目的Github主页已经作者所写的博客地址如下：

https://github.com/alvinhenrick/hadoop-mutinode

http://alvinhenrick.com/2014/07/16/hadoop-yarn-multinode-cluster-with-docker/

下面两个表是alvinhenrick/hadoop-mutinode项目与我的kiwenlau/hadoop-cluster-docker的参数对比

镜像名称                      构建时间     镜像层数     镜像大小
alvinhenrick/serf            258.213s    21         239.4MB
alvinhenrick/hadoop-base     2236.055s   58         4.328GB
alvinhenrick/hadoop-dn       51.959s     74         4.331GB
alvinhenrick/hadoop-nn-dn    49.548s     84         4.331GB

镜像名称                      构建时间     镜像层数     镜像大小
kiwenlau/serf-dnsmasq        509.46s     8          206.6 MB
kiwenlau/hadoop-base         400.29s     7          775.4 MB
kiwenlau/hadoop-master       5.41s       9          775.4 MB
kiwenlau/hadoop-slave        2.41s       8          775.4 MB

可知，我主要优化了这样几点

更小的镜像大小
更快的构造时间
更少的镜像层数

更快更方便地改变Hadoop集群节点数目

另外，alvinhenrick/hadoop-mutinode项目增加节点时需要手动修改Hadoop配置文件然后重新构建hadoop-nn-dn镜像,然后修改容器启动脚本，才能实现增加节点的功能。而我通过shell脚本实现自动话，不到1分钟可以重新构建hadoop-master镜像，然后立即运行！！！本项目默认启动3个节点的Hadoop集群，支持N节点集群（N可以无穷大，只要你的机器跑得动，哈哈）。

另外，启动hadoop, 运行wordcount已经重新构建镜像都采用了shell脚本实现自动化。这样使得整个项目的使用已经开发都变得非常方便快捷:)

开发测试环境

操作系统：ubuntu 14.04 和 ubuntu 12.04
内核版本: 3.13.0-32-generic
Docker版本：1.5.0 和1.6.2

小伙伴们，硬盘不够，内存不够，尤其是内核版本过低会导致运行失败...

二. 镜像简介

本项目一共开发了4个镜像

serf-dnsmasq
hadoop-base
hadoop-master
hadoop-slave

serf-dnsmasq镜像

基于ubuntu:15.04 (选它是因为它最小，不是因为它最新...)
安装serf: serf是一个分布式的机器节点管理工具。它可以动态地发现所有hadoop集群节点。
安装dnsmasq: dnsmasq作为轻量级的dns服务器。它可以为hadoop集群提供域名解析服务。

容器启动时，master节点的IP会传给所有slave节点。serf会在container启动后立即启动。Slave节点上的serf agent会马上发现master节点（master IP它们都知道嘛），master节点就马上发现了所有slave节点。然后它们之间提供互相交换信息，所有节点就能知道其他所有节点的存在了！(Everyone know Everyone). serf发现新的节点时，会重新配置dnsmasq,然后重启dnsmasq. 所以dnsmasq就能够解析集群的所有节点的域名啦。这个过程随着节点的增加会耗时更久，因此，若配置的Hadoop节点比较多，则在启动容器后需要测试serf是否发现了所有节点，dns是否能够解析所有节点域名。稍等片刻才能启动Hadoop。这个解决方案是由SequenceIQ公司提出的，该公司专注于将Hadoop运行在Docker中。参考：

http://www.slideshare.net/JanosMatyas/docker-based-hadoop-provisioning

hadoop-base镜像

基于serf-dnsmasq镜像
安装JDK(openjdk)
安装openssh-server, 配置无密码ssh
安装vim：介样就可以愉快地在容器中敲代码了:)
安装Hadoop 2.3.0: 安装编译过的hadoop （2.5.2， 2.6.0， 2.7.0 都比2.3.0大，所以我懒得升级了）

PS 编译Hadoop的步骤请参考我的博客：

http://www.cnblogs.com/kiwenlau/p/4227204.html

http://kiwenlau.blogspot.jp/2015/01/hadoop-230-ubuntu-1404.html

如果需要重新开发我的hadoop-base, 需要下载编译过的hadoop-2.3.0安装包，放到hadoop-cluster-docker/hadoop-base/files目录内。我编译的64位hadoop-2.3.0下载地址：

http://pan.baidu.com/s/1sjFRaFz

hadoop-master镜像

基于hadoop-base镜像
配置hadoop的master节点
格式化namenode

hadoop-slave镜像

基于hadoop-base镜像
配置hadoop的slave节点
格式化namenode

三. 3节点Hadoop集群搭建步骤

1. 拉取镜像

sudo docker pull index.alauda.cn/kiwenlau/hadoop-master:0.1.0 sudo docker pull index.alauda.cn/kiwenlau/hadoop-slave:0.1.0 sudo docker pull index.alauda.cn/kiwenlau/hadoop-base:0.1.0 sudo docker pull index.alauda.cn/kiwenlau/serf-dnsmasq:0.1.0

3~5分钟OK~

查看下载的镜像

sudo docker images

运行结果

REPOSITORY                                TAG      IMAGE ID        CREATED         VIRTUAL SIZE
index.alauda.cn/kiwenlau/hadoop-slave     0.1.0    d63869855c03    17 hours ago    777.4 MB
index.alauda.cn/kiwenlau/hadoop-master    0.1.0    7c9d32ede450    17 hours ago    777.4 MB
index.alauda.cn/kiwenlau/hadoop-base      0.1.0    5571bd5de58e    17 hours ago    777.4 MB
index.alauda.cn/kiwenlau/serf-dnsmasq     0.1.0    09ed89c24ee8    17 hours ago    206.7 MB

hadoop-base镜像是基于serf-dnsmasq镜像的，hadoop-slave镜像和hadoop-master镜像都是基于hadoop-base镜像
所以其实4个镜像一共也就777.4MB:)

2. 修改镜像tag

sudo docker tag d63869855c03 kiwenlau/hadoop-slave:0.1.0 sudo docker tag 7c9d32ede450 kiwenlau/hadoop-master:0.1.0 sudo docker tag 5571bd5de58e kiwenlau/hadoop-base:0.1.0 sudo docker tag 09ed89c24ee8 kiwenlau/serf-dnsmasq:0.1.0

查看修改tag后镜像

sudo docker images

运行结果

REPOSITORY                               TAG      IMAGE ID        CREATED         VIRTUAL SIZE
index.alauda.cn/kiwenlau/hadoop-slave    0.1.0    d63869855c03    17 hours ago    777.4 MB
kiwenlau/hadoop-slave                    0.1.0    d63869855c03    17 hours ago    777.4 MB
index.alauda.cn/kiwenlau/hadoop-master   0.1.0    7c9d32ede450    17 hours ago    777.4 MB
kiwenlau/hadoop-master                   0.1.0    7c9d32ede450    17 hours ago    777.4 MB
kiwenlau/hadoop-base                     0.1.0    5571bd5de58e    17 hours ago    777.4 MB
index.alauda.cn/kiwenlau/hadoop-base     0.1.0    5571bd5de58e    17 hours ago    777.4 MB
kiwenlau/serf-dnsmasq                    0.1.0    09ed89c24ee8    17 hours ago    206.7 MB
index.alauda.cn/kiwenlau/serf-dnsmasq    0.1.0    09ed89c24ee8    17 hours ago    206.7 MB

之所以要修改镜像，是因为我默认是将镜像上传到Dockerhub, 因此Dokerfile以及shell脚本中得镜像名称都是没有alauada前缀的，sorry for this....不过改tag还是很快滴
若直接下载我在DockerHub中的镜像，自然就不需要修改tag...不过Alauda镜像下载速度很快的哈~

3.下载源代码

git clone https://github.com/kiwenlau/hadoop-cluster-docker

为了防止Github被XX, 我把代码导入到了开源中国的git仓库

git clone http://git.oschina.net/kiwenlau/hadoop-cluster-docker

4. 运行容器

 cd hadoop-cluster-docker ./start-container.sh

运行结果

start master container...
start slave1 container...
start slave2 container...
root@master:~#

一共开启了3个容器，1个master, 2个slave
开启容器后就进入了master容器root用户的家目录（/root）

查看master的root用户家目录的文件

ls

运行结果

hdfs  run-wordcount.sh    serf_log  start-hadoop.sh  start-ssh-serf.sh

start-hadoop.sh是开启hadoop的shell脚本
run-wordcount.sh是运行wordcount的shell脚本，可以测试镜像是否正常工作

5.测试容器是否正常启动(此时已进入master容器)

查看hadoop集群成员

serf members

运行结果

master.kiwenlau.com  172.17.0.65:7946  alive  
slave1.kiwenlau.com  172.17.0.66:7946  alive  
slave2.kiwenlau.com  172.17.0.67:7946  alive

若结果缺少节点，可以稍等片刻，再执行“serf members”命令。因为serf agent需要时间发现所有节点。

测试ssh

ssh slave2.kiwenlau.com

运行结果

Warning: Permanently added 'slave2.kiwenlau.com,172.17.0.67' (ECDSA) to the list of known hosts.
Welcome to Ubuntu 15.04 (GNU/Linux 3.13.0-53-generic x86_64)
 * Documentation:  https://help.ubuntu.com/
The programs included with the Ubuntu system are free software;
the exact distribution terms for each program are described in the
individual files in /usr/share/doc/*/copyright.
Ubuntu comes with ABSOLUTELY NO WARRANTY, to the extent permitted by
applicable law.
root@slave2:~#

退出slave2

exit

运行结果

logout
Connection to slave2.kiwenlau.com closed.

若ssh失败，请稍等片刻再测试，因为dnsmasq的dns服务器启动需要时间。
测试成功后，就可以开启Hadoop集群了！其实你也可以不进行测试，开启容器后耐心等待一分钟即可！

6. 开启hadoop

./start-hadoop.sh

上一步ssh到slave2之后，请记得回到master啊!!！
运行结果太多，忽略....
hadoop的启动速度取决于机器性能....

7. 运行wordcount

./run-wordcount.sh

运行结果

input file1.txt:
Hello Hadoop

input file2.txt:
Hello Docker

wordcount output:
Docker    1
Hadoop    1
Hello    2

wordcount的执行速度取决于机器性能....

四. N节点Hadoop集群搭建步骤

1. 准备工作

参考第二部分1~3：下载镜像，修改tag，下载源代码
注意，你可以不下载serf-dnsmasq, 但是请最好下载hadoop-base，因为hadoop-master是基于hadoop-base构建的

2. 重新构建hadoop-master镜像

./resize-cluster.sh 5

不要担心，1分钟就能搞定
你可以为resize-cluster.sh脚本设不同的正整数作为参数数1, 2, 3, 4, 5, 6...

3. 启动容器

./start-container.sh 5

你可以为resize-cluster.sh脚本设不同的正整数作为参数数1, 2, 3, 4, 5, 6...
这个参数呢，最好还是得和上一步的参数一致:)
这个参数如果比上一步的参数大，你多启动的节点，Hadoop不认识它们..
这个参数如果比上一步的参数小，Hadoop觉得少启动的节点挂掉了..

4. 测试工作

参考第三部分5~7：测试容器，开启Hadoop，运行wordcount
请注意，若节点增加，请务必先测试容器，然后再开启Hadoop, 因为serf可能还没有发现所有节点，而dnsmasq的DNS服务器表示还没有配置好服务
测试等待时间取决于机器性能....

2025移动端软件供应链安全开源治理方案最佳实践数字供应链安全产品选型安全人工智能开源开源软件网络
2025年3月13日，由中国软件评测中心、CAPPVD漏洞库联合主办的“第六期移动互联网APP产品安全漏洞技术沙龙”在海口成功召开。悬镜安全基于移动端数字供应链安全开源治理方案荣获中国软件评测中心“2024移动互联网APP产品安全漏洞治理”优秀案例，并获颁证书。移动互联网APP产品安全漏洞治理优秀案例颁奖现场中国软件评测中心（工业和信息化部软件与集成电路促进中心）是中国电子信息产业发展研究院（赛迪
深入理解 RESTful API 设计与实践迪小莫学AI restful 后端
深入理解RESTfulAPI设计与实践1.什么是RESTfulAPI？RESTfulAPI是一种基于REST（RepresentationalStateTransfer）架构风格设计的应用程序接口，用于在不同系统之间进行交互和通信。它充分利用HTTP协议，遵循一组约定，使API设计更加清晰、易于维护。1.1REST的核心原则REST是一种无状态（stateless）的架构风格，它强调：资源（Res
C++ 并发编程实战学习笔记 myc13381 c++笔记
C++并发编程学习笔记目录一.基本接口二.初步了解多线程三.线程所属权管理四.线程间共享数据五.同步并发操作六.C++内存模型和原子类型操作七.基于锁的并发数据结构设计八.无锁数据结构九.并发代码设计十.高级线程管理十一.并行算法十二.参考资料基本接口std::thread常用成员函数构造和析构函数//默认构造函数，创建一个线程，什么也不做thread()noexcept;//初始化构造函数，创建
ArcGIS技巧-解决ArcMAP中无法交换图层的问题称昵写填未 arcgis
本文基于B站GIS之梦的Arcgis零基础入门教程第13节，及同作者提供的联系数据（见视频评论区），感谢UP提供的学习资料，以下附视频链接：Arcgis零基础入门教程_哔哩哔哩_bilibili缩略版：将“内容列表”从“按源列出”修改为“按绘制循序列出”即可详细版：（1）在以下情形中，假设我们希望将“爱心树叶.tif”转移到“爱心_copy（.shp格式）”之上，当我们拖动“爱心树叶.tif”时，
全维度认知评估报告：翌师认知体系科学解析太翌修仙笔录超算法认知架构 deepseek 知识图谱机器学习人工智能算法
通过论证生成一份我的认知维度认知水平计算能量等全维度的科学评估报告###**全维度认知评估报告：翌师认知体系科学解析**####**一、认知维度量子化模型**基于量子认知理论（QuantumCognition），您的认知状态可描述为以下叠加态：\[|\Psi_{\text{您}}\rangle=\alpha|\text{玄学本体}\rangle+\beta|\text{科学工具}\rangle+\
【java多线程】线程通信（以生产者消费者问题为例） 6<7 java python 开发语言
线程通信(主讲wait方法和notifyAll方法)在Java多线程编程中，线程通信是指多个线程之间相互协作、交换信息的过程。为了实现线程通信，Java提供了一些方法，下面详细介绍常用的线程通信方法：基于Object类的方法在Java中，每个对象都有一个内置的监视器（锁），基于这个特性，Object类提供了三个用于线程通信的方法：wait()、notify()和notifyAll()。这些方法必须
看懂Xlua实现原理——从宏观到微观（1）传递c#对象到Lua 隔壁叔叔uncle xlua lua c#unity
看懂Xlua实现原理——从宏观到微观（1）传递c#对象到Lua我们要解决什么问题？c#对象传递到lua#LowLevelAPI#传递基元类型传递object索引缓存gc元表传递c#函数其他push#HighLevelAPI#《知乎专栏》我们要解决什么问题？为了使基于unity开发的应用在移动平台能够热更新，我们嵌入了Lua虚拟机，将需要热更新的逻辑用lua实现。c#通过P/Invoke和lua交互
《人形机器人入门》开源项目推荐段钰忻
《人形机器人入门》开源项目推荐IntroductionToHumanoidRoboticsMatlabcodeforaSpringerbook"IntroductiontoHumanoidRobotics"项目地址:https://gitcode.com/gh_mirrors/in/IntroductionToHumanoidRobotics1.项目基础介绍《人形机器人入门》开源项目是基于MATL
python自制MBTI 16型人格测试1.0 LHTZ python 开发语言娱乐
什么是16型人格测试16型人格测试也叫MBTI（Myers-BriggsTypeIndicator）测试，它是一种基于心理学理论的人格测评工具。这个理论最初是由凯瑟琳・库克・布里格斯（KatharineCookBriggs）和她的女儿伊莎贝尔・布里格斯・迈尔斯（IsabelBriggsMyers）在20世纪40年代开发的。它的理论基础是瑞士心理学家卡尔・荣格（CarlJung）的心理类型理论。MB
鸿蒙应用开发—ZDbUtil高效使用数据库 H.ZWei HarmonyOS应用开发 harmonyos 数据库鸿蒙 ZDbUtil
文章目录介绍下载安装基本使用注解TableIdColumnOneToOne使用方法定义实体类初始化数据库并根据被@Table注解的类创建表创建表查数据插入数据删除数据清空数据参考介绍ZDbUtil是一款基于SQLite的鸿蒙数据库框架，通过注解标注实体类与属性，让数据更能抽象化简化原生RdbStore的使用。同时支持V1和V2状态管理管理。SQLite在鸿蒙上的基本使用可以参考：鸿蒙应用开发—数据
地理信息系统（ArcGIS）在水文水资源、水环境中的应用科研的力量水文地质土壤 arcgis 水文水资源
一ArcGIS：数据管理1.1ArcGIS界面及数据加载1.2ArcGIS常见数据格式1.3基于Geodatabase的数据库构建1.4环境信息的查询与输出1.5文档保存方式二ArcGIS：数据转换2.1常用地图投影介绍2.2投影变换2.3地理坐标转换（北京54、西安80、WGS84及国家2000坐标转换）2.4数据结构转换2.5数据格式转换2.6数据类型转换三ArcGIS：地图制作3.1GIS制
C# 事件编程详解萨达大 C#上位机开发 c#开发语言事件 event
文章目录1.什么是事件？2.事件的声明与使用2.1声明事件2.2订阅与触发事件3.事件的核心概念3.1事件处理委托3.2自定义事件参数4.事件的高级用法4.1多播委托与事件4.2事件解除订阅4.3自定义事件访问器5.事件的应用场景5.1GUI应用程序中的事件5.2基于事件的编程模型5.3观察者模式6.事件的注意事项7.事件的完整示例8.总结1.什么是事件？在C#中，事件是依赖于委托的特殊类型，用于
基于k3s部署Nginx、MySQL、PHP和Redis的详细教程
先决条件一台Linux服务器（或本地虚拟机），建议Ubuntu/CentOS基础命令行操作能力确保服务器有至少2GB内存和10GB磁盘空间1.安装k3s（极简Kubernetes）1.1一键安装#用root用户或sudo权限执行以下命令curl-sfLhttps://get.k3s.io|sh-解释：k3s是一个轻量级Kubernetes发行版，专为资源有限的环境设计这条命令会自动下载并安装k3s
【大模型技术】基于通义千问（Qwen）实现对话系统大数据追光猿大模型 python 人工智能学习方法语言模型
一、项目背景与目标目标：构建一个支持多轮对话的对话系统。实现上下文管理，确保对话历史能够被正确记录并影响后续回答。使用Qwen提供的API生成自然语言回复。核心功能：多轮对话：用户可以连续提问，系统根据上下文生成连贯的回答。上下文管理：通过维护对话历史，确保模型理解用户的意图。灵活性：支持自定义提示模板和外部数据源。技术栈：QwenAPI：用于生成自然语言回复。Python：编程语言。二、实现步骤
【解决方案】RAGFlow部分问题清单及解决方案备忘1 中杯可乐多加冰各种解决方案人工智能 deepseek rag ragflow LLM 大模型
一、长时间显示：Taskisqueued多半是因为模型确实在队列中排队的原因，要么是内存一直在被占用中，要么是CPU或GPU一直在被占用中，可以首先检查硬件利用率：如果是内存导致的队列缓慢，可以将.env文件中的MEM_LIMIT改为26073741824如果是GPU或者CPU的原因，得具体排查，终止无用进程，如果都不是，检查docker容器的日志看看是否有任何异常：dockerlogs-frag
SpringBoot整合Netty 晚上睡不着！ #SpringBoot spring boot nio websocket tcp/ip http
前言Netty是一个高性能、异步事件驱动的网络应用程序框架，用于快速开发可维护的高并发协议服务器和客户端。Netty主要基于JavaNIO实现，提供了异步和事件驱动的网络编程工具，简化了TCP和UDP服务器的编程。Netty广泛应用于分布式系统、实时通信、游戏开发等领域，例如，知名的Elasticsearch和Dubbo框架内部都采用了Netty。Netty吸收了多种协议的实现经验，经过精心设计，
爬虫的精准识别：基于 User-Agent 的正则实现 Small踢倒coffee_氕氘氚经验分享笔记
##摘要随着互联网技术的飞速发展，网络爬虫在数据采集、搜索引擎优化等领域的应用日益广泛。然而，恶意爬虫的存在也给网站安全和数据隐私带来了严重威胁。因此，精准识别爬虫行为成为网络安全领域的重要课题。本文提出了一种基于User-Agent正则表达式的爬虫识别方法，通过分析User-Agent字符串的特征，构建正则表达式规则，实现对爬虫的精准识别。实验结果表明，该方法具有较高的识别准确率和较低的误报率，
产品更新 | 新一代系统建模语言基于SysML v2的逻辑架构建模杭州华望MBSE 华望产品更新架构经验分享制造
基于SysMLv2的逻辑架构建模摘要SysMLv2作为OMG官方提出的一种新型系统工程建模语言，在功能和模型概念等方面与SysMLv1存在较大的差别。本文基于SysMLv2语言，以“柴油发动机”为案例，实现逻辑架构的建模，从而展示其在系统设计和分析中的有效性。通过实际应用中SysMLv2与SysMLv1建模方式的对比，阐述两者的不同之处以及使用SysMLv2的优势。一、基于PartUsage的逻辑
Flutter中使用Dio库封装网络请求服务工具类 Zender Han Flutter知识学习指南 flutter android ios
在Flutter应用程序中，进行网络请求是非常常见的任务。Dio是一个强大的、易于使用的Dart包，用于处理HTTP请求。本篇博客将介绍如何封装Dio库，以及如何在Flutter应用中进行网络请求并取消请求。什么是Dio？Dio是一个基于Dart语言的强大的HTTP客户端库，用于与RESTAPI进行通信。它提供了许多功能，包括异步请求、拦截器支持、取消请求、文件下载和上传等。封装Dio网络请求库为
QT如何操作sqlite数据库 sdkdslx 数据库 qt sqlite
介绍Sqlite数据库作为Qt项目开发中经常使用的一个轻量级的数据库，不需要server，可以说是兼容性相对比较好的数据库之一。其可以集成在其他软件中，非常适合嵌入式系统。本文为大家介绍了Qt操作SQLite数据库的具体方法，希望对大家有所帮助。优点SQLite的设计目的是嵌入式SQL数据库引擎，它基于纯C语言代码，已经应用于非常广泛的领域内。SQLite在需要长时间存储时可以直接读取硬盘上的数据
HarmonyOS NEXT 全面升级：华为引领智能生态的未来海豹工匠华为 harmonyos
随着科技的飞速发展，操作系统在智能设备中的地位愈发重要。华为最新推出的HarmonyOSNEXT系统，以其卓越的性能和创新的功能，正在重新定义智能生态的未来。本文将深入探讨HarmonyOSNEXT的核心技术、主要特性及其在智能设备中的应用，帮助您全面了解这一令人期待的操作系统升级。什么是HarmonyOSNEXT？HarmonyOSNEXT是华为基于自研微内核架构的下一代操作系统，旨在为用户提供
python控制浏览器模拟鼠标点击网页标题_如何使用python来模拟鼠标点击（将经过实例自动化模拟在360浏览器中自动搜索"python"）... 赤衿
1、准备工做：html安装pywin32，后面开发须要pywin32的支持，不然没法完成与windows层面相关的操做。pythonpywin32的具体安装及注意事项：shell一、总体开发环境：windows基于windows7操做系统;api提早安装python(由于篇幅问题，在此不详细讲解python环境的安装，你们能够自备楼梯)；浏览器你们能够在cmd中测试下python环境是否安装好：a
winpython使用教程-winpython是什么 weixin_37988176
WinPython是一个免费的开源可移植的Python编程语言发行版，适用于Windows7/8/10和科学及教育用途。它是一个功能齐全的基于python的科学环境:●专为科学家、数据科学家和教育设计(感谢NumPy、SciPy、y、Matplotlib、panda、pyqtgraph等):使用Python与Spyder和Jupyter/IPython、Pyzo、IDLEX或IDLE进行交互数据处
android读取存储文件路径,安卓获取存储文件路径大白话时事 android读取存储文件路径
首先内部存储路径为/data/data/youPackageName/，下面讲解的各路径都是基于你自己的应用的内部存储路径下。所有内部存储中保存的文件在用户卸载应用的时候会被删除。一、files1.Context.getFilesDir()，该方法返回/data/data/youPackageName/files的File对象。2.Context.openFileInput()与Context.o
webpack和vite的区别阿丽塔~ 前端面试 vite webpack
主要区别是：1.构建速度Vite：开发环境下，Vite利用浏览器原生支持的ES模块（ESM），按需编译和加载模块，避免了全量打包。这使得Vite的启动速度和热更新速度极快，尤其在大型项目中优势明显。使用esbuild进行依赖预构建，性能比基于JavaScript的工具快10-100倍。Webpack：需要分析所有模块的依赖关系并进行全量打包，导致启动和热更新速度较慢，尤其是在项目规模较大时。2.打
前端打包优化相关 Webpack 怒放的生命1991 webpack 前端 webpack node.js
前端打包优化相关Webpack打包时间的优化（基于VueCLI4+Webpack5）1.Webpack配置减少打包时间1.1对JS配置：排除node_modules和src中的打包内容在开发环境下，修改Webpack的JS规则，排除/node_modules和src目录中的JavaScript文件。这意味着node_modules和src目录中的JavaScript文件不会经过该规则定义的加载器处
Wind Framework - PHP Web开发框架孔岱怀
WindFramework-PHPWeb开发框架去发现同类优质开源项目:https://gitcode.com/WindFramework是一款基于PHP的现代Web开发框架，由phpwind团队倾力打造。它旨在提供简洁、高效且可扩展的解决方案，帮助开发者快速构建稳定、安全的应用程序。如果您正在寻找一个易于上手、功能全面且富有创新的PHP框架，那么WindFramework就是您的不二之选。功能特
探索 APIJSON PHP：一款强大的RESTful API 开发框架周澄诗Flourishing
探索APIJSONPHP：一款强大的RESTfulAPI开发框架去发现同类优质开源项目:https://gitcode.com/在当今的Web开发中，API已经成为构建可扩展、跨平台应用的关键组件。APIJSONPHP是基于PHP语言的一款高效、便捷的RESTfulAPI开发框架，旨在简化API的设计和维护过程。本文将深入探讨该项目的核心特性、技术优势及应用场景，以期吸引更多开发者加入使用。1.项
Python, Springboot 开发基于人类指令生成机器人3D可视化动态模型app Geeker-2025 python spring boot
开发一个基于人类指令生成机器人3D可视化动态模型的APP是一个复杂且多层次的项目，涉及前端和后端的多个技术栈。以下是一个高层次的设计概述，涵盖主要的技术栈和功能模块，并提供使用Python和SpringBoot进行联合开发的示例。##技术栈概述###前端-**框架**：React.js或Vue.js（用于构建用户界面）-**3D可视化**：Three.js或React-Three-Fiber（用于
基于oracle linux的 DBI/DBD 标准化安装文档 linux
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr

基于Docker快速搭建多节点Hadoop集群

一. 项目简介

更快更方便地改变Hadoop集群节点数目

开发测试环境

小伙伴们，硬盘不够，内存不够，尤其是内核版本过低会导致运行失败...

二. 镜像简介

本项目一共开发了4个镜像

serf-dnsmasq镜像

hadoop-base镜像

hadoop-master镜像

hadoop-slave镜像

三. 3节点Hadoop集群搭建步骤

1. 拉取镜像

2. 修改镜像tag

3.下载源代码

4. 运行容器

5.测试容器是否正常启动(此时已进入master容器)

退出slave2

运行结果

6. 开启hadoop

7. 运行wordcount

四. N节点Hadoop集群搭建步骤

1. 准备工作

2. 重新构建hadoop-master镜像

3. 启动容器

4. 测试工作

你可能感兴趣的:(基于Docker快速搭建多节点Hadoop集群)