Leokadia Rothschild

Hadoop入门(八)——本地运行模式+完全分布模式案例详解，实现WordCount和集群分发脚本xsync快速配置环境变量（图文详解步骤2021）

系列文章传送门

Hadoop入门(一)——CentOS7下载+VM上安装（手动分区）图文步骤详解(2021)
Hadoop入门(二)——VMware虚拟网络设置+Windows10的IP地址配置+CentOS静态IP设置（图文详解步骤2021）
Hadoop入门(三)——XSHELL7远程访问工具+XFTP7文件传输（图文步骤详解2021）
Hadoop入门(四)——模板虚拟机环境准备（图文步骤详解2021）
Hadoop入门(五)——Hadoop集群搭建-克隆三台虚拟机（图文步骤详解2021）
Hadoop入门(六)——JDK安装（图文步骤详解2021）
Hadoop入门(七)——Hadoop安装（图文详解步骤2021）
Hadoop入门(八)——本地运行模式+完全分布模式案例详解，实现WordCount和集群分发脚本xsync快速配置环境变量（图文详解步骤2021）
Hadoop入门(九)——SSH免密登录配置（图文详解步骤2021）

文章目录

Hadoop入门(八)——本地运行模式+完全分布模式案例详解，实现WordCount和集群分发脚本xsync快速配置环境变量（图文详解步骤2021）
- 系列文章传送门
- Hadoop 运行模式
- 本地运行模式（官方 WordCount案例）
- - 1 ）创建在 hadoop-3.1.3 文件下面创建一个 wcinput 文件夹
  - 2 ）在 wcinput 文件下创建一个 word.txt 文件
  - 3 ）编辑 word.txt 文件
  - 4 ）回到 Hadoop 目录/opt/module/hadoop-3.1.3
  - 5 ）执行程序
  - 6 ）查看结果
- 完全分布式运行模式（重点）
- - 虚拟机准备
  - 编写集群分发脚本 xsync
  - - 1 ）scp （secure copy ）安全拷贝
    - - （a）在 hadoop102 上，将 hadoop102 中/opt/module/jdk1.8.0_212 目录拷贝到hadoop103 上。
      - （b）在 hadoop103 上，将 hadoop102 中/opt/module/hadoop-3.1.3 目录拷贝到hadoop103 上。
      - （c）在 hadoop103 上操作，将 hadoop102 中/opt/module 目录下所有目录拷贝到hadoop104 上。
- 题外话——小Tip
- - - 2 ）rsync 远程**同步**工具
    - - （a）删除 hadoop103 中/opt/module/hadoop-3.1.3/wcinput
      - （b）同步 hadoop102 中的/opt/module/hadoop-3.1.3 到 hadoop103
    - 3 ）xsync 集群分发脚本
    - - （a）在`/home/leokadia/bin` 目录下创建 xsync 文件
      - （b）修改脚本 xsync 具有执行权限
      - （c）测试脚本
      - （d）将脚本复制到/bin 中，以便全局调用
      - （e）同步环境变量配置（root 所有者）
      - 注意：让环境变量生效

Hadoop 运行模式

1）Hadoop 官方网站：http://hadoop.apache.org/

2）Hadoop 运行模式包括： 本地模式、 伪分布式模式以及 完全分布式模式。

本地模式：单机运行，只是用来演示一下官方案例。生产环境不用。
伪分布式模式：也是单机运行，但是具备 Hadoop 集群的所有功能，一台服务器模
拟一个分布式的环境。个别缺钱的公司用来测试，生产环境不用。
完全分布式模式：多台服务器组成分布式环境。生产环境使用。

本地运行模式（官方 WordCount案例）

1 ）创建在 hadoop-3.1.3 文件下面创建一个 wcinput 文件夹

[leokadia@hadoop102 hadoop-3.1.3]$ mkdir wcinput

2 ）在 wcinput 文件下创建一个 word.txt 文件

[leokadia@hadoop102 hadoop-3.1.3]$ cd wcinput

3 ）编辑 word.txt 文件

[leokadia@hadoop102 wcinput]$ vim word.txt
➢ 在文件中随便输入一些内容
➢ 保存退出：:wq

4 ）回到 Hadoop 目录/opt/module/hadoop-3.1.3

[leokadia@hadoop102 ~]$ cd /opt/module/hadoop-3.1.3

5 ）执行程序

[leokadia@hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount wcinput wcoutput

当然，你要是不确定，不放心自己的程序中是否有hadoop-mapreduce-examples-3.1.3.jar，你可以依次进入文件夹查看，博主就做过这种事情。

6 ）查看结果

[leokadia@hadoop102 hadoop-3.1.3]$ cat wcoutput/part-r-00000
看到如下结果：

19-1	1
HFUT,	1
Hadoop	1
Leokadia	1
She	1
a	1
class	1
computer	1
experiment	1
in	1
innovation	1
is	3
learning	1
sophomore	1
whose	1

完全分布式运行模式（重点）

分析：
1）准备 3 台客户机（关闭防火墙、静态 IP、主机名称）
2）安装 JDK
3）配置环境变量
4）安装 Hadoop
5）配置环境变量

注，以上步骤我们均在hadoop102上搞定了

6）配置集群
7）单点启动
8）配置 ssh
9）群起并测试集群

步骤1，2，3，4，5之前我们均已经在102上搞定了

虚拟机准备

详见前几篇文章

编写集群分发脚本 xsync

1 ）scp （secure copy ）安全拷贝

（1）scp 定义
scp 可以实现服务器与服务器之间的数据拷贝。（from server1 to server2）
（2）基本语法

（3）案例实操

前提：在 hadoop102、hadoop103、hadoop104 都已经创建好的/opt/module、
/opt/software 两个目录，并且已经把这两个目录修改为 leokadia:leokadia
[leokadia@hadoop102 ~]$ sudo chown leokadia:leokadia -R /opt/module

注：前面完全按我来的这部分不需要做，之前103，104克隆的时候就存在了

（a）在 hadoop102 上，将 hadoop102 中/opt/module/jdk1.8.0_212 目录拷贝到hadoop103 上。

[leokadia@hadoop102 ~]$ scp -r /opt/module/jdk1.8.0_212 leokadia@hadoop103:/opt/module

输入yes
然后输入hadoop103的密码：
然后就开始拷贝了，经历一大串类似这样的

在hadoop103上即可看到jdk拷贝成功

刚刚我们的一通操作是将在 hadoop102 上，将 hadoop102 中/opt/module/jdk1.8.0_212 目录拷贝到hadoop103 上。简单点说就是把hadoop102上的东西强行塞给hadoop103。那能不能在hadoop103上将hadoop102的东西强行拿过来呢？下面拷贝hadoop-3.1.3的时候我们就试试这种方法。

（b）在 hadoop103 上，将 hadoop102 中/opt/module/hadoop-3.1.3 目录拷贝到hadoop103 上。

[leokadia@hadoop103 ~]$ scp -r leokadia@hadoop102:/opt/module/hadoop-3.1.3 /opt/module/

可以看到拷贝成功

其实不仅可以把hadoop102上的东西强行塞给hadoop103
在hadoop103上将hadoop102的东西强行拿过来
还可以用在 hadoop103 上操作，将 hadoop102 的东西塞给hadoop104

（c）在 hadoop103 上操作，将 hadoop102 中/opt/module 目录下所有目录拷贝到hadoop104 上。

[leokadia@hadoop103 opt]$ scp -r leokadia@hadoop102:/opt/module/* leokadia@hadoop104:/opt/module
过程同理

然后他会让你输入hadoop104的密码，输入后即可拷贝成功

不放心的话可以在hadoop104中验证一下

题外话——小Tip

由于博主之前为每台运行虚拟机预留的主机RAM( R )比较大
（不要喷，博主电脑是在转计算机之前瞎买的，比较垃圾）
因此同时开启三台虚拟机的时候，他会报出这样的错误：物理内存不足，无法使用配置的设置开启虚拟机

博主寻找过许多解决办法，最终找到一个最方便（智障）的方法供大家参考：
点击“编辑”———“首选项”，在弹出的对话框中选择左侧的“内存”，然后在最右侧选择“允许交换大部分虚拟机内存”即可，如下图所示

2 ）rsync 远程同步工具

rsync 主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点。
rsync 和 scp 区别：用 rsync 做文件的复制要比 scp 的速度快，rsync 只对差异文件做更
新。scp 是把所有文件都复制过去。

（1）基本语法

（2）案例实操

（a）删除 hadoop103 中/opt/module/hadoop-3.1.3/wcinput

[leokadia@hadoop103 hadoop-3.1.3]$ rm -rf wcinput/

（b）同步 hadoop102 中的/opt/module/hadoop-3.1.3 到 hadoop103

希望将 hadoop102 中的hadoop-3.1.3 到 hadoop103
看是所有的内容都拷贝，还是只拷贝差异性内容

[leokadia@hadoop102 module]$ rsync -av hadoop-3.1.3/ leokadia@hadoop103:/opt/module/hadoop-3.1.3/

同步完成

在hadoop103中验证：同步成功

3 ）xsync 集群分发脚本

（1）需求：循环复制文件到所有节点的相同目录下
在家目录下创建一个文件，希望写一个脚本，一执行这个命令，a.txt就可以分发到相同的路径
（2）需求分析：
（a）rsync 命令原始拷贝：
rsync -av /opt/module leokadia@hadoop103:/opt/
（b）期望脚本：
xsync 要同步的文件名称
（c）期望脚本在任何路径都能使用（脚本放在声明了全局环境变量的路径）
[leokadia@hadoop102 ~]$ echo $PATH 查看全局环境变量的路径

/usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/opt/module/jdk1.8.0_212/bin:/opt/module/hadoop-3.1.3/bin:/opt/module/hadoop-3.1.3/sbin:/home/leokadia/.local/bin:/home/leokadia/bin

想在/home/leokadia/bin目录下将xsync 集群分发脚本放入，即可在全局使用这个脚本了
（其实也可以在家目录下创建这个脚本，在把这个脚本的路径放入全局变量环境）
（3）脚本实现

（a）在`/home/leokadia/bin` 目录下创建 xsync 文件

[leokadia@hadoop102 opt]$ cd /home/leokadia
[leokadia@hadoop102 ~]$ mkdir bin

[leokadia@hadoop102 ~]$ cd bin
[leokadia@hadoop102 bin]$ vim xsync

在该文件中编写如下代码

#!/bin/bash 
 
#1. 判断参数个数 
# 判断参数是否小于1
if [ $# -lt 1 ]   
then 
    echo Not Enough Arguement! 
    exit; 
fi 

#2. 遍历集群所有机器 
# 对102，103，104都进行分发
for host in hadoop102 hadoop103 hadoop104 
do 
   echo ====================  $host  ==================== 
   #3. 遍历所有目录，挨个发送 
   for file in $@ 
   do 

        #4. 判断文件是否存在 
        if [ -e $file ] 
            then 
                #5. 获取父目录 
                pdir=$(cd -P $(dirname $file); pwd) 
                
                #6. 获取当前文件的名称 
                fname=$(basename $file) 
                ssh $host "mkdir -p $pdir" 
                rsync -av $pdir/$fname $host:$pdir 
            # 如果不存在
            else 
                echo $file does not exists! 
        fi 
    done 
done

（b）修改脚本 xsync 具有执行权限

[leokadia@hadoop102 bin]$ chmod +x xsync

（c）测试脚本

[leokadia@hadoop102 ~]$ xsync /home/leokadia/bin

连输几次密码

在hadoop103，hadoop104上验证，发现脚本传输成功

（d）将脚本复制到/bin 中，以便全局调用

[leokadia@hadoop102 bin]$ sudo cp xsync /bin/

还记得之前我们hadoop103，hadoop104都没有配置hadoop和jdk的环境变量吗？
看下hadoop104目前的环境变量里的情况

发现确实没有配置

这个脚本的用处来了！
我们用这个脚本分发环境变量

（e）同步环境变量配置（root 所有者）

我们先用这条命令试一下：
[leokadia@hadoop102 ~]$ xsync /etc/profile.d/my_env.sh

查看hadoop103/104中的，发现根本没有my_env.sh文件

那我们加sudo试一下，发现根本找不到命令

为啥呢？
我加了sudo相当于我是root用户，但目前我现在脚本在家目录bin目录下，root账号使用不了这个路径。
那我们就加上这个绝对路径呗！
这次一定成！

[leokadia@hadoop102 ~]$ sudo ./bin/xsync /etc/profile.d/my_env.sh
注意：如果用了 sudo，那么 xsync 一定要给它的路径补全。

在hadoop103，hadoop104下验证一下：
[leokadia@hadoop103 bin]$ sudo vim /etc/profile.d/my_env.sh

成功！

注意：让环境变量生效

[leokadia@hadoop103 bin]$ source /etc/profile
[leokadia@hadoop104 bin]$ source /etc/profile

Hive 与 SparkSQL 的语法差异及性能对比自然术算 Hive hive hadoop 大数据 spark
在大数据处理领域，Hive和SparkSQL都是极为重要的工具，它们为大规模数据的存储、查询和分析提供了高效的解决方案。虽然二者都致力于处理结构化数据，并且都采用了类似SQL的语法来方便用户进行操作，但在实际使用中，它们在语法细节和性能表现上存在诸多差异。了解这些差异，对于开发者根据具体业务场景选择合适的工具至关重要。语法差异数据定义语言（DDL）表创建语法Hive：在Hive中创建表时，需要详细
在 Linux 上使用 Docker 部署 Spring Boot 项目 ( •̀∀•́ )920 linux docker spring boot
目录1.准备工作1.1SpringBoot项目打包1.2安装Docker2.编写Dockerfile3.构建Docker镜像4.运行Docker容器5.使用DockerCompose（可选）5.1安装DockerCompose5.2编写`docker-compose.yml`5.3启动DockerCompose6.常用管理命令7.高级配置（可选）7.1设置时区7.2使用多阶段构建减少镜像体积8.验
Linux下的socket编程学习（TCP）小苏同学的脱发日记 linux 学习 tcp/ip
1.什么是socket？socket的英文翻译就是接口，插座的意思，很形象，就相当于将2台电脑用一根线连起来，线的两头插在不同的电脑上，借此实现通讯的功能。两台电脑通信，实际上是这两台电脑上的某个进程在进行通信。而两个进程进行通信，实际上是往同一个文件中读取数据。2.TCP/IP（3次握手）在tcp/ip协议中，tcp通过三次握手建立起一个tcp的链接，大致如下第一次握手：客户端尝试连接服务器，向
linux UDP/TCP socket 编程守护安静星空 linux应用编程 udp linux tcp/ip 网络 websocket
UDP编程：使用socket创建描述符绑定bind本地ip地址端口使用recvfrom接收数据使用sendto发送数据关闭描述符close(fd)#include"stdio.h"#include#include/*SeeNOTES*/#include#include#include#include"string.h"charbuffer[256];intmain(intargc,char*arg
【实操回顾】基于Apache SeaTunnel从MySQL同步到PostgreSQL——Demo方舟计划 SeaTunnel apache mysql postgresql
文章作者：马全才奥克斯集团大数据工程师编辑整理：国电南自赵鸿辉白鲸开源曾辉本文详细演示了如何通过ApacheSeaTunnel2.3.9实现**MySQL**到PostgreSQL的全量数据同步。非常感谢马全才老师花费业余时间为大家演示制作的Demo，也欢迎更多朋友贡献自己熟悉的同步场景，详细请参考社区Demo方舟活动：https://mp.weixin.qq.com/s/5gpiZZ0-8a4I
Flink 初体验：从 Hello World 到实时数据流处理小诸葛IT课堂 flink 大数据
在大数据处理领域，ApacheFlink以其卓越的流批一体化处理能力脱颖而出，成为众多企业构建实时数据应用的首选框架。本文将带领你迈出Flink学习的第一步，从基础概念入手，逐步引导你编写并运行第一个Flink程序——经典的WordCount，让你亲身感受Flink在实时数据流处理方面的强大魅力。一、Flink基础概念速览1.1什么是FlinkFlink是一个分布式流批一体化开源平台，旨在对无界和
QT：文件读取 Yanjun2i qt 开发语言
问题：在文件读取，判断md5值时，遇到py文件读取转String后，再转byte，md5前后不一致问题。解决方法：python文件读取要使用QTextStream，避免\t、\r、\n的换行符跨平台问题（window系统换行符和linux换行符不一致）。QTextStream默认帮你处理了换行符跨平台问题。\r：回到开头\n：换行一般读取文件的方式是：boolxxxxClass::readFile
shell 知识点1 测试linux服务器之间ip和端口是否畅通 tigercat920 shell linux tcp/ip 服务器
运维工作中，可能会涉及新添加的服务器或者已有服务器之间的网络防火墙不通的情况，但是有的服务器可能已经开通了，有的没有开通，如果一个个去排查就比较麻烦，这个时候我们可以借助于下面这段shell脚本批量探测，并将结果输出；#!/bin/baship="192.168.1.1"#替换为你要检查的IP地址port="80"#替换为你要检查的端口号timeout=3#设置超时时间（秒）foriin`cat/
大数据开发之Kubernetes篇----安装部署Kubernetes&dashboard 豆豆总 kubernetes
Kubernetes简介由于公司有需要，需要将外后的服务外加Tensorflow模型部署加训练全部集成到k8s上，所以特意记录下这次简单部署的过程。k8s安装部署首先，我们在部署任何大型的组件前都必须要做的事情就是关闭防火墙和设置hostname了vi/etc/hostsk8s001xxx.xxx.xxx.xxk8s002xxx.xxx.xxx.xx...systemctlstopfirewall
Go 学习笔记整合进击的程序猿~ GO 容器技术数据库 golang 学习 docker 1024程序员节
包括go语言基础、Linux基础、docker、kubernetes、中间件、NoSQL等等。go语言基础：Golang基本数据结构：https://blog.csdn.net/qq_41822345/article/details/125350205Golang高级数据结构：https://blog.csdn.net/qq_41822345/article/details/125475150Go
Ubuntu 将更改版本规则，使用最新内核发布发行版 CIb0la 树莓派运维程序人生 ubuntu linux
众所周知，Canonical开发的Ubuntu发行版每半年发布一个新版本，而Linux内核却是大约每2-3个月发布一个新版本。这导致一个问题，Ubuntu发行版永远使用的不是最新内核。因为按照Ubuntu的开发周期，Ubuntu开发阶段选择使用的版本到正式发布时肯定已经落后于上游的最新稳定版本。现在CanonicalKernelTeam(CKT)宣布将改变内核选择方法，即在发布冻结日期时采用最新可
基于oracle linux的 DBI/DBD 标准化安装文档(六) oracle
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
linux sql*loader 500,SQL Loader Error 510 SQL*Loader-510: Physical record in data file is larger 带你游美国 linux sql*loader 500
IamattemptingtoloaddataintoanOracledatabasetable(Oracle11gR2)usingsqlloader.Iamabletoloadatestfileof1millionrecordsthatwassentfromourleadcompanyusingthecontrolfileshownbelow.However,whentheysenttheact
linux操作速查程序员小软 linux 运维 linux 服务器运维
功能创建新用户并赋予root权限切记在root身份下操作查看用户列表cat/etc/passwd创建新用户useradd为账户设置密码passwd赋予root权限编辑/etc/sudoers文件添加一行ALL=(ALL)ALL验证sudo-l#查看当前用户可使用的命令，仅限root用户可用sudo-i#命令切换到root权限问题处理处理端口被占用：netstat-ano|find“80”//列出端
ubuntu20.04安装Nvidia 3070驱动种豆得瓜er ubuntu20.04 ubantu20.04 nvidia
台式机显卡3070驱动下载地址NVIDIA-驱动下载sudo./NVIDIA-Linux-x86_64-xxx.run-no-x-check-no-nouveau-check-no-opengl-files其中：-no-x-check：安装驱动时关闭X服务-no-nouveau-check：安装驱动时禁用nouveau-no-opengl-files：只安装驱动文件，不安装OpenGL文件。为避免
毕设分享大数据B站数据分析可视化系统 bee_dc 毕业设计毕设大数据
文章目录0前言1项目运行效果2设计原理数据处理方案可视化呈现方案综合得分计算指标综合得分漏斗图游客画像完成度三连排行榜点赞、投币、收藏与白嫖的比例分析3最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天
毕业设计项目大数据B站数据分析可视化系统 bee_dc 毕业设计毕设大数据
文章目录0前言1项目运行效果2设计原理数据处理方案可视化呈现方案综合得分计算指标综合得分漏斗图游客画像完成度三连排行榜点赞、投币、收藏与白嫖的比例分析3最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天
docker 安装使用（ubuntu）临街的小孩 docker ubuntu 容器
安装#配置源curl-fsSLhttps://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg|sudoapt-keyadd-#安装阿里云gpg证书cd/etc/apt/sources.list.d#在指定目录下新建docker.list文件，添加阿里云镜像源sudotouchdocker.listsudochmod666docker.listsudoec
linux下消息队列详解 zy20150613 linux linux 消息队列
消息队列提供了从一个进程向另外一个进程发送一块数据的方法，每个数据块认为有一个类型（通俗说法是一个通道），但是接受通道与发送通道必须一致才能实现通信。消息队列的不足之处在于每个消息最大长度有限度，每个消息队列总字节数有限制，系统的消息队列有限制。命令：cat/proc/sys/kernel/msgmax：查看一条信息最大有多大cat/proc/sys/kernel/msgmnb：查看消息队列中信息
安装Docker Desktop报错WSL 2 installation is incomplete(实操教程) By北阳 docker 容器运维
点击运行提示WSL2安装不完整问题描述：WSL2installationisincomplete.TheWSL2LinuxkernelisnowinstalledusingaseparateMSlupdatepackage.Pleaseclickthelinkandfollowtheinstructionstoinstallthekernelupdate:https://aka.ms/wsl2ke
python数据可视化玩转Matplotlib subplot子图操作，四个子图（一包四），三个子图，子图拉伸_python subplot 2401_83817843 程序员 python 信息可视化 matplotlib
大锤爱编程的博客_CSDN博客-大数据,Go,数据分析领域博主Matplotlib是一个流行的Python可视化库，它提供了许多功能来创建各种类型的图表。其中一个功能是子图，它允许您在单个图表中绘制多个图。一、创建子图要创建子图，请使用plt.subplots()函数。该函数接受三个参数：行数、列数和子图编号。以下是一个简单的示例：importmatplotlib.pyplotaspltfig,a
深入解析Linux进程调度器-CPU负载 Linux内核站 linux 运维服务器 Linux内核 CPU负载
说明：Kernel版本：4.14ARM64处理器，Contex-A53，双核使用工具：SourceInsight3.5，Visio1.概述CPU负载（cpuload）指的是某个时间点进程对系统产生的压力。来张图来类比下（参考UnderstandingLinuxCPULoad）CPU的运行能力，就如大桥的通行能力，分别有满负荷，非满负荷，超负荷等状态，这几种状态对应不同的cpuload值；单CPU满
Linux内核--进程管理(十一)多核下的负载均衡文艺小少年 CPU性能分析与操作系统的构建 linux 负载均衡运维
目录一、引言二、调度机制介绍------>2.1、线程的多核运行------>2.2、RT进程多核负载均衡------>2.3、普通进程多核负载均衡------>2.4、设置CPUtaskaffinity三、中断负载均衡、RPS软中断负载均衡四、linux非实时系统------>4.1、优化措施一、引言本文延续前一章的内容，介绍调度器的其他内容：关于多核、分群、硬实时二、多核下的负载均衡tips:
Linux企业实战-----LVS+keepalived负载均衡集群 Yang5208 linux 负载均衡运维
用LVS实现负载均衡实现步骤：#若在虚拟环境中需执行此步骤创建两个新的虚拟机，VMWARE可忽略此步骤真实主机:cd/var/lib/libvirt/images/lsqemu-imgcreate-fqcow2-brhel7.6.qcow2server3qemu-imgcreate-fqcow2-brhel7.6.qcow2server4server1:pcsclusterdisable--all
031-Linux 网络诊断工具 nmap：网络扫描与漏洞检测程序员--青青 python 网络开发语言 gaussdb 服务器
031-Linux网络诊断工具nmap：网络扫描与漏洞检测在网络安全管理和故障排除中，网络扫描是一个非常重要的过程。它能够帮助发现网络中可能存在的漏洞、未授权的服务或设备等问题。nmap（NetworkMapper）是Linux系统中常用的一个强大工具，专门用于网络扫描、端口检测、服务识别以及漏洞检测等任务。本文将介绍nmap的基本功能及其常用用法，帮助你更好地进行网络诊断和安全分析。1.nmap
【linux 内存管理】mmap.c文件代码分析do_mmap() 和 do_mmap_pgoff() ElisabethSissi leetcode c++linux
mmap.c文件代码分析do_mmap和do_mmap_pgoff当某个程序的映像开始执行时，可执行映像必须装入到进程的虚拟地址空间。如果该进程用到了任何一个共享库，则共享库也必须装入到进程的虚拟地址空间。由此可看出，Linux并不将映像装入到物理内存，相反，可执行文件只是被连接到进程的虚拟地址空间中。随着程序的运行，被引用的程序部分会由操作系统装入到物理内存，这种将映像链接到进程地址空间的方法被
基于oracle linux的 DBI/DBD 标准化安装文档(二) 文档
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
Python中使用vlc库实现视频播放功能小白教程 python python 音视频开发语言 Python视频播放功能 Python中使用vlc库 vlc视频播放
文章目录前言1.环境准备1.1Python安装1.2选择Python开发环境1.3安装必要库2.基础播放示例3.常用播放控制功能4.事件监听5.播放网络流媒体6.结合GUI库制作视频播放器（以Tkinter为例）前言本教程主要包含打开文件、播放和停止按钮，能够实现基本的视频播放控制功能。1.环境准备1.1Python安装访问Python官方网站，根据你的操作系统（Windows、Mac或Linux
实战篇：GBase 8a MPP Cluster 安装部署过程 Lucifer三思而后行 DBA 实战系列数据库 gbase cluster
目录前言☀️环境准备安装介质下载操作系统安装安装前准备1、关闭防火墙2、禁用Selinux3、创建gbase用户4、创建目录并授权5、重启主机❤️GBase8aMPPCluster安装主节点上传安装介质主节点解压安装包分发配置文件配置环境变量修改主节点安装配置文件主节点执行安装命令检查集群状态申请和导入授权①导出集群各节点的指纹信息②邮件申请授权③主节点导入授权④检查授权情况所有节点启动集群服务主
Linux losetup循环设备小米人er 我的博客 losetup linux nuttx
好的，以下是命令的中文解释和使用步骤：命令解释：losetup-r/dev/loop0/system/app.bin：losetup是一个用于将文件与循环设备（loopdevice）关联的命令。-r选项表示将循环设备设置为只读模式。/dev/loop0是使用的循环设备。/system/app.bin是要与循环设备关联的文件。这条命令的作用是将/system/app.bin文件的内容通过/dev/l
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/

Hadoop入门(八)——本地运行模式+完全分布模式案例详解，实现WordCount和集群分发脚本xsync快速配置环境变量 （图文详解步骤2021）

Hadoop入门(八)——本地运行模式+完全分布模式案例详解，实现WordCount和集群分发脚本xsync快速配置环境变量 （图文详解步骤2021）

系列文章传送门

文章目录

Hadoop 运行模式

本地运行模式 （官方 WordCount案例 ）

1 ） 创建在 hadoop-3.1.3 文件下面创建一个 wcinput 文件夹

2 ） 在 wcinput 文件下创建一个 word.txt 文件

3 ） 编辑 word.txt 文件

4 ） 回到 Hadoop 目录/opt/module/hadoop-3.1.3

5 ） 执行程序

6 ） 查看结果

完全分布式 运行模式 （重点）

虚拟机准备

编写集群分发脚本 xsync

1 ）scp （secure copy ） 安全 拷贝

（a）在 hadoop102 上，将 hadoop102 中/opt/module/jdk1.8.0_212 目录拷贝到hadoop103 上。

（b）在 hadoop103 上，将 hadoop102 中/opt/module/hadoop-3.1.3 目录拷贝到hadoop103 上。

（c）在 hadoop103 上操作，将 hadoop102 中/opt/module 目录下所有目录拷贝到hadoop104 上。

题外话——小Tip

2 ）rsync 远程同步工具

（a）删除 hadoop103 中/opt/module/hadoop-3.1.3/wcinput

（b）同步 hadoop102 中的/opt/module/hadoop-3.1.3 到 hadoop103

3 ）xsync 集群分发 脚本

（a）在/home/leokadia/bin 目录下创建 xsync 文件

（b）修改脚本 xsync 具有执行权限

（c）测试脚本

（d）将脚本复制到/bin 中，以便全局调用

（e）同步环境变量配置（root 所有者）

注意：让环境变量生效

你可能感兴趣的:(大数据应用,linux,hadoop,大数据)

Hadoop入门(八)——本地运行模式+完全分布模式案例详解，实现WordCount和集群分发脚本xsync快速配置环境变量（图文详解步骤2021）

Hadoop入门(八)——本地运行模式+完全分布模式案例详解，实现WordCount和集群分发脚本xsync快速配置环境变量（图文详解步骤2021）

本地运行模式（官方 WordCount案例）

1 ）创建在 hadoop-3.1.3 文件下面创建一个 wcinput 文件夹

2 ）在 wcinput 文件下创建一个 word.txt 文件

3 ）编辑 word.txt 文件

4 ）回到 Hadoop 目录/opt/module/hadoop-3.1.3

5 ）执行程序

6 ）查看结果

完全分布式运行模式（重点）

1 ）scp （secure copy ）安全拷贝

3 ）xsync 集群分发脚本

（a）在`/home/leokadia/bin` 目录下创建 xsync 文件