peng.li

hadoop完全分布式集群搭建

序：相关软件

一、前期准备

二、jdk，hadoop安装、配置

2.1、jdk、hadoop安装

2.2、配置jdk、hadoop环境变量

三、编写集群分发脚本，完成其他服务器的jdk、hadoop安装与配置

四、集群配置规划

五、完全分布式属性配置

5.1、core-site.xml

5.2、hdfs-site.xml

5.3、yarn-site.xml

5.4、mapred-site.xml

5.5、workers

5.6、集群配置同步

六、ssh无密登录配置

七、集群启动和停止脚本编写及测试

7.1、官方启动脚本

7.2、自定义启动脚本

7.3、自定义进程查询脚本

7.4、测试。

八、web端访问

8.1、hdfs信息查询：hadoop102:9780

8.2、yarn信息查询：hadoop103:8088

8.3、历史服务器查询：hadoop102：19888

序：相关软件

VMware：VMware-15.5.1
Linux：CentOS-7.5-x86_64-DVD-1804.iso
JDK:jdk-8u212-linux-x64.tar.gz
Hadoop：hadoop-3.1.3.tar.gz
xshell
xftp

一、前期准备

准备三台服务器
服务器静态ip创建
服务器关闭防火墙
服务器创建新用户user，给user root权限
在/opt/目录下创建两个目录：module,software，并将module、software目录转给user
配置好xshell远程访问

二、jdk，hadoop安装、配置

操作思想：以hadoop102为主操作服务器，完成软件安装及配置再分发到集群其他服务器

2.1、jdk、hadoop安装

文件从本地传输到服务器：使用软件xshell，xftp。软件存放位置：/opt/software/。完成后在服务器上查看。

[atguigu@hadoop102 software]$ pwd
/opt/software
[atguigu@hadoop102 software]$ ll
总用量 520608
-rw-rw-r--. 1 user user 338075860 5月  15 21:45 hadoop-3.1.3.tar.gz
-rw-rw-r--. 1 user user 195013152 5月  15 21:45 jdk-8u212-linux-x64.tar.gz

jdk、hadoop软件解压（解压后就可使用，无需安装），解压位置：/opt/module/。完成后服务器查看。

tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/module/
tar -zxvf hadoop-3.1.3.tar.gz -C /opt/module/

[user@hadoop102 module]$ pwd
/opt/module
[user@hadoop102 module]$ ll
总用量 8
drwxr-xr-x. 11 user user 4096 5月  15 23:52 hadoop-3.1.3
drwxr-xr-x.  7 user user 4096 4月   2 2019 jdk1.8.0_212

2.2、配置jdk、hadoop环境变量

在/etc/profile.d/目录下，创建环境变量配置文件,文件名为：my_env.sh，文件内容如下：

#JAVA_HOME
JAVA_HOME=/opt/module/jdk1.8.0_212
#HADOOP_HOME
HADOOP_HOME=/opt/module/hadoop-3.1.3
PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export PATH JAVA_HOME HADOOP_HOME

配置/opt/module/hadoop 3.1.3/etc/hadoop/hadoop-env.sh

# The java implementation to use. By default, this environment
# variable is REQUIRED on ALL platforms except OS X!
# export JAVA_HOME=
# 增加以下内容
export JAVA_HOME=/opt/module/jdk1.8.0_212

三、编写集群分发脚本，完成其他服务器的jdk、hadoop安装与配置

shell脚本编写，脚本存放位置为：/home/user/bin/。此路径在系统path中，故可以在任意位置执行脚本。脚本名xsync，脚本完成后，需给当前用户增加操作权限。

#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
then
  echo Not Enough Arguement!
  exit;
fi
#2. 遍历集群所有机器
for host in hadoop102 hadoop103 hadoop104
do
  echo ====================  $host  ====================
  #3. 遍历所有目录，挨个发送
  for file in $@
  do
    #4 判断文件是否存在
    if [ -e $file ]
    then
      #5. 获取父目录
      pdir=$(cd -P $(dirname $file); pwd)
      #6. 获取当前文件的名称
      fname=$(basename $file)
      ssh $host "mkdir -p $pdir"
      rsync -av $pdir/$fname $host:$pdir
    else
      echo $file does not exists!
    fi
  done
done

jdk、hadoop及属性文件集群同步

xsync /opt/module/*
xsync /etc/profile.d/my_env.sh

在集群其他服务器上重新加载下系统配置，将jdk、hadoop环境变量加载，并测试是否成功。

source /etc/profile

[user@hadoop103 module]$ java -version
java version "1.8.0_212"
Java(TM) SE Runtime Environment (build 1.8.0_212-b10)
Java HotSpot(TM) 64-Bit Server VM (build 25.212-b10, mixed mod

[user@hadoop102 module]$ hadoop version
Hadoop 3.1.3
Source code repository https://gitbox.apache.org/repos/asf/hadoop.git -r ba631c436b806728f8ec2f54ab1e289526c90579
Compiled by ztang on 2019-09-12T02:47Z
Compiled with protoc 2.5.0
From source with checksum ec785077c385118ac91aadde5ec9799
This command was run using /opt/module/hadoop-3.1.3/share/hadoop/common/hadoop-common-3.1.3.jar

至此，hadoop103、hadoop104的jdk、hadoop安装与环境变量配置完成。

四、集群配置规划

由于只有三台服务器，在完全分布式运行环境中，namenode，resoucemanager，secondarynamenode的资源占比较大，故在配置时，将三者分别布置在不同的服务器上。datanode和nodemanager在三个服务器上都进行配置。具体如下：

*集群配置规划*
hadoop102	namenode	datanode	nodemanager
hadoop103	resourcemanager	datanode	nodemanager
hadoop104	secondarynamenode	datanode	nodemanager

需配置文件位置:/opt/module/hadoop3.1.3/etc/hadoop/。需要配置的文件如下：

core-site.xml
hdfs-site.xml
yarn-site.xml
mapred-site.xml

五、完全分布式属性配置

5.1、core-site.xml


        
        
                fs.defaultFS
                hdfs://hadoop102:9820
        

        
        
                hadoop.data.dir
                /opt/module/hadoop-3.1.3/data

5.2、hdfs-site.xml


        
        
                dfs.namenode.name.dir
                file://${hadoop.data.dir}/name
        

        
        
                dfs.datanode.data.dir
                file://${hadoop.data.dir}/data
        

        
        
                dfs.namenode.checkpoint.dir
                file://${hadoop.data.dir}/namesecondary
        

        
        
                dfs.replication
                3
        

        
        
                dfs.client.datanode-restart.timeout
                30s
        

        
        
                dfs.namenode.http-address
                hadoop102:9870
        

        
        
                dfs.namenode.secondary.http-address
                hadoop104:9868

5.3、yarn-site.xml


        
        
                yarn.nodemanager.vmem-check-enabled
                false
        

        
        
                yarn.nodemanager.aux-services
                mapreduce_shuffle
        

        
        
                yarn.resourcemanager.hostname
                hadoop103
        

        
        
                yarn.nodemanager.env-whitelist                     
JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,
CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME
        

        
        
                yarn.log-aggregation-enable
                true
        

        
          
                yarn.log.server.url  
                http://hadoop102:19888/jobhistory/logs  
         

         
        
                yarn.log-aggregation.retain-seconds
                604800

5.4、mapred-site.xml


        
        
                mapreduce.framework.name
                yarn
        

        
        
                mapreduce.jobhistory.address
                hadoop102:10020
        

        
        
                mapreduce.jobhistory.webapp.address
                hadoop102:19888

5.5、 workers

vim /opt/module/hadoop-3.1.3/etc/hadoop/workers

删除原内容，并在该文件中增加如下内容。注意：文件中添加的内容结尾不允许有空格，文件中不允许有空行。

hadoop102
hadoop103
hadoop104

5.6、集群配置同步

按照以上配置进行，具体每条配置的作用已经注释，如有其它的配置要求，可再添加。所有配置完成后进行集群属性同步。使用先前编写的集群同步脚本xsync。

xsync /opt/module/hadoop-3.1.3/etc/hadoop/*

六、ssh无密登录配置

小伙伴在进行集群数据同步时，是否存在每往一台服务器上传输数据，从需要进行确认及密码登录，是否特别不变，想想若是上千节点，不光记不住，更是输到手抽筋。下边就给大家演示下如何实现无密登录。

无密登录的原理是在一个服务器上创建一对秘钥，分别为公钥，私钥。私钥放在自己的服务器，公钥放到你想免密登录的服务器。如此，当你想要登录该服务器时，会进行公钥和私钥的配对，配对成功即可免密登录。具体实现方式为，输入以下命令，回车4次即可。其他服务器也需要进行相同操作。

ssh-keygen -t rsa

Generating public/private rsa key pair.
Enter file in which to save the key (/home/atguigu/.ssh/id_rsa): 
Enter passphrase (empty for no passphrase): 
Enter same passphrase again: 
Your identification has been saved in /home/atguigu/.ssh/id_rsa.
Your public key has been saved in /home/atguigu/.ssh/id_rsa.pub.
The key fingerprint is:
SHA256:rksrZWaYPgfTY6s509NKQGRwZrGDeMCYmrWjQ19L+gQ atguigu@hadoop101
The key's randomart image is:
+---[RSA 2048]----+
|+...B.           |
|o+.B .           |
|ooo.+            |
|oooE +           |
|....*+. S        |
|o  o=+O.         |
| . .oXo+.        |
|    *==o.        |
|    oB=+         |
+----[SHA256]-----+

集群公钥的传输到免密登录的服务器上，传输完成后可在各服务器上查看秘钥情况。秘钥位置：~/.ssh(隐藏文件，需ls -a）

ssh-copy-id hadoop102
ssh-copy-id hadoop103
ssh-copy-id hadoop104

[user@hadoop102 ~]$ cd .ssh
[user@hadoop102 .ssh]$ ll
总用量 16
-rw-------. 1 user user 1197 5月  16 10:10 authorized_keys
-rw-------. 1 user user 1679 5月  16 10:06 id_rsa
-rw-r--r--. 1 user user  399 5月  16 10:06 id_rsa.pub
-rw-r--r--. 1 user user  561 5月  15 22:23 known_hosts

文件解释

known_hosts	记录ssh访问过计算机的公钥(public key)
id_rsa	生成的私钥
id_rsa.pub	生成的公钥
authorized_keys	存放授权过的无密登录服务器公钥

完成以上配置，再进行集群文件同步时，就可以实现无密登录。

七、集群启动和停止脚本编写及测试

7.1、官方启动脚本

在hadoop的官方文件中内置了集群启动的脚本，脚本位置为：/opt/module/hadoop 3.1.3/sbin/。

hadoop自带集群启动脚本
start-all.sh	启动集群所有模块
stop-all.sh	关闭集群所有模块
start-dfs.sh	启动dnfs存储模块
stop-dfs.sh	关闭dnfs存储模块
start-yarn.sh	启动集群资源管理及配置模块
stop-yarn.sh	关闭集群资源管理及配置模块

-rwxr-xr-x. 1 user user 2221 9月  12 2019 start-all.sh
-rwxr-xr-x. 1 user user 5170 9月  12 2019 start-dfs.sh
-rwxr-xr-x. 1 user user 3342 9月  12 2019 start-yarn.sh
-rwxr-xr-x. 1 user user 2166 9月  12 2019 stop-all.sh
-rwxr-xr-x. 1 user user 3898 9月  12 2019 stop-dfs.sh
-rwxr-xr-x. 1 user user 3083 9月  12 2019 stop-yarn.sh

7.2、自定义启动脚本

当然，大家可以选择自带脚本进行启停，也可以自己编写脚本，有脚本的话会更加灵活，选择自己需要的模块开启。不论采取哪种方式，要注意的是start-dfs.sh \stop-dfs.sh只能在布置namenode的服务器上启停；start-yarn.sh\stop-yarn.sh只能在布置resourcemanager的服务器上启停。以下是一个实现启停dnfs、yarn、历史服务器和日志的脚本。脚本名mycluster，位置：/home/user/bin/。

#!/bin/bash

if [ $# -lt 1 ]
then
echo "NO PARAMETER INPUT"
fi

case $1 in
"start")

echo "-----------------------start hdfs--------------------------"
ssh hadoop102 /opt/module/hadoop-3.1.3/sbin/start-dfs.sh

echo "-----------------------start yarn--------------------------"
ssh hadoop103 /opt/module/hadoop-3.1.3/sbin/start-yarn.sh

echo "------------------start historyserver----------------------"
ssh hadoop102 /opt/module/hadoop-3.1.3/bin/mapred --daemon start historyserver
;;
"stop")
echo "-----------------------stop yarn---------------------------"
ssh hadoop103 /opt/module/hadoop-3.1.3/sbin/stop-yarn.sh

echo "------------------stop historyserver-----------------------"
ssh hadoop102 /opt/module/hadoop-3.1.3/bin/mapred --daemon stop historyserver

echo "-----------------------stop hdfs---------------------------"
ssh hadoop102 /opt/module/hadoop-3.1.3/sbin/stop-dfs.sh
;;
*)
echo "input parameter error"
;;
esac

7.3、自定义进程查询脚本

为了方便在启动后快速查询进程，需要编写一个进程查询脚本，脚本名：myjps。位置：/home/user/bin。给当前用户增加执行权限。脚本内容如下：

#!/bin/bash
for i in hadoop102 hadoop103 hadoop104
do
echo "--------------------$i jps----------------------"
ssh $i /opt/module/jdk1.8.0_212/bin/jps
done

7.4、测试。

输入mycluster+ 参数（start、stop）

mycluster start
-----------------------start hdfs--------------------------
Starting namenodes on [hadoop102]
Starting datanodes
Starting secondary namenodes [hadoop104]
-----------------------start yarn--------------------------
Starting resourcemanager
Starting nodemanagers
------------------start historyserver----------------------

输入myjps 查询进程，与第四节的集群配置比较，确认是否启动成功。

myjps
--------------------hadoop102 jps----------------------
4737 NameNode
5347 JobHistoryServer
4901 DataNode
5480 Jps
5212 NodeManager
--------------------hadoop103 jps----------------------
13249 NodeManager
12914 DataNode
13652 Jps
13110 ResourceManager
--------------------hadoop104 jps----------------------
7617 SecondaryNameNode
7527 DataNode
7916 Jps
7741 NodeManager

关闭集群。命令：mycluster stop

mycluster stop
-----------------------stop yarn---------------------------
Stopping nodemanagers
Stopping resourcemanager
------------------stop historyserver-----------------------
-----------------------stop hdfs---------------------------
Stopping namenodes on [hadoop102]
Stopping datanodes
Stopping secondary namenodes [hadoop104]

八、web端访问

8.1、hdfs信息查询：hadoop102:9780

8.2、yarn信息查询：hadoop103:8088

8.3、历史服务器查询：hadoop102：19888

linux操作速查程序员小软 linux 运维 linux 服务器运维
功能创建新用户并赋予root权限切记在root身份下操作查看用户列表cat/etc/passwd创建新用户useradd为账户设置密码passwd赋予root权限编辑/etc/sudoers文件添加一行ALL=(ALL)ALL验证sudo-l#查看当前用户可使用的命令，仅限root用户可用sudo-i#命令切换到root权限问题处理处理端口被占用：netstat-ano|find“80”//列出端
ubuntu20.04安装Nvidia 3070驱动种豆得瓜er ubuntu20.04 ubantu20.04 nvidia
台式机显卡3070驱动下载地址NVIDIA-驱动下载sudo./NVIDIA-Linux-x86_64-xxx.run-no-x-check-no-nouveau-check-no-opengl-files其中：-no-x-check：安装驱动时关闭X服务-no-nouveau-check：安装驱动时禁用nouveau-no-opengl-files：只安装驱动文件，不安装OpenGL文件。为避免
RPC远程调用框架Dubbo Czi橙 rpc dubbo 网络协议 java nacos springcloud 微服务
一、分布式服务调用_什么是RPCRPC(RemoteProcedureCall)远程过程调用，它是一种通过网络从远程计算机程序上请求服务。大白话理解就是：RPC让你用别人家的东西就像自己家的一样。RPC两个作用：屏蔽远程调用跟本地调用的区别，让我们感觉就是调用项目内的方法隐藏底层网络通信的复杂性，让我们更加专注业务逻辑。常用的RPC框架RPC是一种技术思想而非一种规范或协议。常见RPC技术和框架：
毕设分享大数据B站数据分析可视化系统 bee_dc 毕业设计毕设大数据
文章目录0前言1项目运行效果2设计原理数据处理方案可视化呈现方案综合得分计算指标综合得分漏斗图游客画像完成度三连排行榜点赞、投币、收藏与白嫖的比例分析3最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天
毕业设计项目大数据B站数据分析可视化系统 bee_dc 毕业设计毕设大数据
文章目录0前言1项目运行效果2设计原理数据处理方案可视化呈现方案综合得分计算指标综合得分漏斗图游客画像完成度三连排行榜点赞、投币、收藏与白嫖的比例分析3最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天
docker 安装使用（ubuntu）临街的小孩 docker ubuntu 容器
安装#配置源curl-fsSLhttps://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg|sudoapt-keyadd-#安装阿里云gpg证书cd/etc/apt/sources.list.d#在指定目录下新建docker.list文件，添加阿里云镜像源sudotouchdocker.listsudochmod666docker.listsudoec
服务远程调用（RPC）架构及原理小小工匠【Simple RPC】rpc 架构网络协议
文章目录引言一、RPC架构与核心组件二、RPC调用流程解析三、关键技术实现1.网络通信协议2.序列化与反序列化四、RPC框架核心特性引言SimpleRPC在分布式系统中，服务远程调用（RPC）是系统解耦与可扩展性的核心技术。它通过屏蔽底层通信细节，让开发者像调用本地函数一样使用远程服务。接下来我们将深入解析RPC的核心架构、通信流程及关键特性。一、RPC架构与核心组件RPC架构分为五个核心模块，各
linux下消息队列详解 zy20150613 linux linux 消息队列
消息队列提供了从一个进程向另外一个进程发送一块数据的方法，每个数据块认为有一个类型（通俗说法是一个通道），但是接受通道与发送通道必须一致才能实现通信。消息队列的不足之处在于每个消息最大长度有限度，每个消息队列总字节数有限制，系统的消息队列有限制。命令：cat/proc/sys/kernel/msgmax：查看一条信息最大有多大cat/proc/sys/kernel/msgmnb：查看消息队列中信息
安装Docker Desktop报错WSL 2 installation is incomplete(实操教程) By北阳 docker 容器运维
点击运行提示WSL2安装不完整问题描述：WSL2installationisincomplete.TheWSL2LinuxkernelisnowinstalledusingaseparateMSlupdatepackage.Pleaseclickthelinkandfollowtheinstructionstoinstallthekernelupdate:https://aka.ms/wsl2ke
基于MapReduce的气候数据分析赵谨言论文毕业设计经验分享
标题:基于MapReduce的气候数据分析内容:1.摘要本文聚焦于基于MapReduce的气候数据分析。背景在于随着全球气候变化问题日益严峻，海量气候数据的高效处理和分析成为关键。目的是利用MapReduce技术对气候数据进行有效挖掘，以揭示气候变化规律和趋势。方法上，采用MapReduce编程模型对大规模气候数据进行分布式处理，通过数据的映射和归约操作实现并行计算。结果表明，运用该技术能显著提高
python数据可视化玩转Matplotlib subplot子图操作，四个子图（一包四），三个子图，子图拉伸_python subplot 2401_83817843 程序员 python 信息可视化 matplotlib
大锤爱编程的博客_CSDN博客-大数据,Go,数据分析领域博主Matplotlib是一个流行的Python可视化库，它提供了许多功能来创建各种类型的图表。其中一个功能是子图，它允许您在单个图表中绘制多个图。一、创建子图要创建子图，请使用plt.subplots()函数。该函数接受三个参数：行数、列数和子图编号。以下是一个简单的示例：importmatplotlib.pyplotaspltfig,a
Go语言 vs Java语言：核心差异与适用场景解析 By北阳 golang java 开发语言
在当今的软件开发领域，Go（Golang）和Java都是备受关注的后端开发语言。尽管二者都能构建高性能服务，但它们在设计哲学、语法特性和应用场景上存在显著差异。本文将从多个维度对比这两种语言，帮助开发者更好地理解它们的优缺点，并为技术选型提供参考。一、设计哲学与语言定位1.Go语言定位：专为高并发、分布式系统设计，强调简洁性和高效性。特点：语法简单，学习曲线平缓。静态编译为单一二进制文件，部署便捷
深入解析Linux进程调度器-CPU负载 Linux内核站 linux 运维服务器 Linux内核 CPU负载
说明：Kernel版本：4.14ARM64处理器，Contex-A53，双核使用工具：SourceInsight3.5，Visio1.概述CPU负载（cpuload）指的是某个时间点进程对系统产生的压力。来张图来类比下（参考UnderstandingLinuxCPULoad）CPU的运行能力，就如大桥的通行能力，分别有满负荷，非满负荷，超负荷等状态，这几种状态对应不同的cpuload值；单CPU满
Linux内核--进程管理(十一)多核下的负载均衡文艺小少年 CPU性能分析与操作系统的构建 linux 负载均衡运维
目录一、引言二、调度机制介绍------>2.1、线程的多核运行------>2.2、RT进程多核负载均衡------>2.3、普通进程多核负载均衡------>2.4、设置CPUtaskaffinity三、中断负载均衡、RPS软中断负载均衡四、linux非实时系统------>4.1、优化措施一、引言本文延续前一章的内容，介绍调度器的其他内容：关于多核、分群、硬实时二、多核下的负载均衡tips:
Linux企业实战-----LVS+keepalived负载均衡集群 Yang5208 linux 负载均衡运维
用LVS实现负载均衡实现步骤：#若在虚拟环境中需执行此步骤创建两个新的虚拟机，VMWARE可忽略此步骤真实主机:cd/var/lib/libvirt/images/lsqemu-imgcreate-fqcow2-brhel7.6.qcow2server3qemu-imgcreate-fqcow2-brhel7.6.qcow2server4server1:pcsclusterdisable--all
031-Linux 网络诊断工具 nmap：网络扫描与漏洞检测程序员--青青 python 网络开发语言 gaussdb 服务器
031-Linux网络诊断工具nmap：网络扫描与漏洞检测在网络安全管理和故障排除中，网络扫描是一个非常重要的过程。它能够帮助发现网络中可能存在的漏洞、未授权的服务或设备等问题。nmap（NetworkMapper）是Linux系统中常用的一个强大工具，专门用于网络扫描、端口检测、服务识别以及漏洞检测等任务。本文将介绍nmap的基本功能及其常用用法，帮助你更好地进行网络诊断和安全分析。1.nmap
【linux 内存管理】mmap.c文件代码分析do_mmap() 和 do_mmap_pgoff() ElisabethSissi leetcode c++linux
mmap.c文件代码分析do_mmap和do_mmap_pgoff当某个程序的映像开始执行时，可执行映像必须装入到进程的虚拟地址空间。如果该进程用到了任何一个共享库，则共享库也必须装入到进程的虚拟地址空间。由此可看出，Linux并不将映像装入到物理内存，相反，可执行文件只是被连接到进程的虚拟地址空间中。随着程序的运行，被引用的程序部分会由操作系统装入到物理内存，这种将映像链接到进程地址空间的方法被
关于PLC、电缆线材及气缸选型的详细教程自动化专业爱好者网络
以下是关于PLC、电缆线材及气缸选型的详细教程，整合了多个专业来源的核心要点：一、PLC选型要点生产厂家选择日系PLC（如三菱FX系列、欧姆龙CP1系列）适合独立设备或简单控制系统，性价比高。欧美系PLC（如西门子S7-1200/1500系列）适用于大型分布式系统或需复杂通信的场景（如工业以太网）。特殊行业（如冶金、烟草）需选择有行业成熟案例的PLC品牌。I/O点数估算统计所有输入/输出信号（如传
基于oracle linux的 DBI/DBD 标准化安装文档(二) 文档
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
Python中使用vlc库实现视频播放功能小白教程 python python 音视频开发语言 Python视频播放功能 Python中使用vlc库 vlc视频播放
文章目录前言1.环境准备1.1Python安装1.2选择Python开发环境1.3安装必要库2.基础播放示例3.常用播放控制功能4.事件监听5.播放网络流媒体6.结合GUI库制作视频播放器（以Tkinter为例）前言本教程主要包含打开文件、播放和停止按钮，能够实现基本的视频播放控制功能。1.环境准备1.1Python安装访问Python官方网站，根据你的操作系统（Windows、Mac或Linux
性能测试自动化：JMeter脚本设计与分布式压测实战指南测试渣自动化 jmeter 分布式测试工具
引言在数字化竞争日益激烈的今天，软件系统的性能表现直接影响用户体验和业务连续性。无论是电商大促的“秒杀”场景，还是金融系统的高频交易，性能测试自动化已成为保障系统稳定性的核心手段。ApacheJMeter作为开源性能测试工具中的标杆，凭借其灵活性和扩展性，成为企业构建自动化测试体系的首选工具。本文将从脚本设计与分布式压测两大核心维度，系统阐述JMeter在性能测试自动化中的实践方法，为企业提供可落
队列在计算机系统中的应用 AredRabbit 队列
队列在计算机系统中有广泛的应用，主要用于管理任务和处理数据流。以下是队列的一些常见应用场景：1.任务调度操作系统：操作系统使用队列管理进程调度，如先来先服务（FCFS）调度算法。线程池：线程池通过队列管理待执行任务，确保任务按顺序处理。2.数据缓冲I/O操作：队列用于缓冲输入输出数据，平衡生产者和消费者速度。网络通信：网络数据包通过队列缓冲，确保按顺序处理。3.消息传递消息队列：在分布式系统中，消
实战篇：GBase 8a MPP Cluster 安装部署过程 Lucifer三思而后行 DBA 实战系列数据库 gbase cluster
目录前言☀️环境准备安装介质下载操作系统安装安装前准备1、关闭防火墙2、禁用Selinux3、创建gbase用户4、创建目录并授权5、重启主机❤️GBase8aMPPCluster安装主节点上传安装介质主节点解压安装包分发配置文件配置环境变量修改主节点安装配置文件主节点执行安装命令检查集群状态申请和导入授权①导出集群各节点的指纹信息②邮件申请授权③主节点导入授权④检查授权情况所有节点启动集群服务主
Linux losetup循环设备小米人er 我的博客 losetup linux nuttx
好的，以下是命令的中文解释和使用步骤：命令解释：losetup-r/dev/loop0/system/app.bin：losetup是一个用于将文件与循环设备（loopdevice）关联的命令。-r选项表示将循环设备设置为只读模式。/dev/loop0是使用的循环设备。/system/app.bin是要与循环设备关联的文件。这条命令的作用是将/system/app.bin文件的内容通过/dev/l
一次Linux下 .net 调试经历 norsd C#VC Debug linux .net
背景：Xt160Api,之前在windows下用.net调用，没有任何问题。但是移植到Linux去后，.net程序调用init(config_path)总是报错/root/test找不到traderApi.ini(/root/test是程序目录)然后退出程序解决过程:于是考虑是不是参数传错了，但是无论这个参数是什么，报错内容始终如此。甚至某些情况下，比如加了几句Console.WriteLIne(
音频 Alsa、Framework及Android ‘禹’你一起后端
目录1Alsa、Framework及Android1.1ALSA架构简介图11.2ALSA架构简介图21.3ALSA架构简介图31.4ALSA架构简介图41.5ALSA架构简介图51.6ALSA架构简介图61.8音频代码1Alsa、Framework及Android目前，linux系统常用的音频驱动有两种形式:alsa和oss。Alsa：现在是linux下音频驱动的主要形式，与简单的oss兼容。o
linux系统命令——权限 why—空空 linux 服务器运维
一、有哪些权限读（r）——对应数字4写（w）——对应数字2执行（x）——对应数字1二、权限及数字的对应4对应r--2对应-w-1对应--x5对应r-x6对应rw-7对应rwx三、文件的基本属性如图：①中如果是"一"表示文件类型为文件；如果是"d"表示文件类型是文件夹；如果是"l"表示文件类型为链接②表示文件属主(即谁创建的文件)的权限③中表示文件属主所属组(即文件属主所在的组)中的用户的权限④表示
Linux如何查询文件及文件夹大小大数据侠客操作系统相关 linux
查看当前目录下各文件、文件夹的大小，这个比较实用du-h-max-depth=1*查询当前目录总大小du-sh3.最大文件夹倒叙和正序du-s*|sort-rn从小到大按字节排序du-sh*sort-n从小到大按字节和M排序4.最大文件夹倒排前10和后10du-sh*|sort-rn|head前面10个du-sh*|sort-rn|tail后面10个
pytorch 天花板级别的知识点你可以不会用但是不能不知道小赖同学啊人工智能 pytorch 人工智能 python
PyTorch的高级知识涵盖了从模型优化到分布式训练的广泛内容，适合已经掌握基础知识的开发者进一步提升技能。以下是PyTorch的高级知识点，详细且全面：1.模型优化与加速1.1混合精度训练定义：使用半精度（FP16）和单精度（FP32）混合训练，减少内存占用并加速计算。实现：使用torch.cuda.amp模块。示例：fromtorch.cuda.ampimportautocast,GradSc
linux sed命令 weifexie Linux linux 运维服务器 sed awk
linuxsed命令作为三剑客的一员，也是到了不得不写写总结的时候了，按惯例，先给出出处，首当齐冲wikihttps://zh.wikipedia.org/wiki/Sedsed（意为流编辑器，源自英语“streameditor”的缩写）是一个使用简单紧凑的编程语言来解析和转换文本Unix实用程序。sed是最早支持正则表达式的工具之一，至今仍然用于文本处理，特别是用于替换命令。用于纯文本字符串操作
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出

hadoop完全分布式集群搭建

序：相关软件

一、前期准备

二、jdk，hadoop安装、配置

2.1、jdk、hadoop安装

2.2、配置jdk、hadoop环境变量

三、编写集群分发脚本，完成其他服务器的jdk、hadoop安装与配置

四、集群配置规划

五、完全分布式属性配置

5.1、core-site.xml

5.2、hdfs-site.xml

5.3、yarn-site.xml

5.4、mapred-site.xml

5.5、 workers

5.6、集群配置同步

六、ssh无密登录配置

七、集群启动和停止脚本编写及测试

7.1、官方启动脚本

7.2、自定义启动脚本

7.3、自定义进程查询脚本

7.4、测试。

八、web端访问

8.1、hdfs信息查询：hadoop102:9780

8.2、yarn信息查询：hadoop103:8088

8.3、历史服务器查询：hadoop102：19888

你可能感兴趣的:(hadoop,hadoop,linux,大数据,分布式)