一休祺

hadoop集群分布式环境搭建

五个节点：2个Master+3个Slave
CentOS-8.4.2105-x86_64-dvd1.iso
hadoop-3.3.1.tar.gz
jdk-8u221-linux-x64.tar.gz
apache-zookeeper-3.7.0-bin.tar.gz

新建虚拟机，对centos进行配置

基础配置

切换到root用户，才能进行配置

su -l root

1.配置ip

[root@localhost ~]# vi /etc/sysconfig/network-scripts/ifcfg-ens33

2.设置DNS域名解析的配置文件

vi /etc/resolv.conf

3.配置hosts文件

vi /etc/hosts

添加
192.168.64.101 Master001
192.168.64.102 Master002
192.168.64.133 Slave1
192.168.64.144 Slave2
192.168.64.155 Slave3

4.重启网络服务

nmcli connection reload 
nmcli connection up ens33 
nmcli d connect ens33

5.修改主机名

[root@localhost ~]# vi /etc/sysconfig/network

创建hadoop用户（！！！！！此步骤可做可不做）

adduser hadoop
passwd hadoop

如果没创建hadoop用户，自己在现有的用户下进行下面步骤即可

在hadoop用户下创建software文件夹

su -l root

[root@Master1 hadoop]# mkdir software

解压（需在root用户下）
tar -zxf 文件

补充：

切换为root用户

su -l root

解压并配置jdk

命令：
vi /etc/profile

配置内容：
export JAVA_HOME=/home/hadoop/software/jdk1.8.0_221
export PATH=$PATH:$JAVA_HOME/bin

使命令生效：
source /etc/profile

查看是否成功：
java -version

解压并配置hadoop

解压：
tar -zxf hadoop-3.3.1.tar.gz 

命令：
vi /etc/profile

配置内容：
#hadoop
export HADOOP_HOME=/home/hadoop/software/hadoop-3.3.1
#hadoop位置根据放置的位置决定
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"
export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native:$JAVA_LIBRARY_PATH

使命令生效：
source /etc/profile

查看是否成功：
hadoop

集群分布式搭建

进入这个目录

cd /home/hadoop/software/hadoop-3.3.1/etc/hadoop

切换为root用户

su -l root

配置core-site.xml

<configuration>
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://mycluster</value>
        </property>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/home/hadoop/software/hadoop-3.3.1/tmp</value>
        </property>
        <property>
                <name>ha.zookeeper.quorum</name>
                <value>Slave1:2181,Slave2:2181,Slave3:2181</value>
        </property>
</configuration>

配置hadoop-env.sh

修改

export JAVA_HOME=/home/hadoop/software/jdk1.8.0_221

配置workers(如果是Hadoop 3.0以前的就是salves)

删除localhost 添加

Slave1
Slave2
Slave3

配置hdfs-site.xml

<configuration>
        <property>
                <name>dfs.replication</name>
                <value>3</value>
        </property>
        <property>
                <name>dfs.nameservices</name>
                <value>mycluster</value>
        </property>
        <property>
                <name>dfs.ha.namenodes.mycluster</name>
                <value>nn1,nn2</value>
        </property>
        <property>
                <name>dfs.namenode.rpc-address.mycluster.nn1</name>
                <value>Master001:9000</value>
        </property>
        <property>
                <name>dfs.namenode.rpc-address.mycluster.nn2</name>
                <value>Master002:9000</value>
        </property>
         <property>
                <name>dfs.namenode.http-address.mycluster.nn1</name>
                <value>Master001:50070</value>
        </property>
         <property>
                <name>dfs.namenode.http-address.mycluster.nn2</name>
                <value>Master002:50070</value>
        </property>
         <property>
              <name>dfs.namenode.shared.edits.dir</name>
                <value>qjournal://Slave1:8485;Slave2:8485;Slave3:8485/QJCluster</value>
         </property>
 		 <property>
                <name>dfs.journalnode.edits.dir</name>
                <value>/home/hadoop/software/hadoop-3.3.1/QJEditsData</value>
        </property>
         <property>
                <name>dfs.ha.automatic-failover.enabled</name>
                <value>true</value>
        </property>
        <property>
                <name>dfs.client.failover.proxy.proxider.mycluster</name>
                <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
        </property>
        <property>
                <name>dfs.ha.fencing.methods</name>
                <value>
                        sshfence
                        shell(/bin/true)
                </value>
        </property>
        <property>
                <name>dfs.ha.fencing.ssh.private-key-files</name>
                <value>/home/hadoop/.ssh/id_rsa</value>
        </property>
        <property>
        	<name>dfs.ha.fencing.ssh.connect-timout</name>
        	<value>3000</value>
        </property>
</configuration>

配置mapred-site.xml

<configuration>
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
</configuration>

配置yarn-site.xml

<configuration>

        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
        
        <property>
                <name>yarn.resourcemanager.ha.enable</name>
                <value>true</value>
        </property>
        
        <property>
                <name>yarn.resourcemanager.cluster.id</name>
                <value>RMHA</value>
        </property>
        
        <property>
                <name>yarn.resourcemanager.ha.rm.ids</name>
                <value>rm1,rm2</value>
        </property>
        
        <property>
                <name>yarn.resourcemanager.hostname.rm1</name>
                <value>Master001</value>
        </property>

			<property>
                <name>yarn.resourcemanager.hostname.rm2</name>
                <value>Master002</value>
        </property>

			<property>
                <name>yarn.resourcemanager.address.rm1</name>
                <value>Master001</value>
        </property>
        <property>
                <name>yarn.resourcemanager.scheduler.address.rm1</name>
                <value>Master001:8130</value>
        </property>

			<property>
                <name>yarn.resourcemanager.webapp.address.rm1</name>
                <value>Master001:8188</value>
        </property>
        <property>
                <name>yarn.resourcemanager.resource-tracker.address.rm1</name>
                <value>Master001:8131</value>
        </property>
        <property>
                <name>yarn.resourcemanager.admin.address.rm1</name>
                <value>Master001:8133</value>
        </property>
        <property>
                <name>yarn.resourcemanager.ha.admin.address.rm1</name>
                <value>Master001:23142</value>
        </property>

<property>
                <name>yarn.resourcemanager.address.rm2</name>
                <value>Master002:8132</value>
        </property>
        <property>
                <name>yarn.resourcemanager.scheduler.address.rm2</name>
                <value>Master002:8130</value>
        </property>

			<property>
                <name>yarn.resourcemanager.webapp.address.rm2</name>
                <value>Master002:8188</value>
        </property>
        <property>
                <name>yarn.resourcemanager.resource-tracker.address.rm2</name>
                <value>Master002:8131</value>
        </property>
        <property>
                <name>yarn.resourcemanager.admin.address.rm2</name>
                <value>Master002:8133</value>
        </property>
        <property>
                <name>yarn.resourcemanager.ha.admin.address.rm12</name>
                <value>Master002:23142</value>
        </property>
       <property>
                <name>yarn.resourcemanager.zk-address</name>
                <value>Slave1:2181,Slave2:2181,Slave3:2181</value>
        </property> 
</configuration>

检验是否安装ssh，若出现下图所示，表示是安装了的，否则需要自行安装
复制四台虚拟机，将复制好的虚拟机进行导入
Master002
Salve01
Salve02
Salve03

对每台虚拟机进行修改

在打开虚拟机时，会出现如下操作

查看每一台机器的Mac

修改每一台主机的IP地址

vi /etc/sysconfig/network-scripts/ifcfg-ens33

查看UUID

nmcli con show

修改每一台机器的UUID，在ifcfg-ens33中更改

生成UUID：
uuidgen ens33

重启网络配置

nmcli connection reload

nmcli connection up ens33

到这一步出现了问题（发现网络图标消失了，使用ifup ens33时报错）

激活连接失败：
No suitable device found for this connection.

解决办法

在命令行输入：

mv /var/lib/NetworkManager /var/lib/NetworkManager.bak

然后重启：

reboot

再次重启网络配置

nmcli connection reload

nmcli connection up ens33

nmcli d connect ens33

修改主机名

sudo hostnamectl set-hostname xxx

对Master结点做免密设置

ssh-keygen -t rsa -P ''

在使用上述方法进行免密设置时出现了错误，当完成上述操作后仍需要输入密码才能切换结点

解决办法

ssh免密到本机

现在检查您是否可以在没有密码的情况下SSH到本地主机：
ssh xxx（本地机器名）
如果需要密码，请执行以下命令：
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

chmod 600 ~/.ssh/authorized_keys

ssh xxx

exit

ssh免密到其他服务器

先在其他服务器执行上述免密到本机的步骤

接着在xxx服务器上执行，如下操作（有几个服务器执行几次）

ssh-copy-id xxx1（其他服务器名）

删除免密服务

vi ~/.ssh/authorized_keys

Zookeeper安装

通过xftp上传zookeeper至/home/hadoop/software的文件夹中

对其解压

tar -zxf apache-zookeeper-3.7.0-bin.tar.gz

新建文件夹：

mkdir -p /home/hadoop/software/apache-zookeeper-3.7.0-bin/tmp/zookeeper

配置zookeeper

进入zookeeper目录下：

touch myid

echo 3 > myid

进入conf：

[root@Slave3 conf]# pwd
/home/hadoop/software/apache-zookeeper-3.7.0-bin/conf

1.复制zoo_sample.cfg，更名为zoo.cfg：

[root@Slave3 conf]# ls
configuration.xsl  log4j.properties  zoo_sample.cfg
[root@Slave3 conf]# cp zoo_sample.cfg zoo.cfg
[root@Slave3 conf]# ls
configuration.xsl  zoo.cfg
log4j.properties   zoo_sample.cfg

2.对zoo.cfg内容进行修改：

[root@Slave3 conf]# vi zoo.cfg

修改dataDir并在最后添加信息:

##修改：
#dataDir=/tmp/zookeeper
dataDir=/home/hadoop/software/apache-zookeeper-3.7.0-bin/tmp/zookeeper

##添加：
server.1=Slave1:2888:3888
server.2=Slave2:2888:3888
server.3=Slave3:2888:3888

将配置好的zookeeper拷贝给Slave1和Slave2

##传给Slave1
[root@Slave3 software]# scp -r apache-zookeeper-3.7.0-bin/ Slave1:~/software/

##传给Slave2
[root@Slave3 software]# scp -r apache-zookeeper-3.7.0-bin/ Slave2:~/software/

当我使用上述方法将zookeeper拷贝到其他机器时，运行成功了但是在其他机器上找不到zookeeper文件

解决办法

##拷贝给Slave1
[root@Slave3 software]# scp -r /home/hadoop/software/apache-zookeeper-3.7.0-bin/ 192.168.64.133:/home/hadoop/software/

##拷贝给Slave
[root@Slave3 software]# scp -r /home/hadoop/software/apache-zookeeper-3.7.0-bin/ 192.168.64.144:/home/hadoop/software/

分别修改Slave2和Slave1的myid文件内容

对Slave1修改

[root@Slave1 zookeeper]# echo 1 > myid
[root@Slave1 zookeeper]# cat myid
1

对Slave2修改

[root@Slave2 zookeeper]# echo 2 > myid
[root@Slave2 zookeeper]# cat myid
2

关闭各个结点的防火墙

关闭防火墙：

systemctl stop firewalld.service

开机启动关闭

systemctl disable firewalld.service

分别在slave1，slave2和slave3上面启动JournalNode

[root@Slave2 software]# hadoop-daemon.sh start journalnode

格式化NameNode（只格式化一次）

启动完上述步骤后，第一次使用需要在Master001中格式化namenode

hdfs namenode -format

启动zookeeper

1.分别在slave1，slave2和slave3上面启动QuorumPeerMain（即zookeeper）

[root@Slave2 zookeeper]#/home/hadoop/software/apache-zookeeper-3.7.0-bin/bin/zkServer.sh start

2.在Master001上启动

start-dfs.sh

start-yarn.sh

报错了，启动不了！！！

解决办法

首先：
在Hadoop安装目录下找到sbin文件夹
在里面修改四个文件

1、对于start-dfs.sh和stop-dfs.sh文件，添加下列参数：

#!/usr/bin/env bash
HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
HDFS_JOURNALNODE_USER=root
HDFS_ZKFC_USER=root

2、对于start-yarn.sh和stop-yarn.sh文件，添加下列参数：

#!/usr/bin/env bash
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

接着用命名添加如下内容

vi /etc/profile

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

没有启动DFSZKFailoverController

解决办法

在ZooKeeper中初始化要求的状态，可以在任一NameNode中运行下面的命令实现该目的，该命在ZooKeeper中创建znode：

hdfs zkfc -formatZK

查询namenode状态（Master001和Master002）

#Master001
hdfs haadmin -getServiceState nn1

#Master002
hdfs haadmin -getServiceState nn2

192.168.64.101:50070
192.168.64.102:50070

关闭

在zookeeper的bin目录下：

./zkServer.sh stop

在hadoop的sbin目录下

stop-dfs.sh
stop-yarn.sh

Spring Boot与Hazelcast整合教程嘵奇提升自己 spring boot 后端 java
精心整理了最新的面试资料和简历模板，有需要的可以自行获取点击前往百度网盘获取点击前往夸克网盘获取SpringBoot与Hazelcast整合教程简介Hazelcast是一个开源的内存数据网格（IMDG），提供分布式缓存、计算和数据结构功能。与SpringBoot整合后，可以快速实现分布式缓存、会话共享等功能。本教程将演示如何将Hazelcast嵌入SpringBoot应用。环境准备JDK17+Sp
linux 编译QT atom,QT5 编译使用TagLib weixin_39551611 linux 编译QT atom
需要使用TagLib读取媒体信息,记录下编译过程使用的文件,使用Taglib库版本1.6.3QT版本5.12.3x32MinGWCMAKE版本3.9.0使用CMAKE配置TagLIbtagLib解压后如下:image配置环境变量选择mingw的bin路径,如下图image.png打开Cmake,在Cmake中选择对应目录如下图是我的选择,基于taglib的解压目录image.png之后点击Conf
ZooKeeper集群高可用性测试与实践：从规划到故障模拟磐基Stack专业服务团队 Zookeeper zookeeper 可用性测试
#作者：任少近文章目录ZooKeeper集群环境规划1.集群数据一致性测试2.集群节点故障测试ZooKeeper集群高可用性测试的主要目的是确保在分布式环境中，ZooKeeper服务能够持续提供一致性和高可用性的协调服务。ZooKeeper集群环境规划节点ipZooKeeper版本java版本对外端口集群通信端口集群选举端口192.168.x.xZooKeeper-3.6.11.8.0_33221
VS Code 在Linux下IDE开发C++的HelloWorld leon_zeng0 c++VScode linux ide c/c++helloworld
用VisualStudioCode在Linux(Ubuntu)下构造c++的集成开发环境，编辑，编译和调试运行一个简单程序HelloWorld。想达到上面目标，搜索到以下文章，学习验证而成本文日记。链接是：https://code.visualstudio.com/docs/cpp/config-linux前期准备运行环境是ubuntu16.0，先安装好VisualStudioCode(VSCod
Linux内核srio驱动,Zynq—Linux移植学习笔记（十四）：RapidIO驱动开发 weixin_39942572 Linux内核srio驱动
#defineDRIVER_NAME"xiic-rio"#defineSRIO_ZYNQ_BASEADDR0x40000000#defineSRIO_ZYNQ_NODE_BASEADDR0x10100#defineSRIO_ZYNQ_MAX_HOPCOUNT13structxiic_rio{structmutexlock;u8*data;};/*Weneedglobalvarriableforma
《Linux设备驱动开发详解（第3版）》第12章 Linux块设备驱动请向我看齐嵌入式 linux 驱动开发运维
12.1块设备驱动概述块设备以块为单位进行数据传输，通常支持随机访问，如硬盘、U盘等。块设备驱动负责管理这些设备的I/O操作，为内核和用户空间提供统一的接口。这部分通常以理论讲解为主，代码示例较少。12.2块设备的I/O栈块设备的I/O栈涉及多个层次，从用户空间的系统调用开始，经过VFS（虚拟文件系统）、通用块层，最终到达块设备驱动层。这部分也是理论性较强，直接的代码示例较少。12.3通用块层通用
Linux驱动开发实战之SRIO驱动（二）基于Tsi721驱动 niuTaylor SRIO驱动实战 linux 驱动开发运维 SRIO
常用驱动介绍在RapidIO系统中，TSI721是一款常用的RapidIO交换芯片，其驱动程序和相关模块负责管理和优化数据传输，包括DMA（直接内存访问）操作。以下是您提到的各个模块的作用概述：rapidio.ko:这是RapidIO核心模块，为RapidIO子系统提供基础支持。它负责管理RapidIO设备、维护RapidIO网络拓扑结构，以及处理RapidIO协议的底层细节。rio_cm.ko:
深入理解 Kafka 的 ConsumerRebalanceListener t0_54coder 编程问题解决手册 kafka linq 分布式
深入理解Kafka的ConsumerRebalanceListener在分布式系统中，数据的一致性和可靠性是至关重要的。ApacheKafka作为一个流行的分布式流处理平台，提供了强大的数据传输和处理能力。在Kafka中，消费者组（ConsumerGroup）的概念允许多个消费者实例共同处理一个主题的数据。然而，当消费者实例的个数发生变化时，如何确保数据的平衡和一致性呢？这就引出了我们今天要讨论的
Linux驱动开发实战之SRIO驱动（一） niuTaylor linux 驱动开发 c语言开发语言
活动发起人@小虚竹想对你说：这是一个以写作博客为目的的创作活动，旨在鼓励大学生博主们挖掘自己的创作潜能，展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴，那么，快来参加吧！我们一起发掘写作的魅力，书写出属于我们的故事。我们诚挚邀请你参加为期14天的创作挑战赛！提醒：在发布作品前，请将不需要的内容删除。LinuxSRIO驱动开发终极指南：从基础到实战一、SRIO协议基础SRI
Linux---fork函数和exec函数凉冰难消一腔热血 Linux linux
这里主要介绍Unix/Linux中进程创建，fork()函数和exec()函数。这里先介绍一下什么是进程：进程是正在执行的程序的一个实例。每个实例都有自己的地址空间和执行状态。当操作系统给内核数据结构添加了适当的信息并分配了运行程序代码所需要的资源时，程序就成了进程。一个进程有一个地址空间（它可以访问的内存）和至少一个称为线程的控制流。进程的变量既可以进程生命周期中始终存在（静态存储），也可以在执
linux防火墙多个多个ip配置,网络中多网卡和多ip中的高可用没伞请奔跑i linux防火墙多个多个ip配置
一、虚拟网卡实现一个网卡多个地址1、单个网卡实现多个ipv4地址，只需要在该网卡的配置文件的目录新增网卡配置文件即可。进入网卡"eth0"的目录下2、新增网卡配置文件"ifcfg-eth0:0"和"ifcfg-eth0:1"3、关掉NetworkManager服务4、重启网卡，让系统重读配置网卡配置文件5、使用ifconfig命令查看在线的网卡ip地址二、多网卡bond，mode11、首先在虚拟机
Linux信号：一场内核与用户空间的暗战芯作者 DD：日记 linux
在Linux系统的黑暗森林中，每个进程都是小心翼翼的猎人。当一束神秘的信号光划过天际，内核瞬间变身信号调度大师，在进程的生死簿上书写着命运。这场跨越用户空间与内核态的博弈，远比表面看到的更加惊心动魄。一、信号诞生的量子纠缠当Ctrl+C的闪电划破终端的宁静，内核的tty驱动层率先捕捉到这个量子扰动。键盘中断处理程序像精密的外科手术刀，准确地将SIGINT信号注入当前前台进程的task_struct
oceanbase与mysql性能对比_金融业分布式数据库:TDSQL、HotDB、OceanBase等原理、POC性能对比及选择是...... 高中物理宋老师
本帖最后由Amygo于2020-3-1501:33编辑1、分布式的实现，是通过中间件实现分布式，还是源码级别引入分布式算法实现的？解答：(1)分布式数据库是至少由计算节点、存储节点、管理平台、备份还原程序四个部分组成，从数据库系统理论知识上说分成：全局自治和场地自治，也粗略认为：全局可理解为计算节点、场地可理解为存储节点(2)这个问题的标题“中间件实现分布式还是源码级别引入分布式算法”这个说法存在
linux,ubuntu下source、sh、bash、./执行脚本的区别初识-CV linux Ubuntu Ubuntu source sh bash ./
ubuntu下source、sh、bash、./执行脚本的区别source命令用法sourceFileName作用:在当前bash环境下读取并执行FileName中的命令。该filename文件可以无"执行权限"注:该命令通常用命令“.”来替代。如:source.bash_profile..bash_profile两者等效。source(或点)命令通常用于重新执行刚修改的初始化文档。source命
云服务器linux下配置springboot项目启动、停止、重启脚本努力的Andy 脚本 linux 运维服务器
目录为什么要配置启动脚本？配置脚本一、选择一个文件夹新建一个XXX.sh文件（xxx可以命名为项目名称，新建.sh.conf等文件用到的是vi指令）二、进入如下页面，按下键盘i键进入insert模式三、insert如下配置（只需修改APP_NAME内容为自己想要启动的jar包）四、脚本代码解释：linux下脚本测试1、启动测试2、查看状态3、停止测试4、重启测试为什么要配置启动脚本？一般情况下我们
本地锁 vs 分布式锁详解重生之我在成电转码 java 系统锁分布式锁
一、什么是本地锁？本地锁（LocalLock）指的是单机环境下使用Java/JVM自带的锁机制，实现线程之间的互斥和同步。✅本地锁的常见实现：锁类型说明synchronizedJVM内置，修饰方法或代码块，重量级锁，自动释放ReentrantLockJUC提供，支持可重入、可中断、公平锁、Condition等StampedLock支持读写锁和乐观读，适合读多写少场景ReadWriteLock读写分
springboot 项目linux启停脚本 lovecode2011 linux 运维服务器
shutdown.shjps-lvm|grepxxx|awk'{print$1}'|xargskill-15xxx-进程号或项目名称(或名称关键字)startup.shls|grep"xxx"|grep-iv"bak"|tail-n1|xargs-n1-l{}nohupjava-jar{}-Dspring.config.location=/xxx/xxx/config/application-de
oceanbase 是不是架构比较复杂和mysql对比分析 hxsln11 金融数据库 oceanbase 架构 mysql
我先来分析用户的需求。用户的问题是关于OceanBase和MySQL的架构复杂度对比，并希望了解两者在架构上的具体差异。这是一个技术性较强的问题，用户可能是数据库开发者、架构师或者对分布式数据库感兴趣的学习者。结合上下文，用户之前已经提到过OceanBase的学习曲线较陡峭，可能是因为其分布式架构的复杂性，所以这次的问题很可能是想进一步明确OceanBase和MySQL在架构上的具体差异，以及为什
编写脚本在Linux下启动、停止SpringBoot工程流烟默系统运维 Linux全面入门 linux spring boot shell
【1】启动命令nohupjava-jaryour-application.jar>/dev/null2>&1&>/dev/null2>&1：这条命令将标准输出和标准错误都重定向到/dev/null，这意味着它们不会输出到控制台或任何文件。这样做是因为我们希望所有日志都由Logback处理并写入到配置文件中指定的日志文件里。然而，如果你想要保留控制台输出（例如，对于调试目的），你可以省略这部分重定向
大数据学习（75）-大数据组件总结 viperrrrrrr 大数据 impala yarn hdfs hive CDH mapreduce
大数据学习系列专栏：哲学语录:用力所能及，改变世界。如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、CDHCDH（ClouderaDistributionIncludingApacheHadoop)是由Cloudera公司提供的一个集成了ApacheHadoop以及相关生态系统的发行版本。CDH是一个大数据平台，简化和加速了大数据处理分析的部署和管理。CDH提供Hadoop的
Sqoop安装部署愿与狸花过一生大数据 sqoop hadoop hive
ApacheSqoop简介Sqoop（SQL-to-Hadoop）是Apache开源项目，主要用于：将关系型数据库中的数据导入Hadoop分布式文件系统（HDFS）或相关组件（如Hive、HBase）。将Hadoop处理后的数据导出回关系型数据库。核心特性批量数据传输支持从数据库表到HDFS/Hive的全量或增量数据迁移。并行化处理基于MapReduce实现并行导入导出，提升大数据量场景的效率。自
mysql总结 tianyunlinger 大数据 mysql 数据库
MySQL基础1.数据库基本介绍数据库定义：用于存储数据的仓库，通过SQL语句操作。数据库作用：存储应用程序中的数据，便于管理和查询。数据库分类：关系型数据库（如MySQL、Oracle、DB2）和非关系型数据库（如Redis、HBase）。关系型数据库：通过E-R图描述数据之间的关系，支持复杂查询。2.MySQL在Linux中的安装安装前准备：配置防火墙、创建统一的管理目录（如/export/s
Linux中的yum和vim工具使用总结 yi个名字 linux vim 运维
在Linux系统管理和文本编辑中，yum和vim是两个非常重要的工具。yum作为包管理器帮助我们轻松安装和管理软件，而vim则是一个功能强大的文本编辑器。下面我将对这两个工具进行详细介绍。一、YUM包管理器1.YUM简介YUM(YellowdogUpdaterModified)是一个在Fedora、CentOS和RedHat等基于RPM的Linux发行版中的开源命令行包管理工具。它允许用户自动下载
HarmonyOS 5 开发环境介绍 harmonyos-next
一、HarmonyOS5是什么？HarmonyOS5是华为推出的新一代分布式操作系统，基于微内核架构，专注于鸿蒙原生应用开发，不再兼容安卓APK。其核心目标是通过"一次开发、多端部署"的能力，实现全场景设备（手机、平板、智能穿戴、车机、智能家居等）的无缝协同。核心特性包括：分布式架构：设备间可自由组网，共享算力与资源；高性能内核：基于开源鸿蒙（OpenHarmony）优化，支持64位ARM、x86
GitHub霸榜神器！NextChat领衔DeepSeek全栈开发范式大禹智库《向量数据库指南》《实战AI智能体》机器学习 RAG AI智能体人工智能 Manus deepseek NextChat
一、项目概况与生态定位NextChat（原ChatGPT-Next-Web）是GitHub上斩获81.2K星标的现象级开源项目，定位为"轻量级AI助手终端"，支持DeepSeek、Claude、GPT-4、Gemini等20+主流大模型。其核心价值在于以5MB超小客户端实现跨平台（Windows/Mac/Linux/iOS/Android）无缝衔接，同时提供云端一键部署方案，成为个人用户与企业私有
基于kylin-v10安装docker 神奇侠2024 redis kylin 大数据 docker
1、下载地址Indexoflinux/static/stable/x86_64/2、下载docker-24.0.5.tgz.tar版本3、上传服务器解压tarxvfdocker-24.0.5.tgz.tar4、解压的docker拷贝或移动到/usr/bin/目录下cpdocker/*/usr/bin/5、编写docker.service文件加入Linux服务当中并开启守护进程vi/etc/syst
亿级分布式系统架构演进实战（七）- 横向扩展（安全防护设计） power-辰南 java技术架构师成长专栏 spring boot 分布式架构设计高并发安全防护
亿级分布式系统架构演进实战（一）-总体概要亿级分布式系统架构演进实战（二）-横向扩展（服务无状态化）亿级分布式系统架构演进实战（三）-横向扩展（数据库读写分离）亿级分布式系统架构演进实战（四）-横向扩展（负载均衡与弹性伸缩）亿级分布式系统架构演进实战（五）-横向扩展（缓存策略设计）亿级分布式系统架构演进实战（六）-横向扩展（监控与日志体系）核心目标保障系统免受攻击，确保数据安全一、安全防护设计1.
亿级分布式系统架构演进实战（一）- 总体概要 power-辰南 java技术架构师成长专栏高并发分布式系统微服务架构设计 springcloud
前言不说废话，这次分享是某500强企业真实亿级流量业务中台技术架构演进过程实战。核心目标构建一个兼具高性能、高可用、强一致性的分布式系统，支撑亿级流量场景下的稳定运行。演进路线大纲阶段一：横向扩展（应对万级QPS）核心目标：突破单机性能瓶颈，建立弹性基础[Nginx]/|\[App1][App2][App3]←无状态服务集群\|/[DBProxy]←读写分离中间件/\[Master]←写节点[Sl
亿级分布式系统架构演进实战（三）- 横向扩展（数据库读写分离） power-辰南 java技术架构师成长专栏数据库 mysql 分布式系统 springcloud 架构设计
亿级分布式系统架构演进实战（一）-总体概要亿级分布式系统架构演进实战（二）-横向扩展（服务无状态化）核心目标分散数据库压力，提升读性能1.数据库架构设计数据库由原理的单实例变成主从模式，主主要负责写，从负责读。1.1主从角色定义节点类型数据流向核心职责主库读写（Write）处理事务性写操作（INSERT/UPDATE/DELETE）/部分读从库只读（Read）承担查询请求（SELECT），支持水平
网页编辑器能否满足Word公式与图片的直接复制粘贴？ 2501_90699800 编辑器 word umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word
要求：开源，免费，技术支持编辑器：百度ueditor前端：vue2,vue3,vue-cli,react,html5用户体验：Ctrl+V快捷键操作功能：导入Word,导入Excel,导入PPT(PowerPoint),导入PDF,复制粘贴word,导入微信公众号内容,web截屏平台：Windows,macOS,Linux,RedHat,CentOS,Ubuntu,中标麒麟,银河麒麟,统信UOS,
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S

hadoop集群分布式环境搭建

新建虚拟机，对centos进行配置

基础配置

如果没创建hadoop用户，自己在现有的用户下进行下面步骤即可

补充：

解压并配置jdk

解压并配置hadoop

集群分布式搭建

配置core-site.xml

配置hadoop-env.sh

配置workers(如果是Hadoop 3.0以前的就是salves)

配置hdfs-site.xml

配置mapred-site.xml

配置yarn-site.xml

对每台虚拟机进行修改

在打开虚拟机时，会出现如下操作

查看每一台机器的Mac

修改每一台主机的IP地址

查看UUID

修改每一台机器的UUID，在ifcfg-ens33中更改

重启网络配置

到这一步出现了问题（发现网络图标消失了，使用ifup ens33时报错）

解决办法

再次重启网络配置

修改主机名

对Master结点做免密设置

在使用上述方法进行免密设置时出现了错误，当完成上述操作后仍需要输入密码才能切换结点

解决办法

ssh免密到本机

ssh免密到其他服务器

删除免密服务

Zookeeper安装

对其解压

配置zookeeper

进入zookeeper目录下：

进入conf：

当我使用上述方法将zookeeper拷贝到其他机器时，运行成功了但是在其他机器上找不到zookeeper文件

解决办法

分别修改Slave2和Slave1的myid文件内容

关闭各个结点的防火墙

格式化NameNode（只格式化一次）

启动zookeeper

报错了，启动不了！！！

解决办法

没有启动DFSZKFailoverController

解决办法

查询namenode状态（Master001和Master002）

关闭

你可能感兴趣的:(hadoop,分布式,linux)