想你依然心痛

Hadoop集群部署和启动与关闭

Hadoop集群的部署方式分为三种，分别是独立模式（Standalone mode）、伪分布式模式（Pseudo-Distributed mode）和完全分布式模式（Cluster mode），独立模式和伪分布式模式主要用于学习和调试，完全分布式通常在实际生产环境使用。
为了提高Hadoop集群的高可用性，通常使用ZooKeeper为Hadoop集群提供自动故障转移和数据一致性服务。

首先我们先规划三台虚拟机的Hadoop高可用集群：
为了提高Hadoop集群的高可用性，集群中至少需要两个NameNode节点（一个主节点，一个备用节点）和两个ResourceManager节点 (一个主节点，一个备用节点)以满足HDFS和YARN的高可用性，同时为了满足“过半写入则成功”的原则，集群中至少需要三个 JournalNode节点。如下图所示：

高可用相关服务介绍作用如下：

ZKFC（ZKFailoverController）
ZooKeeper的客户端，用于监视和管理NameNode的状态，运行NameNode的每台机器都需要运行ZKFC。
ZooKeeper
表示ZooKeeper服务。
JournalNode
负责两个NameNode之间通信，JournalNode通常在DataNode节点启动。
NodeManager
执行应用程序的容器，监控应用程序的资源使用情况并且向调度器ResourceManager汇报。
ResourceManager
负责集群中所有资源的统一管理和分配，它接收来自NodeManager的资源汇报信息，并把这些信息按照一定的策略分配给各个应用程序。
DataNode
存储真实的数据文件，周期性向NameNode汇报心跳和数据块信息。
NameNode
存储元数据信息以及数据文件与数据块的对应信息。

一、安装Hadoop

访问Apache资源网站下载Linux操作系统的Hadoop安装包hadoop-2.7.4.tar.gz。
使用SecureCRT远程连接工具连接虚拟机Spark01，在存放应用安装包的目录/export/software/下执行“rz”命令上传Hadoop安装包。
在虚拟机Spark01中，通过解压缩的方式安装Hadoop，将Hadoop安装到存放应用的目录/export/servers/。命令如下：
tar -zxvf /export/software/hadoop-2.7.4.tar.gz -C /export/servers/
配置环境变量
执行“vi /etc/profile”命令编辑系统环境变量文件profile，配置Hadoop环境变量,如下：

# Hadoop系统环境变量
export HADOOP_HOME=/export/servers/hadoop-2.7.4
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

完成系统环境变量文件profile配置后保存退出，不过此时配置内容尚未生效，还需要执行“source /etc/profile”命令初始化系统环境变量使配置内容生效。

测试
执行“hadoop version”命令查看Hadoop版本

二、Hadoop高可用集群配置
安装好Hadoop后，只读默认配置文件，包括core-default.xml、hdfs-default.xml、mapred-default.xml和yarn-default.xml，这些文件包含了Hadoop系统各种默认配置参数，位于jar文件中。

自定义配置文件，这些文件基本没有任何配置内容，存在于Hadoop安装目录下的etc/hadoop/目录中，包括core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml等，开发人员可以根据实际需求进行修改，Hadoop会优先选择自定义配置文件中的参数。

修改hadoop-env.sh文件
在虚拟机Spark01中，进入Hadoop安装包的/etc/hadoop/目录，执行“vi hadoop-env.sh”命令编辑hadoop-env.sh文件，将文件内默认的JAVA_HOME参数修改为本地安装JDK的路径。如下图所示：
修改yarn-env.sh文件
在虚拟机Spark01中，进入Hadoop安装包的/etc/hadoop/目录，执行“vi yarn-env.sh”命令编辑yarn-env.sh文件，将文件内默认的JAVA_HOME参数修改为本地安装JDK的路径。如下图所示：
修改core-site.xml文件
在虚拟机Spark01中，进入Hadoop安装包的/etc/hadoop/目录，执行“vi core-site.xml”命令编辑Hadoop的核心配置文件core-site.xml。如下：


    fs.defaultFS #配置命名空间管理服务制定通信地址
    hdfs://master


    hadoop.tmp.dir #存储临时文件的目录
    /export/servers/hadoop-2.7.4/tmp


    ha.zookeeper.quorum #ZooKeeper集群地址
    spark01:2181,spark02:2181,spark03:2181

修改hdfs-site.xml文件
在虚拟机Spark01中，进入Hadoop安装包的/etc/hadoop/目录，执行“vi hdfs-site.xml”命令编辑HDFS的核心配置文件hdfs-site.xml。


    dfs.replication #HDFS副本数
    3


    dfs.namenode.name.dir #NameNode 节点数据（即元数据）的存放位置
    /export/data/hadoop/namenode

    
    dfs.datanode.data.dir    #DataNode 节点数据（即数据块）的存放位置
    /export/data/hadoop/datanode    


    dfs.nameservices #处理外部访问HDFS的请求
    master


    dfs.ha.namenodes.master #定义每个NameNode节点的唯一标识符
    nn1,nn2


    dfs.namenode.rpc-address.master.nn1 #标识符nn1的RPC服务地址
    spark01:9000


    dfs.namenode.rpc-address.master.nn2 #标识符nn2的RPC服务地址
    spark02:9000


    dfs.namenode.http-address.master.nn1#标识符nn1的HTTP服务地址
    spark01:50070


    dfs.namenode.http-address.master.nn2#标识符nn2的HTTP服务地址
    spark02:50070


  dfs.namenode.shared.edits.dir#NameNode元数据在JournalNode上的共享存储目录
  qjournal://spark01:8485;spark02:8485;spark03:8485/master


    dfs.journalnode.edits.dir#JournalNode存放数据地址
    /export/data/hadoop/journaldata


  dfs.client.failover.proxy.provider.master#访问代理类，用于确定当前处于 Active 状态的 NameNode节点
  org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider


    dfs.ha.fencing.methods#配置隔离机制，确保集群中只有一个NameNode处于活动状态
    
        sshfence
        shell(/bin/true)
    


    dfs.ha.fencing.ssh.private-key-files#sshfence隔离机制需要配置本机密钥地址
    /root/.ssh/id_rsa


    dfs.ha.automatic-failover.enabled#开启自动故障状态切换
    true
 

	dfs.ha.fencing.ssh.connect-timeout#sshfence隔离机制超时时间
	30000

 
	dfs.webhdfs.enabled #开启webhdfs服务
	true

修改mapred-site.xml文件
在虚拟机Spark01中，进入Hadoop安装包的/etc/hadoop/目录，执行“cp mapred-site.xml.template mapred-site.xml”命令，通过复制模板文件方式创建MapReduce
的核心配置文件mapred-site.xml，执行“vi mapred-site.xml”命令编辑配置文件
mapred-site.xml ，指定MapReduce运行时框架。如下：


      mapreduce.framework.name#指定MapReduce 作业运行在 YARN框架之上
      yarn

修改yarn-site.xml文件
在虚拟机Spark01中，进入Hadoop安装包的/etc/hadoop/目录，执行“cp yarn-site.xml”命令，编辑YARN的核心配置文件yarn-site.xml。如下：


    yarn.nodemanager.aux-services#配置NodeManager上运行的附属服务，需要配置为mapreduce_shuffle
    mapreduce_shuffle


    yarn.resourcemanager.ha.enabled#开启ResourceManager的HA机制
    true


    yarn.resourcemanager.cluster-id#自定义ResourceManager集群的标识符
    yarncluster


    yarn.resourcemanager.ha.rm-ids#自定义集群中每个ResourceManager节点的唯一标识符
    rm1,rm2


    yarn.resourcemanager.hostname.rm1#指定标识符rm1的ResourceManager节点
    spark01


    yarn.resourcemanager.hostname.rm2#指定标识符rm2的ResourceManager节点
    spark02


    yarn.resourcemanager.zk-address#ZooKeeper集群地址
    spark01:2181,spark02:2181,spark03:2181


    yarn.resourcemanager.recovery.enabled#开启自动恢复功能
    true


      yarn.resourcemanager.ha.automatic-failover.enabled#开启故障自动转移
      true


    yarn.resourcemanager.store.class#ResourceManager存储信息的方式，在HA机制下用ZooKeeper（ZKRMStateStore）作为存储介质
    org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore


    yarn.log-aggregation-enable#开启YARN日志
    true

修改slaves文件
在虚拟机Spark01中，进入Hadoop安装包的/etc/hadoop/目录，执行“vi slaves”命令，编辑记录Hadoop集群所有DataNode节点和NodeManager节点主机名的文件slaves。如下：

spark01
spark02
spark03

配置Hadoop环境变量
在虚拟机Spark01中，执行“vi /etc/profile”命令编辑系统环境变量文件profile，
配置Hadoop系统环境变量。如下：

export HADOOP_HOME=/export/servers/hadoop-2.7.4
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

系统环境变量文件profile配置完成后保存并退出即可，随后执行“source /etc/profile”命令初始化系统环境变量使配置内容生效。

分发文件
为了便于快速配置Hadoop集群中其他服务器，将虚拟机Spark01中的Hadoop安装目录和系统环境变量文件分发到虚拟机Spark02和Spark03。如下：

#将Hadoop安装目录分发到虚拟机Spark02和Spark03
$ scp -r /export/servers/hadoop-2.7.4/ root@spark02:/export/servers/
$ scp -r /export/servers/hadoop-2.7.4/ root@spark03:/export/servers/
#将系统环境变量文件分发到虚拟机Spark02和Spark03
$ scp /etc/profile root@spark02:/etc/
$ scp /etc/profile root@spark03:/etc/

完成分发操作，分别在虚拟机Spark02和Spark03中执行“source /etc/profile”命令初始化系统环境变量。

验证Hadoop环境
在虚拟机Spark01中，执行“hadoop version”命令查看当前系统环境的Hadoop版本。如下图所示：

三、启动Hadoop高可用集群配置

启动ZooKeeper
分别在虚拟机Spark01、Spark02和Spark03中执行“zkServer.sh start”命令启动每台虚拟机的ZooKeeper服务。
启动JournalNode
分别在虚拟机Spark01、Spark02和Spark03中执行“hadoop-daemon.sh start journalnode”命令启动每台虚拟机的JournalNode服务。如下图所示：
初始化NameNode（仅初次启动执行）
在Hadoop集群主节点虚拟机Spark01执行“hdfs namenode -format”命令初始化NameNode操作。如下图所示：
初始化ZooKeeper（仅初次启动执行）
在NameNode主节点虚拟机Spark01，执行“hdfs zkfc -formatZK”命令初始化ZooKeeper 中的 HA 状态。
NameNode同步（仅初次启动执行）
在虚拟机Spark01中的NameNode主节点执行初始化命令后，需要将元数据目录的内容复制到其他未格式化的 NameNode备用节点（虚拟机Spark02）上，确保主节点和备用节点的NameNode数据一致。命令如下：
scp -r /export/data/hadoop/namenode/ root@spark02:/export/data/hadoop/
启动HDFS
在虚拟机Spark01中通过执行一键启动脚本命令“start-dfs.sh”，启动Hadoop集群的HDFS，此时虚拟机Spark01和Spark02上的NameNode和ZKFC以及虚拟机Spark01、Spark02和Spark03上的DataNode都会被启动。
启动YARN
在虚拟机Spark01中通过执行一键启动脚本命令“start-yarn.sh”，启动Hadoop集群的YARN，此时虚拟机Spark01上的ResourceManager以及虚拟机Spark01、Spark02和Spark03上的NodeManager都会被启动，不过虚拟机Spark02上的ResourceManager备用节点需要在虚拟机Spark02上执行“yarn-daemon.sh start resourcemanager”命令单独启动。
查看集群
分别在三台虚拟机Spark01、Spark02和Spark03上执行“jps”命令查看Hadoop高可用集群相关进程是否成功启动。

四、关闭Hadoop高可用集群

在虚拟机Spark02执行“yarn-daemon.sh stop resourcemanager”命令，关闭ResourceManager备用节点。
在虚拟机Spark02执行“stop-yarn.sh”命令，关闭YARN。
在虚拟机Spark02执行“stop-dfs.sh”命令，关闭HDFS。
分别在虚拟机Spark01、Spark02和Spark03执行“hadoop-daemon.sh stop journalnode”命令，关闭JournalNode。

好了，Hadoop的集群部署我们就讲到这里了，下一篇我们将讲解Spark集群部署

转载自：https://blog.csdn.net/u014727709/article/details/130915938
欢迎start，欢迎评论，欢迎指正

Hadoop常用端口号海洋之心 Hadoop问题解决 hadoop hbase 大数据
Hadoop是一个由多个组件构成的分布式系统，每个组件都会使用一些特定的端口号来进行通信和交互。以下是Hadoop2.x常用的端口号列表：HDFS端口号：NameNode：50070SecondaryNameNode：50090DataNode：50010DataNode（数据传输）：50020YARN端口号：ResourceManager：8088NodeManager：8042MapReduc
python编译成dll文件_Python 调用DLL文件 weixin_39682511 python编译成dll文件
http://blog.csdn.net/magictong/archive/2008/10/14/3075478.aspx貌似原文的网页服务器有问题，总是load不全，所以备个份：Python调用windows下DLL详解在python中某些时候需要C做效率上的补充，在实际应用中，需要做部分数据的交互。使用python中的ctypes模块可以很方便的调用windows的dll（也包括linux下
python 转dll_单行数据转fa UXOFFER python 转dll
Kim读完需要4分钟速读仅需2分钟/单行数据转fa/虽然已经慢慢淡出生信领域，慢慢渗透到IT,看到洲更和阿秭发这种让人手痒的问题，就忍不住在写完一堆自己都想吐的逻辑实现后抓住这个小问题练习一下，避免手生，也算是给摸了这么长时间的鱼一点安慰吧。1可能是最简单的方式这是非常适合萌新上手的练习，如果你还没有linux也没关系，gitforwindows提供了常用的gnu工具包括sedawkgrep三剑客
【python基础】—pip与conda的区别 sodaloveer python基础 #python安装命令 python pip conda
文章目录一、pip与conda1、支持语言2、Repo源3、包的内容4、环境隔离5、依赖关系6、总结二、pipinstall与condainstall1、库的存储位置2、总结三、pipuninstall与condauninstall一、pip与conda1、支持语言pip是官方推荐的python包管理器，但是只能安装python包。conda是一个跨平台（支持linux,mac,win）的通用包和
conda安装qgis，实现智能编图（亲测） LEILEI18A Python GIS-WebGIS conda qgis pyqt pyqgis
conda安装qgis（亲测没问题，目前测试win10+，linux其实也是可以的）目录0.注意1.前提2.准备条件3.实战4.相关开发资料5.扩展0.注意qgis是开源的基于QT5，pyqgis基于pyqt5，QT5可以免费商用（只要不重新编译修改源码），pyqt5商用需要花钱，只能开源！“仁者见仁智者见智了”。1.前提意外发现conda可以安装qgis，即使不是完全版，但是矢量空间分析都可以用
Linux部署Tomcat无法访问 zb_3Dmax java tomcat linux 服务器开发语言 servlet
前言环境：RedHat7.0，Tomcat7，JDK7安装配置成功之后，启动tomcat服务，然后使用本地浏览器访问http://xx:xx:xx:xx:8080，无法访问。解决过程首先怀疑是配置问题，终端输出：echo$JAVA_HOMEecho$TOMCAT_HOME一切正常，排除然后怀疑是防火墙问题：RHEL7中使用了firewalld代替了原来的iptables，操作设置和原来有点不同：查
Tomcat 8.5 优化指南最爱で毛毛熊 tomcat
Tomcat8.5优化指南Tomcat8.5是一个广泛使用的JavaWeb应用服务器，但在高并发或资源受限的环境中，默认配置可能无法满足性能需求。以下是一些常见的优化措施，帮助你提升Tomcat8.5的性能和稳定性。1.JVM优化Tomcat运行在JVM上，优化JVM参数可以显著提升性能。1.1内存设置调整JVM的堆内存大小，避免内存不足或频繁的垃圾回收。在catalina.sh（Linux）或c
大数据专业毕业设计选题118例：数据挖掘数据分析可视化 HaiLang_IT 毕设选题教程毕业设计大数据数据挖掘
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了大数据专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇总
Hadoop综合项目——二手房统计分析（可视化篇） WHYBIGDATA 大数据项目 hadoop 大数据
Hadoop综合项目——二手房统计分析（可视化篇）文章目录Hadoop综合项目——二手房统计分析（可视化篇）0、写在前面1、数据可视化1.1二手房四大一线城市总价Top51.2统计各个楼龄段的二手房比例1.3统计各个城市二手房标签的各类比例1.4统计各个城市各个楼层的平均价格1.5统计各个城市二手房优势的各类比例1.6统计各个城市二手房数量和关注人数的关系1.7统计各个城市二手房规格的各类比例1.
Linux环境基础开发工具yum和vim使用 Yu_Lijing Linux linux centos 运维
目录1.Linux软件包管理器yum1.1什么是软件包1.2关于rzsz1.3注意事项1.4查看软件包注意事项：1.5如何安装软件注意事项：1.6如何卸载软件2.1Linux编辑器-vim使用2.1.1vim的基本概念2.1.2vim的基本操作2.1.3vim正常模式命令集2.1.4vim末行模式命令集2.1.5vim操作总结2.1.6简单vim配置3.总结1.Linux软件包管理器yum1.1什
【Stable Diffusion部署至GNU/Linux】安装流程星星点点洲 stable diffusion
以下是安装StableDiffusion的步骤，以Ubuntu22.04LTS为例子。显卡与计算架构介绍CUDA是NVIDIAGPU的专用并行计算架构技术层级说明CUDAToolkit提供GPU编译器(nvcc)、数学库(cuBLAS)等开发工具cuDNN深度神经网络加速库（需单独下载）GPU驱动包含CUDADriver（需与CUDAToolkit版本匹配）CUDA与NIDIA：硬件指令集绑定：N
netfilter和iptables--netfilter源码篇 Estrella-q linux网络协议栈 linux
netfilter和iptables–netfilter源码篇防火墙是保护服务器和基础设施的重要工具，在Linux系统下，目前广泛使用的防火墙工具是iptables，但实际进行规则实施并产生实际作用的是Netfilter，iptables与内核中的netfilter框架中Hook协同工作，实现IP数据包的控制与过滤，本次将基于Linux6.5从源码视角分析。总视角下网络通信协议栈模式如下：图中各个
linux 内核回调,Linux 内核通知链随笔【下】 iwbunny linux 内核回调
书接上回，闲话不表。话说，女神无论是在土豪或者屌丝那里都找不到归属感，冥冥之中天上掉下来一个王子(PS:又名高富帅)，既可以满足女神的物质需求还可以满足女神的精神需求：点击(此处)折叠或打开/*GFS.c*/#include#include#include#include#include#include#include#includeMODULE_LICENSE("GPL");/**注册通知链*/
linux是一个单用户的系统,linux系统进入单用户模式 weixin_40005437 linux是一个单用户的系统
进入单用户模式可进行root账户和其他普通账户的密码的修改1)Ubuntu开机到grub时(在开机时长按shift键)，用上下键移到第二行的恢复模式(recoverymode)，按e(注意不是回车)把rosingle改成rwquietinit=/bin/bash然后按Ctrl+x2)redhat1)开机出现倒数秒---回车2)看见RedHatEnterpriseLinuxServer(2.6.18
【vLLM 学习】安装
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM是一个Python库，包含预编译的C++和CUDA(12.1)二进制文件。依赖环境操作系统：LinuxPython：3.8-3.12GPU：计算能力7.0或更高（例如V100、T4、RTX20xx、A100、L
三种方式实现人车流统计（yolov5+opencv+deepsort+bytetrack+iou） Jayson God 人工智能 c++yolov5 opencv 算法人工智能
一、运行环境1、项目运行环境如下2、CPU配置3、GPU配置如果没有GPUyolov5目标检测时间会比较久二、编程语言与使用库版本项目编程语言使用c++，使用的第三方库，onnxruntime-linux-x64-1.12.1，opencv-4.6.0opencv官方地址Releases-OpenCVopencvgithub地址https://github.com/opencv/opencv/tr
大数据之-hdfs+hive+hbase+kudu+presto集群(6节点) 管哥的运维私房菜大数据 hdfs hive kudu presto hbase
几个主要软件的下载地址：prestohttps://prestosql.io/docs/current/index.htmlkudurpm包地址https://github.com/MartinWeindel/kudu-rpm/releaseshivehttp://mirror.bit.edu.cn/apache/hive/hdfshttp://archive.apache.org/dist/ha
.Net 7 新编译器 ILC 简析 dotNET跨平台 .net
楔子：这个新编译器的全称是ILCompiler。是之前CoreRT项目合并过来的，在.Net7成熟，并且可以产业化应用。本质：ILC编译器的本质除了构建CLR的所拥有的主要功能，还包含了对LLVM这种意图取代GCC编译器的操作，对于LLVM主要是用来Win，Linux,Macos三种不同的操作系统的目标文件而所做的封装。一.CLR的主要功能：1.构建内存模型，比如MethodTable,EECla
Linux（WSL/Ubuntu）vscode配置C++调试环境与相关问题力行128 linux ubuntu vscode c++
步骤：先cmake编译得到可执行的二进制文件，将生成的二进制文件添加到launch.json的"program":处。可用的json文件如下，根据自己程序更改：tasks.json（编译器构建设置）launch.json（调试器设置）c_cpp_properties.json（编译器路径和IntelliSense设置）1.launch.json注：需要将可执行文件填到launch的program处
网络安全入门信息收集与漏洞扫描（二）挣扎与觉醒中的技术人网络安全入门及实战 web安全网络安全 c++程序人生
主动信息收集1Nmap扫描端口与服务（1）Nmap是什么？定义：网络探测工具，用于扫描开放端口、识别服务及操作系统。典型用途：发现目标存活主机（ping扫描）。识别开放端口和运行的服务（如SSH、HTTP、数据库）。探测操作系统类型（Windows/Linux）。（2）基础扫描命令快速扫描常用端口：nmap-sV-T4192.168.1.100#-sV探测服务版本，-T4加速扫描示例输出：PORT
Visual Studio Code支持WSL，直接修改linux/ubuntu中的文件柳鲲鹏 docker vscode ide 编辑器
步骤1开始通过WSL使用VSCode|MicrosoftLearn点击远程开发扩展包。步骤2RemoteDevelopment-VisualStudioMarketplace点击install，允许打开VisualStudioCode。步骤3共有4项，一齐安装。步骤4在WSLLinux(Ubuntu)中：sudoapt-getinstallwgetca-certificates打开步骤1准备工作完
linux下使用mysql(上) It塔塔开 linux mysql 运维
1、安装mysqlaptsearchmysql-server...#查询结果mysql-server-8.0/focal-security,focal-updates8.0.41-0ubuntu0.20.04.1amd64MySQLdatabaseserverbinariesandsystemdatabasesetup...aptinstallmysql-server-8.0...2、连接数据库m
OpenEuler22.03 LTS SP3 系统优化运维小弟| srebro.cn openeuler 系统优化
OpenEuler22.03LTSSP3系统优化1、关闭selinuxsetenforce0sed-i"s#SELINUX=enforcing#SELINUX=disabled#g"/etc/selinux/config2、禁用swapswapoff-ased-ri's/.*swap.*/#&/'/etc/fstab3、公有云机器，必须安全加固（1）、设置禁止root通过ssh远程登录【修改之前请
推荐开源备份神器：BackupPC，企业级数据守护者徐耘馨
推荐开源备份神器：BackupPC，企业级数据守护者项目地址:https://gitcode.com/gh_mirrors/ba/backuppc在数字时代，数据如同企业的生命线，重要性不言而喻。为了保障这份“生命线”的安全，今天我们来探讨一个高效且成熟的备份解决方案——BackupPC。项目介绍BackupPC是一款基于Perl编写的高性价比企业级备份系统，专为Linux、Windows和Mac
使用Docker搭建Flink集群 O_1CxH Flink大数据 Kafka大数据 docker flink 容器
目录使用Docker搭建Flink集群docker-compose一键搭建步骤附录参考资料使用Docker搭建Flink集群在学习大数据框架的时候，需要一个真实的环境。我们知道，像spark、flink这些计算框架都有多种运行模式：在本地使用多线程模拟集群真正的分布式集群如果直接在IDE（Intellj）里面编译和运行写好的程序，实际上是用的前一种运行模式；如果想尝试真正的生产环境中任务的提交和管
解决Deepseek服务器繁忙的两种高效方案：本地部署与平替平台实测小真— 自然语言处理 ai 人工智能
近期爆火的Deepseek访问量激增频繁出现服务器繁忙提示，严重影响工作效率。本人实测了两种有效解决方案，整理了出这份保姆级指南。方案一：本地化部署核心优势说白了就是模型部署在自己本地，只有自己一个人用了没人挤了，但是对电脑硬件要求高部署步骤详解环境准备系统要求：Linux/Windows10+（推荐Ubuntu20.04）硬件配置：NVIDIA显卡（显存≥8GB）、内存≥16GB安装依赖：Pyt
Python 第三方库 PyQt5 的安装狐凄实例学习开发语言
目录前言PyQt5安装不同操作系统PyQt5安装一、Windows系统二、macOS系统三、Linux系统（以Ubuntu为例）安装PyQt5可能会遇到的问题一、环境相关问题二、依赖问题三、网络问题四、安装工具问题五、运行时问题六、环境配置问题七、安装源问题八、检查错误信息九、运行时错误十、尝试不同的安装方法问题解决环境相关问题一、Python版本兼容性问题二、操作系统特定问题三、依赖库问题四、环
Linux 磁盘扩容 zzq100zzq linux centos 运维
一、查看系统磁盘1、使用df-hl,查看系统的磁盘使用情况二、linux磁盘扩容当LVM分区空间不足的时候，可以进行扩容，主要的扩容方法有：1、通过空余的磁盘进行扩容，这个方法比较简单，不会对原有数据有影响。2、将其他LVM分区空间取出来一部分给需要扩容的LVM分区。下面介绍两种方法三、利用空余磁盘扩容1、使用fdisk-l查看磁盘情况，看系统有几个硬盘。一般为：/dev/sda,/dev/sdb
PVE 网络配置详解：双网卡聚合与 Linux 网络管理技巧 The god of big data 虚拟系统神器？三叉戟？教程网络 linux 运维
ProxmoxVE（PVE）作为基于Linux的虚拟化平台，其网络配置逻辑与Windows存在显著差异，尤其在多网卡管理、链路聚合（Bonding）等方面。本文将以双网卡聚合为核心，详解PVE的网络配置方法，并对比Windows帮助用户快速上手。一、Linux与Windows网络配置的核心区别1.网卡命名规则Windows：网卡名称为“以太网”“本地连接”等，可自定义。PVE（Linux）：网卡默
中国第一本介绍企业级开发工具Zend的书籍 weixin_34245749 开发工具数据库 javascript ViewUI
【书名】大道PHP：LAMP+Zend+开源框架整合开发与实战【作者】三扬科技【ISBN】978-7-121-09171-1【出版社】电子工业出版社【出版日期】2009年9月【定价】99.00元（含视频DVD1张）【宣传语】第一本介绍企业级开发工具Zend的书籍最完整的PHP5开发技术与实战代码万用大全基于Linux+Apache+MySQL+PHP黄金组合，Socket、WebService、A
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

Hadoop集群部署和启动与关闭

你可能感兴趣的:(Linux,大数据,hadoop,大数据,hdfs,namenode,datanode)