星川皆无恙

Linux从零搭建Hadoop集群(CentOS7+hadoop 3.2.0+JDK1.8+Mapreduce完全分布式集群案例)

Linux从零搭建Hadoop集群(CentOS7+hadoop3.2.0+JDK1.8+Mapreduce完全分布式集群案例)

关键字和相关配置版本

关键字：Linux CentOS Hadoop Java
版本： CentOS7 Hadoop3.2.0 JDK1.8

基本主从思路：

先把基础的设置在一台虚拟机（master）上配好，通过克隆改节点IP、主机名、添加主从ip与对应的主机名，获得剩下一台虚拟机（node1）！
此次搭建的集群的一台主机，一台从机的主从结构。
（可以根据自己的实际情况设置多台从机，本文内容我这个从机是一个，多加几个节点也很简单，看个人爱好或者个人需求。）

说明：Hadoop从版本2开始加入了Yarn这个资源管理器，Yarn并不需要单独安装。只要在机器上安装了JDK就可以直接安装Hadoop，单纯安装Hadoop并不依赖Zookeeper之类的其他东西。

文章目录

关键字和相关配置版本
一、首先要先在虚拟机搭建Linux CentOS7
二、直接选择root用户
三、实现ssh免密码登录
四、CentOS7 安装jdk1.8
五、下载hadoop
六、启动Hadoop
七、运行MapReduce集群

一、首先要先在虚拟机搭建Linux CentOS7

不懂的小伙伴可以在看我之前写的博客：

附链接：
虚拟机搭建Linux CentOS7（详细图文讲解）

二、直接选择root用户

我直接选择root用户登录，避免了普通用户授权和切换用户导致的一些环境问题，简单来说就是高效。

这样进来直接就是root用户，不用再那么麻烦输入密码啥的：

三、实现ssh免密码登录

配置ssh的无密码访问

ssh-keygen -t rsa

连续按回车

cd ~/.ssh

cat id_rsa.pub >> authorized_keys

让ssh服务器自动启动

vi ~/.bashrc

在文件的最末尾按O进入编辑模式，加上：

/etc/init.d/ssh start

按ESC返回命令模式，输入:wq保存并退出。
让修改即刻生效

source ~/.bashrc

四、CentOS7 安装jdk1.8

1、yum安装

安装之前先查看一下有无系统自带jdk,有的话先卸载。

rpm -qa | grep jdk

[root@master ~]#rpm -qa | grep jdk
copy-jdk-configs-3.3-10.el7_5.noarch
java-1.8.0-openjdk-headless-1.8.0.322.b06-1.el7_9.x86_64
java-1.8.0-openjdk-devel-1.8.0.322.b06-1.el7_9.x86_64
java-1.8.0-openjdk-javadoc-zip-1.8.0.322.b06-1.el7_9.noarch
java-1.8.0-openjdk-1.8.0.322.b06-1.el7_9.x86_64
java-1.8.0-openjdk-accessibility-1.8.0.322.b06-1.el7_9.x86_64
java-1.8.0-openjdk-demo-1.8.0.322.b06-1.el7_9.x86_64
java-1.8.0-openjdk-src-1.8.0.322.b06-1.el7_9.x86_64
java-1.8.0-openjdk-javadoc-1.8.0.322.b06-1.el7_9.noarch

卸载jdk：

rpm -e --nodeps  上步查询出的所有jdk

例如：
[root@master ~]# rpm -e --nodeps copy-jdk-configs-3.3-10.el7_5.noarch
[root@master ~]# rpm -e --nodeps java-1.8.0-openjdk-headless-1.8.0.322.b06-1.el7_9.x86_64
[root@master ~]# rpm -qa | grep jdk
java-1.8.0-openjdk-devel-1.8.0.322.b06-1.el7_9.x86_64
java-1.8.0-openjdk-javadoc-zip-1.8.0.322.b06-1.el7_9.noarch
java-1.8.0-openjdk-1.8.0.322.b06-1.el7_9.x86_64
java-1.8.0-openjdk-accessibility-1.8.0.322.b06-1.el7_9.x86_64
java-1.8.0-openjdk-demo-1.8.0.322.b06-1.el7_9.x86_64
java-1.8.0-openjdk-src-1.8.0.322.b06-1.el7_9.x86_64
java-1.8.0-openjdk-javadoc-1.8.0.322.b06-1.el7_9.noarch
[root@test ~]#

rpm -e --nodeps 我这只执行了两次，剩下的7个卸载同样的操作，在此不在执行。

验证是否已经卸载干净：

rpm -qa|grep java

java -version

卸载完之后开始安装jdk1.8：

查看可安装的版本

yum list java*

安装1.8.0版本openjdk

yum -y install java-1.8.0-openjdk*

安装位置查看：

rpm -qa | grep java

rpm -ql java-1.8.0-openjdk-1.8.0.352.b08-2.el7_9.x86_64

环境变量配置：
当前用户使用:

vi ~/.bashrc

或者全局用户使用：

vi /etc/profile

添加：

export JAVA_HOME=/usr/lib/jvm/java-openjdk
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

然后执行

 source ~/.bashrc

或者

 source /etc/profile

命令使修改的配置文件生效。

验证安装：

java -version

五、下载hadoop

引用文本本博文使用的hadoop是3.2.0版本
打开下载地址选择页面：http://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-3.2.0/hadoop-3.2.0.tar.gz

也可以更方便的挑选自己合适的hadoop版本号直接去下载：

网址：

https://archive.apache.org/dist/hadoop/common/

然后上传文件并解压缩
1.在opt目录下新建一个名为hadoop的目录，并将下载得到的hadoop-3.2.0.tar上载到该目录下

   mkdir /opt/hadoop

解压安装:

 tar -xvf hadoop-3.2.0.tar.gz

配置Hadoop环境变量:

vi /etc/profile

添加hadoop环境变量后：

export JAVA_HOME=/usr/lib/jvm/java-openjdk
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin:/opt/hadoop/hadoop-3.2.0/bin:/opt/hadoop/hadoop-3.2.0/sbin
export HADOOP_HOME=/opt/hadoop/hadoop-3.2.0
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

然后执行

source /etc/profile

使修改的配置文件生效。

Hadoop配置文件修改
新建几个目录:

mkdir /root/hadoop
mkdir /root/hadoop/tmp
mkdir /root/hadoop/var
mkdir /root/hadoop/dfs
mkdir /root/hadoop/dfs/name
mkdir /root/hadoop/dfs/data

修改etc/hadoop中的一系列配置文件

 vi /opt/hadoop/hadoop-3.2.0/etc/hadoop/core-site.xml

在节点内加入配置:

<configuration>
 <property>
        <name>hadoop.tmp.dirname>
        <value>/root/hadoop/tmpvalue>
        <description>Abase for other temporary directories.description>
   property>
   <property>
        <name>fs.default.namename>
        <value>hdfs://master:9000value>
   property>
   configuration>

修改hadoop-env.sh

vi /opt/hadoop/hadoop-3.2.0/etc/hadoop/hadoop-env.sh

将 export JAVA_HOME=${JAVA_HOME}
修改为： export JAVA_HOME=/usr/lib/jvm/java-openjdk
说明：修改为自己的JDK路径

修改hdfs-site.xml

vi /opt/hadoop/hadoop-3.2.0/etc/hadoop/hdfs-site.xml

在节点内加入配置：

<configuration>
<property>
   <name>dfs.name.dirname>
   <value>/root/hadoop/dfs/namevalue>
   <description>Path on the local filesystem where theNameNode stores the namespace and transactions logs persistently.
   description>
property>

<property>
   <name>dfs.data.dirname>
   <value>/root/hadoop/dfs/datavalue>
   <description>Comma separated list of paths on the localfilesystem of a DataNode where it should store its blocks.
   description>
property>

<property>
   <name>dfs.replicationname>
   <value>2value>
property>

<property>
   <name>dfs.permissionsname>
   <value>falsevalue>
   <description>need not permissionsdescription>
property>
configuration>

新建并且修改mapred-site.xml：

vi /opt/hadoop/hadoop-3.2.0/etc/hadoop/mapred-site.xml

在节点内加入配置:

<configuration>

<property>
   <name>mapreduce.framework.namename>
   <value>yarnvalue>
property>
configuration>

修改workers文件：

vi /opt/hadoop/hadoop-3.2.0/etc/hadoop/workers

将里面的localhost删除，添加以下内容：

master
node1

修改yarn-site.xml文件：

HADOOP_CLASSPATH 是设置要运行的类的路径。否则当你用hadoop classname [args]方式运行程序时会报错，说找不到要运行的类。用hadoop jar jar_name.jar classname [args]方式运行程序时没问题

这边需要设置hadoop classpath否则后面mapreduce会报错找不到主类：

hadoop classpath

记下返回的结果

vi /opt/hadoop/hadoop-3.2.0/etc/hadoop/yarn-site.xml

添加一个配置

<property>
        <name>yarn.application.classpath</name>
        <value>hadoop classpath返回信息</value>
</property>

这是我的yarn-site.xml配置:

<configuration>
        <property>
            <name>yarn.nodemanager.aux-servicesname>
            <value>mapreduce_shufflevalue>
        property>
        <property>
            <name>yarn.resourcemanager.hostnamename>
            <value>mastervalue>
        property>
        <property>
            <name>yarn.application.classpathname>
            <value>/opt/hadoop/hadoop-3.2.0/etc/hadoop:/opt/hadoop/hadoop-3.2.0/share/hadoop/common/lib/*:/opt/hadoop/hadoop-3.2.0/share/hadoop/common/*:/opt/hadoop/hadoop-3.2.0/share/hadoop/hdfs:/opt/hadoop/hadoop-3.2.0/share/hadoop/hdfs/lib/*:/opt/hadoop/hadoop-3.2.0/share/hadoop/hdfs/*:/opt/hadoop/hadoop-3.2.0/share/hadoop/mapreduce/lib/*:/opt/hadoop/hadoop-3.2.0/share/hadoop/mapreduce/*:/opt/hadoop/hadoop-3.2.0/share/hadoop/yarn:/opt/hadoop/hadoop-3.2.0/share/hadoop/yarn/lib/*:/opt/hadoop/hadoop-3.2.0/share/hadoop/yarn/*value>
        property>
configuration>

配置hadoop-3.2.0/sbin/目录下start-dfs.sh、start-yarn.sh、stop-dfs.sh、stop-yarn.sh文件

服务启动权限配置
配置start-dfs.sh与stop-dfs.sh文件

vi sbin/start-dfs.sh

和

 vi sbin/stop-dfs.sh

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

配置start-yarn.sh与stop-yarn.sh文件

vi sbin/start-yarn.sh

和

vi sbin/stop-yarn.sh

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

配置好后，克隆虚拟机，

vim /etc/sysconfig/network-scripts/ifcfg-ens33

修改ip

修改主机名：

vi /etc/hostname

修改对应的ip 和主机名（主从节点保持一致）

vim /etc/hosts

主从节点互连ssh试试：

ssh node1

ssh master

OK，互连成功。（按exit可以退出）

六、启动Hadoop

因为master是namenode，node1是datanode，所以只需要对master进行初始化操作，也就是对hdfs进行格式化。
进入到master这台机器/opt/hadoop/hadoop-3.2.0/bin目录：

  cd /opt/hadoop/hadoop-3.2.0/bin

执行初始化脚本

  ./hadoop namenode -format

然后执行启动进程：

./sbin/start-all.sh

运行结果:

master是我们的namenode，该机器的IP是192.168.95.20，在本地电脑访问如下地址:

http://192.168.95.20:9870/

在本地浏览器里访问如下地址：

http://192.168.95.20:8088/cluster

自动跳转到cluster页面

在hdfs上建立一个目录存放文件
假设该目录为：

./bin/hdfs dfs -mkdir -p /home/hadoop/myx/wordcount/input

查看分发复制是否正常

./bin/hdfs dfs -ls /home/hadoop/myx/wordcount/input

七、运行MapReduce集群

Mapreduce运行案例：
在hdfs上建立一个目录存放文件
例如

./bin/hdfs dfs -mkdir -p /home/hadoop/myx/wordcount/input

把文本程序放进去

mkdir hello

vim hello

加入下面内容：

hadoop yarn spark
hadoop mapreduce
hadoop spark
hadoop spark

./bin/hdfs dfs -put hello /home/hadoop/myx/wordcount/input

查看分发情况

./bin/hdfs dfs -ls /home/hadoop/myx/wordcount/input

运行MapReduce自带wordcount的示例程序：

./bin/hadoop jar /opt/hadoop/hadoop-3.2.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.0.jar  wordcount /home/hadoop/myx/wordcount/input /home/hadoop/myx/wordcount/output

运行结束后，查看输出结果

hdfs dfs -cat /home/hadoop/myx/wordcount/output/part-r-00000*

详细截图：

运行输出结果也可以在web端查看，里面有详细信息：

OK，花了快2小时的Linux从零搭建Hadoop集群(CentOS7+hadoop 3.2.0+JDK1.8+Mapreduce完全分布式集群)终于整理完成了，辛苦的小马同学决定奖励自己一把大乱斗，希望此教程对各位有所帮助，这些都已经试过水了，各位环境配置和操作没问题的话，基本都能部署完成，祝各位一切顺利。

你可能感兴趣的:(大数据,系统运维,JAVA,hadoop,mapreduce,分布式)

Java注解说明书：从正确姿势到防坑指南，让你的代码会说话！双囍菜菜 Java java python 开发语言
《Java注解说明书：从正确姿势到防坑指南，让你的代码会说话！》——手把手教你玩转官方小标签，避开90%新手踩过的坑文章目录《Java注解说明书：从正确姿势到防坑指南，让你的代码会说话！》第一章：初识注解——代码世界的智能便利贴1.1注解的前世今生：从纸质标签到数字革命1.2注解的四大核心价值与实现原理第二章：基础三巨头——每个Javaer必须刻进DNA的标签2.1@Override：防手残终极护
DeepSeek底层揭秘——Smallpond 9命怪猫 AI 人工智能大模型 ai
目录1.Smallpond是什么？(1)定义(2)核心功能2.对比传统数据处理框架3.技术要素(1)分布式数据加载(2)并行数据预处理(3)分布式缓存(4)数据流水线4.难点挑战（含解决方案）(1)数据I/O瓶颈(2)数据预处理复杂性(3)分布式缓存一致性(4)与3FS集成5.技术路径(1)需求分析与设计(2)原型开发与测试(3)系统优化与扩展(4)系统部署与维护6.应用场景(1)大规模图像分类(
Python, Java 联合开发全国以及港澳主要商业银行办信用卡实操APP (Siliver) Geeker-2025 python java
以下是一个使用Python和Java联合开发全国以及港澳主要商业银行办信用卡实操APP的示例架构和部分代码示例。这个APP主要功能包括查询银行信息、了解办信用流程、模拟申请信用卡等操作。###整体架构概述-**Python部分**：-用于数据处理和分析，例如从各种数据源获取银行信息、信用政策等数据，并进行数据清洗和整理。-可以利用数据分析和可视化库来辅助生成信用评估报告和相关图表。-**Java部
Java nmap 命令网络安全（king）网络安全黑客网络工程师网络 web安全安全
Java与Nmap的结合：网络安全监测利器在现代网络环境中，安全性是至关重要的。尤其在企业和组织中，维护网络的安全性将直接影响到其运营的正常进行。Nmap（NetworkMapper）是一个开源的网络扫描工具，广泛应用于网络安全评估。今天，我们结合Java语言，探讨如何利用Java调用Nmap命令以实现网络安全监测的目的。什么是Nmap？Nmap是一个强大的网络扫描工具，可以用于发现网络上的设备、
Hbase在hdfs上的archive目录占用空间过大宝罗Paul 大数据 hbase
hbase版本：1.1.2hadoop版本：2.7.3Hbase在hdfs上的目录/apps/hbase/data/archive占用空间过大，导致不停地发出hdfs空间使用率告警。【问题】告警信息alert:datanode_storageistriggered告警信息表明某个或某些datanode的HDFS存储空间使用率已超过阈值(我们设置的是80%)，需要清理。[hdfs@master-2r
TCP通信-支持服务端与多个客户端同时通信冷眼热眸 JAVA语言 tcp/ip 网络服务器网络协议 java
在上一篇文章中，我展示了基于TCP通信协议的客户端与服务端进行通信，但是只能有一个客户端与服务端进行通信，详情请点击括号内的文章(UDP传输协议和TCP传输协议的解释和实例)。本篇文章讲述；基于多线程实现多个客户端与服务端同时通信，且附有代码的注解。客户端代码如下（Client）packagecom.itheima_tcp;importjava.io.DataOutputStream;import
Java直通车系列13【Spring MVC】（Spring MVC常用注解）浪九天 Java直通车 java spring 后端
目录1.@Controller2.@RequestMapping3.@GetMapping、@PostMapping、@PutMapping、@DeleteMapping4.@RequestBody5.@ResponseBody6.@PathVariable7.@RequestParam8.@ModelAttribute在SpringMVC项目中，注解是非常重要的组成部分，它可以帮助我们更简洁、高
H5播放webrtc视频视频处理html5
一、简介WebRTC概念WebRTC是由Google主导的，由一组标准、协议和JavaScriptAPI组成，用于实现浏览器之间（端到端之间）的音频、视频及数据共享。WebRTC不需要安装任何插件，通过简单的JavaScriptAPI就可以使得实时通信变成一种标准功能。为什么使用webrtc现在各大浏览器以及终已经逐渐加大对WebRTC技术的支持。下图是webrtc官网给出的现在已经提供支持了的浏
Kubernetes_15_k8s交付jenkins并集成docker/k8s/java/maven环境 hellowordx007 Kubernetes kubernetes 服务器 linux
配置jenkins镜像并集成Docker环境在运维机执行[root@wwwjenkins]#pwd/opt/sortware/jenkins[root@wwwjenkins]#vimDockerfile##配置Dockerfile集成Docker环境FROMjenkins/jenkins:2.287USERrootADDkubectl/usr/bin/kubectlADDget-docker.sh
如何下载和使用Git：初学者指南黄同学real Git 后端开发前端 git
如何下载和使用Git：初学者指南在当今的软件开发中，Git已经成为不可或缺的版本控制系统。无论你是独立开发者还是团队成员，掌握Git的基本操作都能帮助你更高效地管理代码。今天，我将详细介绍如何下载和使用Git，帮助你快速上手。一、什么是Git？Git是一个开源的分布式版本控制系统，用于跟踪文件和目录的更改。它允许你记录代码的版本历史，协作开发，并在不同版本之间切换。Git的核心优势在于它的灵活性和
关于Android Studio编译时提示Execution failed for task ‘:xxx:compileDebugJavaWithJavac‘ 居然是阿宋 android studio android gradle
在项目首次导入编译时，总是会出现一些比较难排除的问题，特别是在提示中无法直接找到原因：*Exceptionis:org.gradle.api.tasks.TaskExecutionException:Executionfailedfortask':bc_iothub:compileDebugJavaWithJavac'.atorg.gradle.api.internal.tasks.propert
开源项目 cs294639693
阿里阿里的开源项目很多，这也跟@淘宝正明的开源态度密不可分。有很多重量级的项目，例如LVS、Tengine，或者很有实践价值的中间件，例如MetaQ(分布式消息系统)、dubbo(RPC框架)、cobar(数据库中间件)，或者是Java世界的工具，例如druid、fastjson。都说国内Java公司的技术架构大部分来自阿里系，我觉得一方面来自阿里员工，一方面也可以来自阿里的开源项目。地址有几个：
180.HTML、CSS、JavaScript 我也念过晚霞 html css javascript
———————————————————————————————【1.引言】在Android开发过程中，前端技术（HTML、CSS、JavaScript）逐渐成为不可或缺的技能之一。无论是通过WebView显示网页内容，还是构建混合应用，掌握前端基础将有助于提升整体产品体验。本文在保证内容全面性的前提下，剔除了多余的推荐信息，直接进入技术核心讲解。通过详细介绍HTML、CSS与JavaScript的
如何在Android中实现网络请求 python资深爱好者 android 网络
在Android中实现网络请求有多种方法，常用的几种方法包括使用HttpURLConnection、OkHttp库和Retrofit库。下面分别介绍这几种方法：1.使用HttpURLConnectionHttpURLConnection是Java标准库提供的类，用于处理HTTP请求。下面是一个简单的例子：java复制代码importjava.io.BufferedReader;importjava
Java进阶——一篇搞懂多线程实战 1加1等于 Java java
本文主要是对Java多线程相关知识进行总结和讲解。一、线程创建方式继承Thread类：通过重写run()方法来定义线程的执行逻辑，只能单继承。实现Runnable接口：这种方式更加灵活，避免了单继承的问题，而且同一个Runnable实例可以被多个线程共享，提高了代码的复用性，因此在实际开发中更为推荐。实现Callable接口：与前两种方式不同，Callable接口支持线程执行后返回结果，并且可以抛
android多个usb摄像头,Android中多USB摄像头解决方案——UVCCamera源码分析（四）桔子毛 android多个usb摄像头
经过前几章的学习，我们大概了解了整个UVCCamera初始化、开始预览的过程。那么接着我们将来看看UVCCamera是如何实现拍照功能的。本章内容相对比较简单，均是Java层的实现。我们直接来看代码：@OverridepublicvoidcaptureStill(finalStringpath,OnCaptureListenerlistener){super.captureStill(path,l
全网最简单实用Android平板USB摄像头开发，同时预览多个摄像头，双目摄像头，同时打开手机前后摄像头（红外摄像头、人脸识别、活体检测、Android Camer 云启软件 Android原生笔记
老规矩，先视频8月20日背景：多摄像头有很多实现方案，手机上能实现跑通，但是Android平板USB的找了好久才实现，需要低版本API，废话不多说直接代码：工具类importandroid.graphics.SurfaceTexture;importandroid.hardware.Camera;importandroid.view.TextureView;importjava.io.IOExce
Spring Cloud Alibaba 实战：轻松搞定 Seata 分布式事务治理扣丁梦想家微服务分布式
在微服务架构中，分布式事务是一个绕不开的话题。传统的本地事务无法满足分布式环境下的数据一致性需求，而Seata作为阿里巴巴开源的分布式事务解决方案，正是为了解决这个问题。本文将带你深入了解Seata的基本概念、优缺点，以及如何在SpringCloudAlibaba中集成和使用Seata。1.Seata介绍Seata（SimpleExtensibleAutonomousTransactionArch
华为欧拉系统 Tomcat 安装详解阿绵运维后端 tomcat java Linux
1.安装或确认安装JavaTomcat需要Java环境（JDK或JRE）才能运行。如果系统尚未安装Java，可以使用以下命令安装OpenJDK：#更新软件包索引yumupdate-y#安装OpenJDK21（可根据需求安装其他版本，如8、11、17等）yuminstall-yjava-21-openjdkjava-21-openjdk-devel#验证Java是否安装成功java-version如
从零用java实现小红书 springboot vue uniapp （2）主页优化顽疲 java仿写小红书 java spring boot vue.js
前言移动端演示http://8.146.211.120:8081/#/前面的文章我们基本完成了主页的布局今天我们具体的去进行实现并且分享我开发时遇到的问题首先先看效果java仿小红书主页实现效果为1.顶端全屏切换2.上划加载更多3.下拉当前页整体刷新顶端全屏切换我们选择gui-switch-navigation结合swiperswiper-item进行实现关键代码.................
【Spring】SpringBoot手写模拟Spring boot 九师兄 boot spring spring boot java
1.概述本章主要讲解SpringBoot手写模拟Springboot，在此之前我们先了解一下怎么创建SpringMVC。2.SpringMvc容器以前我们配置SpringMVC一般采用xml的方式配置，配置如下现在如果采用java的方式，不要xml该怎么配置呢？视频参考：SpringMvc零配置本文出自csdn九师兄，防伪标志，本文由九师兄唯一发布。原地址：https://blog.csdn.ne
Hadoop、Spark、Flink Shuffle对比逆袭的小学生 hadoop spark flink
一、Hadoop的shuffle前置知识：Map任务的数量由Hadoop框架自动计算，等于分片数量，等于输入文件总大小/分片大小，分片大小为HDFS默认值128M，可调Reduce任务数由用户在作业提交时通过Job.setNumReduceTasks(int)设置数据分配到Reduce任务的时间点，在Map任务执行期间，通过Partitioner（分区器）确定每个键值对的目标Reduce分区。默认
Tomcat 新手入门指南局外人_Jia tomcat java
Tomcat新手入门指南ApacheTomcat是一个开源的JavaServlet容器和Web服务器，广泛用于部署和运行JavaWeb应用程序。以下是Tomcat的入门指南，帮助你快速上手。1.安装Tomcat步骤1:下载Tomcat访问ApacheTomcat官网。选择适合的版本（如Tomcat9.x）并下载压缩包（zip或tar.gz）。步骤2:解压文件将下载的压缩包解压到指定目录，如/opt
Java微服务SpringCloud+Uniapp+Vue3+Element Plus开源商城BizSpring BizSpring源码商城 java spring cloud 教育电商小程序 uni-app
BizSpring开源地址Githubhttps://github.com/BizSpringSource/bizspring-vue3-opensource.gitGiteehttps://gitee.com/BizSpring/bizspring-vue3-opensource.gitBizSpring核心开源框架名称框架核心框架springboot、springcloud、springclo
【Hadoop】什么是Zookeeper？如何理解Zookeeper？ 2302_79952574 hadoop zookeeper 大数据
ZooKeeper是一个开源的分布式应用程序协调服务，可以为分布式应用提供一致性的服务，功能包括：配置维护、名字服务、分布式同步、组服务等等。ZooKeeper的目标是封装好复杂易出错的关键服务，将简单易用的接口和性能高效、功能稳定的系统提供给用户。1.Zookeeper的特点最终一致性：Client不论连接到哪个Server,展示给它的都是同一个视图。可靠性：如果某个消息被一台服务器接受，那么它
Java反射 lyrhhhhhhhh java 开发语言
在Java的世界中，反射（Reflection）是一个强大而神秘的工具。它允许程序在运行时动态地获取类的信息并操作类的属性和方法。本文将带你深入理解Java反射，揭开反射的神秘面纱。一、什么是反射？Java反射是指在运行时（runtime）动态地获取类的信息、调用类的方法、操作类的属性等功能。通过Java反射，我们可以在运行时检查类的方法和属性，实例化对象，调用方法，获取和设置属性的值，以及操作数
Java代理 lyrhhhhhhhh java 开发语言
在软件开发中，代理模式是一种非常常见的设计模式。它允许我们通过一个代理对象间接访问目标对象，从而在不修改目标对象的情况下增强其功能。代理模式广泛应用于日志记录、权限校验、事务管理、延迟加载等场景。本文将带你深入了解Java中的代理模式，包括静态代理和动态代理的实现方式。一、什么是代理给目标对象提供一个代理对象，并且由代理对象控制着对目标对象的引用在程序中，代理模式的核心思想是：代理对象：代替目标对
【Hadoop】详解HDFS 2302_79952574 hadoop hdfs 大数据
Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件上的分布式文件系统，它是一个高度容错性的系统，适合部署在廉价的机器上，能够提供高吞吐量的数据访问，非常适合大规模数据集上的应用。为了做到可靠性，HDFS创建了多份数据块的副本，并将它们放置在服务器群的计算节点中，MapReduce可以在它们所在的节点上处理这些数据。1.HDFS的设计目标存储大规模数据：HDFS可以存储并管理PB级甚至
Android应用开发面试题 qhs1573 android jvm
以下是一些AndroidAPP开发的面试题及其答案：一、单项选择题在Android中，用于管理Activity生命周期的类是（）。A.ContextB.ApplicationC.ActivityManagerD.Lifecycle答案：DAndroid中常用的布局文件后缀是（）。A..xmlB..jsonC..javaD..txt答案：A以下哪个方法用于在Activity中获取布局视图（）。A.s
如何禁用移动端页面的多点触控和手势缩放几度泥的菜花 javascript 前端
在移动端开发中，有时我们需要禁用页面的多点触控和手势缩放功能，以确保页面的交互体验更加可控。本文将介绍如何通过JavaScript和CSS实现这一功能。1.禁用多点触控在移动设备上，多点触控通常用于缩放页面或执行其他手势操作。如果我们希望禁用多点触控，可以通过监听touchstart事件来实现。document.addEventListener('touchstart',function(even
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修