lilin_xdu

hadoop hdfs搭建 mapreduce环境搭建 wordcount程序简单注释

一实验室环境下 hadoop集群配置

一、环境说明

实验室中多台机器都属于同一局域网，主机的操作系统多为windows系统，而hadoop要在linux环境下配置，因此我们选用了host（windows7）+Vmware（ubuntu）的方式进行了实验性的配置。

机器三台，分别做namenode（12G内存八核处理器 1TB硬盘）和两个datanode（4G内存双核处理器 1TB硬盘）。下面进入正式的配置过程。

二、虚拟机的安装及上网方式的选择

虚拟机上网方式，选择桥接。

虚拟机器上安装linux(ubuntu)系统，上网方式：选择有线网络，手动设置IP。网关。IP与主机网段相同。网关与主机相同，DNS与主机相同。

我们这次试验中机器的配置的ip结果如下

Datanode ： 219.245.72.244

Namenode1: 219.245.72.242

Namenode2： 219.245.72.243

这是如果网络是好的，各个linux系统之间可以ping通。

三、安装ssh服务

在安装之前把虚拟机的上网方式改成Nat，Bridge方式不能直接上网。Linux系统设置成自动获取ip。

下面安装openssh-server ，并配置各节点的公钥私钥

对于每个节点：

安装 openssh-server ：sudo apt-get install openssh-server

创建公钥私钥： ssh-keygen –t rsa

期间会要求输入一些信息，直接按回车就可以。这样，在默认的路径（其中 njust 是当前用户名） /home/lilin/.ssh 目录下创建私钥 id_rsa 和一个公钥 id_rsa.pub 。

对于 datanode 节点：

将自己的公钥发送到 namenode 上：

cp id_rsa.pubdatanode1.id_rsa.pub

scpdatanode01.id_rsa.pub namenode 节点 ip 地址（在我的配置方案中，是219.245.72.244）:/home/lilin/.ssh

这里需要注意，由于每个 datanode 节点都要将自己的公钥传到 namenode 的相同路径下，因此，各个 datanode 发送的公钥文件名不能相同。这里使用 cp 命令，在每台 datanode 节点上将公钥文件复制为唯一名字的文件。

对于 namenode 节点：

在收到所有 datanode 发送过来的公钥文件之后，要综合这些文件（包括自身），并将这些文件发送到每个节点上：

cp id_rsa.pubauthorized_keys

cat datanode1.id_rsa.pub>> authorized_keys

cat datanode2.id_rsa.pub>> authorized_keys

scpauthorized_keys datanode的ip地址:/home/lilin/.ssh

这时一定要查看一下 ssh 配置是否成功，查看方式是使用 ssh 命令： ssh 其他机器ip ，如果不需要密码就可以登录，就说明配置成功。如果还需要密码，干脆无法登录，则需要重启电脑。重启之后再次使用 ssh 命令，如果还需要密码或者无法登录，则需要重新配置一遍。

成功之后namenode可以无密码登录datanode节点。

注意：这里能否成功是工作能否继续进行的一个关键。一定要能够各个机器之间能够ssh通畅，ssh是linux传递文件的保障，只有能够互相ssh我们各个机器之间传递的信息才是安全的。在这里，在我们的配置过程中出现了许多麻烦，因为以前对linux系统也没有接触过，吃了不少亏。

四、开始集群配置

1、修改各主机的主机名，以区分不同的机器：

打开/etc/hostname：sudo gedit /etc/hostname

对于namenode节点：

将主机名改成namenode，datanode改成相应的datanode1，datanode2等等，并保存关闭。如下图所示：

2、配置各个主机之间IP与主机名的对应关系

修改集群中各个主机的/etc/hosts文件：sudo gedit /etc/hosts

将集群中各个主机的IP与主机名都列在此处，如图所示：

注意要将第一行注释掉：#127.0.0.1localhost.localdomain localhost

注意：如果是第一次接触到linux系统的人，会更改不了。这里要对文件的权限进行修改。命令如下：

Chmod 777 /etc/hosts

这样就可更改hosts的内容了对于以后要处理的文件不在赘述，都是用这种方法更改文件权限后就可以操作

3. 安装 JDK 1.6

root用户登陆，在Namenode节点上新建文件夹/usr/program，下载JDK安装包jdk-6u13-linux-i586.bin,复制到目录/usr/ program下，在命令行进入该目录，执行命令“./ jdk-6u13-linux-i586.bin”，命令运行完毕，将在目录下生成文件夹jdk1.6.0_13，安装完毕。

安装完成后，修改/usr/program目录拥有着为lilin用户.若果只有一个用户当然就不用修改了。

下面进行环境变量配置

root用户登陆，命令行中执行命令”sudogedit /etc/profile”,并加入以下内容，配置环境变量(注意/etc/profile这个文件很重要，后面Hadoop的配置还会用到)。

# set java environment

export JAVA_HOME=/usr/program/jdk1.6.0_13/

export JRE_HOME=/usr/program/jdk1.6.0_13/jre

export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib

export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

保存并退出，执行以下命令使配置生效

chmod +x /etc/profile

source /etc/profile

配置完毕，在命令行中使用命令”java -version”可以判断是否成功。在lilin用户下测试java –version，一样成功。

4、Hadoop集群配置

在namenode上执行:

Hadoop用户登录。

下载hadoop-0.21.0，将其解压到/usr/local/hadoop目录下，解压后目录形式是/usr/local/hadoop/hadoop-0.21.0。使用如下命令:

tar zxvf hadoop-0.21.0.tar.gz

(1)配置Hadoop的配置文件

(a)配置hadoop-env.sh

# set java environment

export JAVA_HOME=/usr/program/jdk1.6.0_13/

(b)配置conf/hadoop-site.xml

Hadoop配置参数的含义请参考conf/Hadoop-default.xml。

Hadoop-0.20之后的版本请分别配置hadoop目录下，conf目录中的core-site.xml，hdfs-site.xml和mapred-site.xml三个配置文件，配置方法即将下面hadoop-site.xml文件中的三块参数分别复制到三个文件当中。

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!—core-site.xml-->

<name>fs.default.name</name>

<value>hdfs://lilin:9000</value>

<description>HDFS的URI，文件系统://namenode标识:端口号</description>

</property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop/hadooptmp</value>

<description>namenode上本地的hadoop临时文件夹</description>

</property>

<!—hdfs-site.xml-->

<value>/usr/local/hadoop/hdfs/name</value>

<description>namenode上存储hdfs名字空间元数据 </description>

</property>

<value>/usr/local/hadoop/hdfs/data</value>

<description>datanode上数据块的物理存储位置</description>

</property>

<name>dfs.replication</name>

<description>副本个数，不配置默认是3,应小于datanode机器数量</description>

</property>

<!—mapred-site.xml-->

<name>mapred.job.tracker</name>

<value>lilin:9001</value>

<description>jobtracker标识:端口号，不是URI</description>

</property>

<name>mapred.local.dir</name>

<value>/usr/local/hadoop/mapred/local</value>

<description>tasktracker上执行mapreduce程序时的本地目录</description>

</property>

<name>mapred.system.dir</name>

<value>/tmp/hadoop/mapred/system</value>

<description>这个是hdfs中的目录，存储执行mr程序时的共享文件</description>

</property>

</configuration>

(c)配置masters文件,加入namenode的主机名

Lilin

(d)配置slaves文件, 加入所有datanode的主机名

Lilin

复制配置好的各文件到所有数据节点上

root用户下:

scp /etc/hosts 数据节点ip地址:/etc/hosts

scp /etc/profile 数据节点ip地址:/etc/profile

scp /usr/program 数据节点ip地址:/usr/program

nutch用户下:

scp /usr/local/hadoop 数据节点ip地址: /usr/local/

5、Hadoop集群启动

Namenode执行：

格式化namenode，格式化后在namenode生成了hdfs/name文件夹

cd/usr/local/hadoop/hadoop-0.21.0/bin

bin$ ./hadoopnamenode –format

启动hadoop所有进程，

bin/start-all.sh（或者先后执行start-dfs.sh和start-mapreduce.sh）。

可以通过以下启动日志看出，首先启动namenode,然后启动datanode1,datanode2,然后启动secondarynamenode。再启动jobtracker,然后启动tasktracker1,最后启动tasktracker2。下面是集群启动的结果

下面检查一下namenode上的进程。用jps工具检查就可以了

上边是namenode的进程运行情况。下边是datanode进程运行情况

下面检查一下集群的运行情况

命令：在bin下运行命令 hadoop dfsadmin –report

到此为止，我们的hadoop集群配置已经完成，集群正常运行。可以进行其他的实验了。

首先上传文件

hadoop fs –put 源地址目的地址

上传成功后查看文件

然后我们继续观察下面的测试结果

看到在hdfs的used中已经增加了许多。

下边跑一个例子程序

在程序之前我们看一下在hadoop的hdfs系统中的input01文件中的文件内容

下面我们运行hadoop的自带的wordcount程序

运行之后我们看一下程序的运行结果

至此hadoop 的hdfs环境已经好了，可以跑mapreduce程序了。

二伪分布式Mapreduce开发环境配置

Eclipse版本eclipse-jee-galileo-SR1-linux-gtk

hadoop版本 0.20.2

开始配置

第一步配置 hadoop conf下的三个文件

core-site.xml

这个设置的是hdfs的机器名和端口

hdfs-site.xml

这个设置了dfs的数据副本个数

mapre-site.xml

这个设置了mapreduce的jobtracker的工作端口

第一步，我们先启动Hadoop守护进程。

start-all.sh

如果namenode没有启动起来建议你

hadoop namenode -format

然后再启动 jps下看是否启动成功如果启动成功如下图

第二步，在Eclipse下安装hadoop-plugin。

1.复制 hadoop安装目录/contrib/eclipse-plugin/hadoop-0.20.2-eclipse-plugin.jar 到 eclipse安装目录/plugins/ 下。

2.重启eclipse，配置hadoop installation directory。

如果安装插件成功，打开Window-->Preferens，你会发现Hadoop Map/Reduce选项，在这个选项里你需要配置Hadoop installationdirectory。配置完成后退出。

3.配置Map/Reduce Locations。

在Window-->ShowView中打开Map/ReduceLocations。

在Map/ReduceLocations中新建一个HadoopLocation。在这个View中，右键-->New Hadoop Location。在弹出的对话框中你需要配置Location name，如myubuntu，还有Map/Reduce Master和DFS Master。这里面的Host、Port分别为你在mapred-site.xml、core-site.xml中配置的地址及端口。如：

这里要注意 Username一定要填写正确不然后边会有麻烦

配置完后退出。点击DFSLocations-->hadoop如果能显示文件夹(2)说明配置正确，如果显示"拒绝连接"，请检查你的配置

这就正确了

第三步，新建项目。
File-->New-->Other-->Map/Reduce Project
项目名可以随便取，如hadoop-test。
复制 hadoop安装目录/src/example/org/apache/hadoop/example/WordCount.java到刚才新建的项目下面。

第四步，运行项目。

1.在新建的项目hadoop-test，点击WordCount.java，右键-->Run As-->Run Configurations

2.在弹出的Run Configurations对话框中，点Java Application，右键-->New，这时会新建一个application名为WordCount

3.配置运行参数，点Arguments，在Program arguments中输入“你要传给程序的输入文件夹和你要求程序将计算结果保存的文件夹”，如：

4.点击Run，运行程序。

查看目录在user目录下多了我们设置的output03

查看output03中的内容

结果正确。

需要注意的问题：

1，版本问题如果hadoop的eclipse-plugin.jar放到Eclipse下的Plugin下后在ShowWindow中看不到

MapReduce的时候，很可能是版本不同，这个jar包是hadoop的源代码编译出来的，如果实在版本不可以，你可以自己编译自己的这个包，方法如下

一，安装ant 1.8.2

1、把apache-ant-1.8.2-bin.tar.gz解压到/usr/apache-ant-1.8.2

2、设置/etc/profile：

export ANT_HOME=/usr/apache-ant-1.8.2
export PATH=$PATH:$ANT_HOME/bin

二、生成hadoopeclipse plugin

1、修改/usr/local/hadoop/hadoop-0.20.2/build.xml：

修改<property name="version" value="0.20.2"/>

2、修改/usr/local/hadoop/hadoop-0.20.2/src/contrib/build-contrib.xml：

添加<property name="eclipse.home"location="/home/hadoop/eclipse3.4.2"/>

3、修改

/usr/local/hadoop/hadoop-0.20.2/src/contrib/eclipse-plugin/src/java/org/apache/hadoop/eclipse/launch/HadoopApplicationLaunchShortcut.java

注释掉原来的这个import包//importorg.eclipse.jdt.internal.debug.ui.launcher.JavaApplicationLaunchShortcut;

改为

import

org.eclipse.jdt.debug.ui.launchConfigurations.JavaApplicationLaunchShortcut;

4、下载apache-forrest-0.8.tar.gz，解压到/home/hadoop/apache-forrest-0.8。

5、编译并打包

$ cd /usr/local/haoop/hdoop-0.20.2

$ ant compile

$ln -sf /usr/local/hadoop/hadoop-0.20.2/docs/usr/local/hadoop/hadoop-0.20.2/build/docs

$ ant package

如果成功的话，会在/usr/local/hadoop/hadoop-0.20.2/build/contrib/eclipse-plugin

下生成hadoop-0.20.2-eclipse-plugin.jar。

把这个考进去就没问题了。

还有这个hadoop-0.20.2-eclipse-plugin.jar在不同的版本里位置可能不同，搜下就找到了。

2，在运行程序的时候有时候会出现内存不足的情况如下设置就可以了

这样就可以了，就是设置一下虚拟机的内存

3，在设置好Eclipse之后经常出现不能显示HDFS目录的状况

这是要检查的地方有几个

Define Hadoop location 的User name

配置文件端口是否与端口号一致

4，namenode没有启动重新format一下就可以了

5，一定要先上传到hdfs文件后才能查到Eclipse下的hdfs目录。否则是看不到目录的

wordCount 程序注释

下边是我注释的wordcount程序

packageorg.apache.hadoop.examples;

importjava.io.IOException;

importjava.util.StringTokenizer;

importorg.apache.hadoop.conf.Configuration;

importorg.apache.hadoop.fs.Path;

importorg.apache.hadoop.io.IntWritable;

importorg.apache.hadoop.io.Text;

importorg.apache.hadoop.mapreduce.Job;

importorg.apache.hadoop.mapreduce.Mapper;

importorg.apache.hadoop.mapreduce.Reducer;

importorg.apache.hadoop.mapreduce.lib.input.FileInputFormat;

importorg.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

importorg.apache.hadoop.util.GenericOptionsParser;

public classWordCount {

/** 

MapReduceBase类:实现了Mapper和Reducer接口的基类（其中的方法只是实现接口，而未作任何事情）

Mapper接口：

WritableComparable接口：实现WritableComparable的类可以相互比较。所有被用作key的类应该实现此接口。

Reporter 则可用于报告整个应用的运行进度，本例中未使用。

LongWritable,IntWritable, Text 均是 Hadoop 中实现的用于封装 Java 数据类型的类，这些类实现了WritableComparable接口，都能够被串行化从而便于在分布式环境中进行数据交换，你可以将它们分别视为long,int,String 的替代品。

**/

public static classTokenizerMapper 

extendsMapper<Object, Text, Text, IntWritable>{

private final staticIntWritable one = new IntWritable(1);

private Text word =new Text();

/**

Mapper接口中的map方法，

Void map(K1key, V1value, OutputCollector<K2,V2> output, Reporter reporter)

映射一个单个的输入k/v对到一个中间的k/v对

输出对不需要和输入对有相同的类型，输入对可以对应不同数量的输出对

OutputCollector接口：收集Mapper和Reducer输出的<k,v>对

OutputColletctor接口的collect(k,v)方法，增加一个（k/v）对到output

**/ 

public voidmap(Object key, Text value, Context context

) throwsIOException,InterruptedException {

StringTokenizer itr =new StringTokenizer(value.toString());

while(itr.hasMoreTokens()) {

word.set(itr.nextToken());

context.write(word,one);

}

}

}

public static classIntSumReducer 

extendsReducer<Text,IntWritable,Text,IntWritable> {

private IntWritableresult = new IntWritable();

public voidreduce(Text key, Iterable<IntWritable> values, 

Context context

) throwsIOException,InterruptedException {

int sum = 0;

for (IntWritable val: values) {

sum += val.get();

}

result.set(sum);

context.write(key,result);

}

}

publicstatic voidmain(String[] args) throws Exception 

{ 

/** 

* JobConf：map/reduce的job配置类，向hadoop框架描述map-reduce执行的工作 

* 构造方法：JobConf()、JobConf(ClassexampleClass)、JobConf(Configuration conf)等 

*/ 

JobConf conf = newJobConf(WordCount.class);

conf.setJobName("wordcount");//设置一个用户定义的job名称 

conf.setOutputKeyClass(Text.class);//为job的输出数据设置Key类 

conf.setOutputValueClass(IntWritable.class);//为job输出设置value类

conf.setMapperClass(Map.class);//为job设置Mapper类 

conf.setCombinerClass(Reduce.class);//为job设置Combiner类 

conf.setReducerClass(Reduce.class);//为job设置Reduce类 

conf.setInputFormat(TextInputFormat.class);//为map-reduce任务设置InputFormat实现类

conf.setOutputFormat(TextOutputFormat.class);//为map-reduce任务设置OutputFormat实现类

/** 

* InputFormat描述map-reduce中对job的输入定义 

* setInputPaths():为map-reducejob设置路径数组作为输入列表

* setInputPath()：为map-reducejob设置路径数组作为输出列表

*/ 

FileInputFormat.setInputPaths(conf,newPath(args[0])); 

FileOutputFormat.setOutputPath(conf,newPath(args[1])); 

JobClient.runJob(conf);//运行一个job 

} 

}

你可能感兴趣的:(java,eclipse,mapreduce,hadoop,linux,集群)

SpringBoot使用Websocket技术实现聊天功能--后端部分（三） oct1025 Idea websocket spring boot 后端
所需依赖：javax.websocketjavax.websocket-api1.1providedorg.springframework.bootspring-boot-starter-freemarkerorg.springframework.bootspring-boot-starter-websocket-->org.apache.tomcat.embed-->tomcat-embed-w
ClickHouse与TiDB实操对比：从入门到实战的深度剖析大数据方向陪跑私教数据库 clickhouse
ClickHouse与TiDB实操对比：从入门到实战的深度剖析宝子们，在当今数据驱动的时代，选择合适的数据库对于处理海量数据和支撑业务发展至关重要。ClickHouse和TiDB作为两款备受关注的数据库，各自有着独特的优势和适用场景。今天，我们就通过实操对比，深入了解一下这两款数据库在安装配置、数据导入、查询优化、数据更新与删除以及集群搭建与运维等方面的差异，帮助你根据实际需求做出更明智的选择。一
Java中的事务管理详解我真的不想做程序员 java java python 开发语言后端算法
目录一、事务管理的基础概念二、Java中的事务管理方式（一）编程式事务管理（二）声明式事务管理三、总结一、事务管理的基础概念在Java开发中，事务管理是确保数据一致性和完整性的重要机制。事务是一组操作的集合，这些操作要么全部成功，要么全部失败，从而保持数据的一致性。事务管理的核心在于控制这些操作的执行流程，确保在发生错误时能够进行回滚操作，撤销所有已执行的操作。二、Java中的事务管理方式（一）编
我的DW个人网站设计——安徽宣城6页HTML+CSS+JavaScript @蜡笔小新星 html css javascript
家乡旅游景点网页作业制作网页代码运用了DIV盒子的使用方法，如盒子的嵌套、浮动、margin、border、background等属性的使用，外部大盒子设定居中，内部左中右布局，下方横向浮动排列，大学学习的前端知识点和布局方式都有运用，CSS的代码量也很足、很细致，使用hover来完成过渡效果、鼠标滑过效果等，使用表格、表单补充模块，为方便新手学习页面中没有使用js有需要的可以自行添加。⚽精彩专栏
Kubernetes实战教程 Coder_Kevin_Vans kubernetes docker 容器
Kubernetes实战教程=====================本教程旨在提供详细的Kubernetes实战教程，帮助您了解和掌握Kubernetes的基本概念、部署、管理和扩展。以下是教程的大纲：1.Kubernetes概述-什么是Kubernetes？-Kubernetes的核心概念和架构-Kubernetes的优势和应用场景2.准备工作-安装和配置Kubernetes集群-配置容器运行
今天面了一个Java后端男生，真得让我猛抬头 2501_91147366 面试 java 后端开发职场和发展金三银四 Java后端
当场就给offer了！面试准备的很细致，问题回答的都很流利，没有问他八股文，现在八股文几乎都不问，更多的是项目场景题，但是他一样也准备的很好，说是面试前特意花了一个月准备。拿offer不是没有道理的，也建议金三银四跑Java后端的都可以去看看场景题，现在都在问，多准备一些，有需要可以嗱去看看，都是常问的面试题!
每日一道Java面试题（1）辑安24 java 开发语言单例模式
每日一道Java面试题请解释volatile关键字在Java中的作用，并举例说明其使用场景。解析1.volatile的作用volatile是Java中的轻量级同步机制，主要解决多线程环境下的可见性和有序性问题，但不保证原子性。可见性：当一个线程修改了volatile变量的值，其他线程能立即看到最新的值（强制从主内存读取，而不是本地缓存）。有序性：禁止指令重排序优化（通过插入内存屏障）。2.原理可见
2.Linux命令行界面（CLI）深度指南道荣网安的学习之旅 linux 网络安全
引言Linux命令行界面（CLI）是操作系统中功能强大的工具，尤其适用于系统管理员、开发者和高级用户。它提供了一种高效且灵活的操作方式。本文将详细介绍Linux中的常用命令，包括文件权限管理、系统维护、文本编辑和软件包处理等。目录引言文件权限与用户管理语言环境设置路径与文件系统导航系统命令与文件操作文件与目录管理文本编辑与查看文件操作进阶特殊情况下的复制与移动文件压缩与解压bzip2压缩gzip压
Java【多线程】（5）线程池爱吃烤鸡翅的酸菜鱼 java 开发语言
目录1.前言2.正文2.1线程池引入2.2标准库中的线程池2.3手搓线程池3.小结1.前言哈喽大家好吖，今天来给大家继续进行多线程——线程池方面的学习，线程池在以后项目中也是关键的存在，废话不多说让我们开始吧。2.正文2.1线程池引入线程池，就是为了让我们高效的创建销毁线程的，最初引入线程的原因：频繁创建销毁进程，太慢了。随着互联网的发展,随着我们对于性能要求更进一步。咱们现在觉得，频繁创建销毁线
Linux安装AnythingLLM neter.asia 运维 python
1.AnythingLLM简介AnythingLLM是MintplexLabs开发的一款可以与任何内容聊天的私人ChatGPT，是高效、可定制、开源的企业级文档聊天机器人解决方案。它能够将任何文档、资源或内容片段转化为大语言模型（LLM）在聊天中可以利用的相关上下文。AnythingLLM支持多种文档类型（PDF、TXT、DOCX等），具有对话和查询两种聊天模式。支持多种LLM、嵌入模型和向量数据
docker搭建php环境安装 .LWH php 开发语言 docker
目录一、什么是php？二、docker拉取nginx和php镜像三、创建容器四、测试一、什么是php？PHP定义：一种服务器端的HTML脚本/编程语言，是一种简单的、面向对象的、解释型的、健壮的、安全的、性能非常之高的、独立于架构的、可移植的、动态的脚本语言。是一种广泛用于OpenSource（开放源代码）的尤其适合Web开发并可以嵌入HTML的多用途脚本语言。它的语法接近C，Java和Perl,
wangEditor能否支持网页直接导入EXCEL文件？操作步骤是什么？ 2501_90694782 umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word ueditor导入pdf ueditor导入ppt
要求：开源，免费，技术支持编辑器：wangEditor前端：vue2,vue3,vue-cli,html5后端：java,jsp,springboot,asp.net,php,asp,.netcore,.netmvc,.netform群体：学生,个人用户,外包,自由职业者,中小型网站,博客,场景：数字门户,数字中台,站群,内网，外网，信创国产化环境，web截屏行业：医疗，教育，建筑，政府，党政，国
【Docker系列八】使用 Docker run 命令部署 Nginx Kwan的解忧杂货铺@新空间代码工作室 s4 Docker系列 docker nginx 容器
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
Java - 保留小数点后两位七号座先生 Java相关 java
（1）使用BigDecimal，保留小数点后两位publicstaticStringformat1(doublevalue){BigDecimalbd=newBigDecimal(value);bd=bd.setScale(2,RoundingMode.HALF_UP);returnbd.toString();}（2）使用DecimalFormat,保留小数点后两位publicstaticStri
Java 中 `throw` 和 `throws` 的区别详解梦幻南瓜 java java 开发语言
在Java中，throw和throws都与异常处理相关，但它们的作用和使用场景完全不同。本文将详细解析throw和throws的区别，并通过示例代码加深理解。1.throw1.1定义throw是一个关键字，用于在代码中手动抛出一个异常。1.2使用场景当程序检测到某种错误条件时，可以手动抛出异常。通常用于自定义异常或特定条件下的异常抛出。1.3语法thrownewExceptionType("Err
Java 中的泛型详解梦幻南瓜 java java windows 开发语言
泛型（Generics）是Java5引入的一个重要特性，它允许在定义类、接口和方法时使用类型参数，从而提高代码的复用性和类型安全性。本文将详细解析Java中的泛型，包括其定义、使用场景和优势。1.泛型的定义泛型是一种参数化类型机制，允许在定义类、接口或方法时使用类型参数（TypeParameters），这些类型参数在实例化或调用时被具体的类型替换。1.1泛型类classBox{privateTva
数组中某个元素相同的去重_JavaScript数组去重（12种方法，史上最全） weixin_39545310 数组中某个元素相同的去重
数组去重，一般都是在面试的时候才会碰到，一般是要求手写数组去重方法的代码。如果是被提问到，数组去重的方法有哪些？你能答出其中的10种，面试官很有可能对你刮目相看。在真实的项目中碰到的数组去重，一般都是后台去处理，很少让前端处理数组去重。虽然日常项目用到的概率比较低，但还是需要了解一下，以防面试的时候可能回被问到。注：写的匆忙，加上这几天有点忙，还没有非常认真核对过，不过思路是没有问题，可能一些小细
UMI-OCR Docker 部署 sszdzq海怪 ocr docker 容器
额外补充Docker0.前置条件部署前，请检查主机的CPU是否具有AVX指令集lscpu|grepavx输出如下即可继续部署Flags:...avx...avx2...1.下载dockerfilewgethttps://raw.githubusercontent.com/hiroi-sora/Umi-OCR_runtime_linux/main/Dockerfile2.构建镜像dockerbuil
【Java EE初阶---多线程（初阶）】初识计算机 optimistic_chen Java EE初阶 java-ee java 经验分享笔记开发语言
乐观学习，乐观生活，才能不断前进啊！！！我的主页：optimistic_chen我的专栏：c语言，Java，Java数据结构欢迎大家访问~创作不易，大佬们点赞鼓励下吧~文章目录前言计算机的历史冯诺依曼体系操作系统进程进程的标识符（pid）进程调度进程状态优先级进程的上下文记账信息完结前言经过了之前数据结构的学习，相信大多数人已经相比与开始的自己，已经有了十足的进步，结束数据结构的学习，为了揭开计算
Java：企业级开发的王者 java
1.1Java简介Java由SunMicrosystems（现属Oracle）于1995年推出，是一种面向对象、跨平台的编程语言。凭借"WriteOnce,RunAnywhere"（一次编写，到处运行）的理念，Java成为企业级开发的首选语言。Java的核心优势✔跨平台性（JVM实现）✔强大的生态系统（Spring、Hibernate等框架）✔内存自动管理（GC垃圾回收）✔高并发支持（多线程、NI
红宝书第三讲：JavaScript 操作符与流程控制详解前端javascript
红宝书第三讲：JavaScript操作符与流程控制详解资料取自《JavaScript高级程序设计（第5版）》。查看所有教程：红宝书学习大纲一、常用操作符操作符用于对数据进行计算和比较：1算数操作符+（加）、-（减）、*（乘）、**（幂）、/（除）constsum=10+5;//结果为15constpower=2**3;//2的3次方，结果为8比较操作符>（大于）、18&&loggedIn){//年
华为OD机试E卷 - 分奖金（Java & Python& JS & C++ & C ）算法大师最新华为OD机试真题华为OD机试真题 (Java/JS/Py/C)华为od java python 华为OD2025A卷 javascript c++
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述公司老板做了一笔大生意，想要给每位员工分配一些奖金，想通过游戏的方式来决定每个人分多少钱。按照员工的工号顺序，每个人随机抽取一个数字。按照工号的顺序往后排列，遇到第一个数字比自己数字大的，那么，前面的员工就可以获得“距离*数字差值”的奖金。如果遇不到比自己数字大的，就给自己分配随机数数量的奖金。例如，按照工号顺序的随机
Spring IOC容器详解：深入理解控制反转与依赖注入躲在云朵里` spring java 后端
一、什么是IOC？在java当中一个类想要使用另一个类的方法，就必须在这个类当中创建这个类的对象，那么可能会出现如下情况，比如A类当中创建着B对象，B类当中有C对象，C类当中有A对象，这个如果一个类出了问题，那么可能会导致这个框架出现问题。Spring将创建对象的权利给了IOC，在IOC当中创建了ABC三个对象吗，那么我们我们其他的类只需要调用集合，大大的解决了程序耦合性的问题。IOC（Inver
Java 泛型躲在云朵里` java 开发语言
一、泛型概述1.什么是泛型？为什么要使用泛型？泛型，即“参数化类型”。一提到参数，最熟悉的就是定义方法时有形参列表，普通方法的形参列表中，每个形参的数据类型是确定的，而变量是一个参数。在调用普通方法时需要传入对应形参数据类型的变量（实参），若传入的实参与形参定义的数据类型不匹配，则会报错。泛型的本质是为了将类型参数化，也就是说在泛型使用过程中，数据类型被设置为一个参数，在使用时再从外部传入一个数据
Java中的多态躲在云朵里` java 开发语言
一、数据类型数据类型：决定数据在内存当中是什么样的存储形式比如：int类型：1bit符号位，32bit数值位byte类型：1bit符号位，7bit数值位float类型：1bit符号位，8bit阶位，23bit数值位创建一个父类A：publicclassA{publicStringname;publicintage;publicvoidrun(){System.out.println("A跑得很快"
获取GPU信息 --createWindowSurface EGL_BAD_NATIVE_WINDOW -- failed: EGL_BAD_MATCH jiantaocd JAVA Android UI Android android 三星 gpu surface
之前网上有很多关于获取GPU信息的帖子，大部分手机都可以获取到，但部分奇葩就不行了。贴代码：packagecom.example.gpuinfo;importjavax.microedition.khronos.egl.EGLConfig;importjavax.microedition.khronos.opengles.GL10;importandroid.app.Activity;import
Simula语言的扩展运算符霍珵璁包罗万象 golang 开发语言后端
Simula语言中的扩展运算符引言Simula语言是现代编程语言的先驱之一，由挪威计算机科学家Ole-JohanDahl和KristenNygaard于1960年代开发。它不仅是面向对象编程（OOP）的发源地之一，还引入了许多编程中至关重要的概念，包括类和对象。尽管Simula的普及程度不如C++或Java等语言，但其在计算机科学史上的地位依然不可忽视。扩展运算符是Simula语言中的一个重要特性
JavaScript高阶——数组的方法和风中看海 javascript 开发语言 ecmascript
迭代方法：这些方法遍历数组的每个元素，可以对元素进行操作或返回新数组forEach()循环遍历数组every()遍历数组,返回值遇到false时遍历终止相比于forEach()多了一个returnfalsesome()找到数组的第一个元素返回值为找到为true或找不到为falsemap()修改并返回新的数组filter()数组过滤器reduce()数组求和运算reduceRight()转换方法：将
Java与C++深度对比：特性、性能与应用场景 javac++
语言设计与哲学对比1.1设计理念C++："零成本抽象"原则：高级特性不应带来额外运行时开销信任程序员：给予完全的内存和硬件控制权多范式混合：支持过程式、面向对象、泛型、函数式编程Java："一次编写，到处运行"：通过JVM实现平台无关性安全性优先：移除指针、自动内存管理纯粹的面向对象：除基本类型外一切皆对象1.2典型应用场景语言典型应用领域C++游戏引擎、操作系统、高频交易、嵌入式系统、图形渲染J
timeGetTime()函数的用法凯酱 java
timeGetTime()函数函数以毫秒计的系统时间。该时间为从系统开启算起所经过的时间。在SDK中，可以用DWORDtimeGetTime(VOID)函数获取系统时间，其返回值是毫秒单位的。可以用其实现延时功能的函数。```javascript//Anhighlightedblockvarfoo='bar';注：在使用timeGetTime()函数之前应先包含头文件＃include或＃inclu
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h

hadoop hdfs搭建 mapreduce环境搭建 wordcount程序简单注释

一 实验室环境下 hadoop集群配置

一、环境说明

二、虚拟机的安装及上网方式的选择

三、安装ssh服务

四、开始集群配置

1、修改各主机的主机名，以区分不同的机器：

2、配置各个主机之间IP与主机名的对应关系

3. 安装 JDK 1.6

5、Hadoop集群启动

二 伪分布式Mapreduce开发环境配置

wordCount 程序注释

你可能感兴趣的:(java,eclipse,mapreduce,hadoop,linux,集群)

一实验室环境下 hadoop集群配置

二伪分布式Mapreduce开发环境配置