liema2000

Hadoop0.20.2在Linux X64下的分布式配置和使用

2013年3月

郭运凯

介绍...2

1 集群网络环境介绍及快速部署...2

2 SSH无密码验证配置...6

2.1配置所有节点之间SSH无密码验证...6

3 JDK安装和Java环境变量配置...10

3.1 安装 JDK 1.6.10

3.2 Java环境变量配置...11

4 Hadoop集群配置...13

5 Hadoop集群启动...17

6 Hadoop使用...22

6.1 客户机与HDFS进行交互...22

6.1.1 客户机配置...22

6.1.2 列出HDFS根目录/下的文件...23

6.1.3 HDFS用户管理...23

6.1.5 复制本地数据到HDFS中...23

6.1.6 数据副本说明...23

6.1.7 hadoop-site.xml参数说明...25

6.1.8 HDFS中的路径...26

6.1.8 Hadoop相关命令...26

6.2 客户机提交作业到集群...26

6.2.1 客户机配置...26

6.2.2 一个测试例子WordCount.27

6.2.3 编写Hadoop应用程序并在集群上运行...31

6.2.4 三种模式下编译运行Hadoop应用程序...31

6.2.5 提交多个作业到集群...33

jie介绍

介绍

这是利用Vmware 9.0在一台服务器上搭建的分布式环境，操作系统CentOS 6.3 X64中配置Hadoop-0.20.2时的总结文档。 Hadoop配置建议所有配置文件中使用主机名进行配置，并且机器上应在防火墙中开启相应端口，并设置SSHD服务为开机启动，此外java环境变量可以在/etc/profile中配置。

1 集群网络环境介绍及快速部署

集群包含五个节点：1个namenode，4个datanode，节点之间局域网连接，可以相互ping通。

所有节点均是Centos 6.3 64位系统，防火墙均禁用，sshd服务均开启并设置为开机启动。

a) 首先在VMware中安装好一台Centos 6.3,创建hadoop用户。假设虚拟机的名字为NameNode

b) 关闭虚拟机，把NameNode文件夹，拷贝4份，并命名为DataNode1,..,DataNode4

c) 用VMware打开每个DateNode，设置其虚拟机的名字

d) 打开操作系统，当弹出对话框时，选择“I copy it”

e) 打开每个虚拟机，查看ip地址

ifconfig

现将IP地址规划如下

10.88.106.187	namenode
10.88.106.188	datanode1
10.88.106.189	datanode2
10.88.106.190	datanode3
10.88.106.191	datanode4

f) 配置NameNode

第一步，检查机器名

#hostname

如发现不对，则修改，root用户登陆，修改命令如下

# vim /etc/sysconfig/network

NETWORKING=yes

HOSTNAME=NameNode

依次对每个节点进行处理，修改完之后，重启系统 #reboot

g) 修改/etc/hosts

root用户

vim /etc/sysconfig/network

(1)namenode节点上编辑/etc/hosts文件

将所有节点的名字和IP地址写入其中，写入如下内容，注意注释掉127.0.0.1行，保证内容如下：

10.88.106.187 namenode

10.88.106.188 datanode1

10.88.106.189 datanode2

10.88.106.190 datanode3

10.88.106.191 datanode4

# 127.0.0.1 centos63 localhost.localdomain localhost

(2)将Namenode上的/etc/hosts文件复制到所有数据节点上，操作步骤如下:

root用户登录namenode；

执行命令：

scp /etc/hosts root@10.88.106.188:/etc/hosts

scp /etc/hosts [email protected]:/etc/hosts

h) 规划系统目录

完整路径	说明
/usr/local/hadoop	hadoop的主目录
/usr/local/hadoop/tmp	临时目录
/usr/local/hadoop/hdfs/name	namenode上存储hdfs名字空间元数据
usr/local/hadoop/hdfs/data	datanode上数据块的物理存储位置
/usr/local/hadoop/mapred/local	tasktracker上执行mapreduce程序时的本地目录
/usr/local/hadoop/mapred/system	这个是hdfs中的目录，存储执行mr程序时的共享文件

至于这里为什么在/usr/local下建立，解释如下

/usr 文件系统

　　/usr 文件系统经常很大，因为所有程序安装在这里. /usr里的所有文件一般来自Linux distribution；本地安装的程序和其他东西在/usr/local下.这样可能在升级新版系统或新distribution时无须重新安装全部程序.

/usr/local 本地安装的软件和其他文件放在这里.

小贴士：创建目录：mkdir(make directories)

功能说明：建立目录
语　　法：mkdir [-p][--help][--version][-m <目录属性>][目录名称]
补充说明：mkdir可建立目录并同时设置目录的权限。
参　　数：
-m<目录属性>或–mode<目录属性>建立目录时同时设置目录的权限。
-p或–parents若所要建立目录的上层目录目前尚未建立，则会一并建立上层目录。
例：mkdir test

开始建立目录：

在NameNode下，root用户

[root@NameNode ~]# mkdir -p /usr/local/hadoop/tmp

[root@NameNode ~]# mkdir -p /usr/local/hadoop/hdfs/name

[root@NameNode ~]# mkdir -p /usr/local/hadoop/hdfs/data

[root@NameNode ~]# mkdir -p /usr/local/hadoop/mapred/local

[root@NameNode ~]# mkdir -p /usr/local/hadoop/mapred/system

验证一下

可以直接进入tmp目录，不用先建立上级目录

修改目录/usr/local/hadoop的拥有者（因为该目录用于安装hadoop，用户对其必须有rwx权限。）

chown -R hadoop:hadoop /usr/local/hadoop

修改前

修改后

创建完毕基础目录后，下一步就是设置SSH无密码验证，以方便hadoop对集群进行管理。

2 SSH无密码验证配置

Hadoop需要使用SSH协议，namenode将使用SSH协议启动namenode和datanode进程，datanode向namenode传递心跳信息可能也是使用SSH协议，这是我认为的，还没有做深入了解，datanode之间可能也需要使用SSH协议。假若是，则需要配置使得所有节点之间可以相互SSH无密码登陆验证。

2.1配置所有节点之间SSH无密码验证

(0)原理

节点A要实现无密码公钥认证连接到节点B上时，节点A是客户端，节点B是服务端，需要在客户端A上生成一个密钥对，包括一个公钥和一个私钥，而后将公钥复制到服务端B上。当客户端A通过ssh连接服务端B时，服务端B就会生成一个随机数并用客户端A的公钥对随机数进行加密，并发送给客户端A。客户端A收到加密数之后再用私钥进行解密，并将解密数回传给B，B确认解密数无误之后就允许A进行连接了。这就是一个公钥认证过程，其间不需要用户手工输入密码。重要过程是将客户端A公钥复制到B上。

因此如果要实现所有节点之间无密码公钥认证，则需要将所有节点的公钥都复制到所有节点上。

(1)所有机器上生成密码对

(a)所有节点用hadoop用户登陆，并执行以下命令，生成rsa密钥对:

ssh-keygen -t rsa

这将在/home/hadoop/.ssh/目录下生成一个私钥id_rsa和一个公钥id_rsa.pub。

# su hadoop

ssh-keygen -t rsa

Generating public/private rsa key pair.

Enter file in which to save the key (/home/ hadoop /.ssh/id_rsa): 默认路径

Enter passphrase (empty for no passphrase): 回车，空密码

Enter same passphrase again:

Your identification has been saved in /home/ hadoop /.ssh/id_rsa.

Your public key has been saved in /home/ hadoop /.ssh/id_rsa.pub.

这将在/home/hadoop/.ssh/目录下生成一个私钥id_rsa和一个公钥id_rsa.pub。

(b)将所有datanode节点的公钥id_rsa.pub传送到namenode上:

DataNode1上执行命令：

scp id_rsa.pub hadoop@NameNode:/home/hadoop/.ssh/ id_rsa.pub.datanode1

......

DataNodeN上执行命令：

scp id_rsa.pub hadoop@NameNode:/home/hadoop/.ssh/ id_rsa.pub.datanoden

DataNode1

DataNode2

DataNode3

DataNode4

检查一下是否都已传输过来

各个数据节点的公钥已经传输过来。

(c)namenode节点上综合所有公钥(包括自身)并传送到所有节点上

[hadoop@NameNode .ssh]$ cat id_rsa.pub >> authorized_keys 这是namenode自己的公钥

[hadoop@NameNode .ssh]$ cat id_rsa.pub.datanode1 >> authorized_keys

[hadoop@NameNode .ssh]$ cat id_rsa.pub.datanode2 >> authorized_keys

[hadoop@NameNode .ssh]$ cat id_rsa.pub.datanode3 >> authorized_keys

[hadoop@NameNode .ssh]$ cat id_rsa.pub.datanode4 >> authorized_keys

chmod 644 ~/.ssh/authorized_keys

使用SSH协议将namenode的公钥信息authorized_keys复制到所有DataNode的.ssh目录下。

scp authorized_keys data节点ip地址:/home/hadoop/.ssh

scp ~/.ssh/authorized_keyshadoop@DataNode1:/home/hadoop/.ssh/authorized_keys

scp ~/.ssh/authorized_keyshadoop@DataNode2:/home/hadoop/.ssh/authorized_keys

scp ~/.ssh/authorized_keyshadoop@DataNode3:/home/hadoop/.ssh/authorized_keys

scp ~/.ssh/authorized_keyshadoop@DataNode4:/home/hadoop/.ssh/authorized_keys

从这里就可以看到，当配置好hosts之后，就可以直接以机器名来访问各个机器，不用再记忆各个机器的具体IP地址，当集群中机器很多且IP不连续时，就发挥出威力来了。

从上图可以看到，将authorized_keys分发给各个节点之后，可以直接ssh登录，不再需要密码。

这样配置过后，namenode可以无密码登录所有datanode，可以通过命令

“ssh DataNode1(2,3,4)”来验证。

配置完毕，在namenode上执行“ssh NameNode，所有数据节点”命令，因为ssh执行一次之后将不会再询问。在各个DataNode上也进行“ssh NameNode，所有数据节点”命令。

至此，所有的节点都能相互访问，下一步开始配置jdk

3 JDK安装和Java环境变量配置

3.1 安装 JDK 1.6

1.下载JDK。

选定linux环境版本，下载到的文件是：jdk-6u41-linux-x64.bin

2．创建JDK安装目录。

在Linux系统硬盘系统文件夹usr/local下创建一个文件夹Java。

命令：mkdir –P /usr/local/java

3．复制JDK安装包到系统指定文件夹。

把下载的安装文件（jdk-6u41-linux-x64.bin ）拷到linux路径/usr/local/java下。

4．给安装文件赋予权限。

a).进入目录，命令：cd /usr/local/java

b).赋予权限，命令：chmod +x jdk-6u41-linux-x64.bin

(如果因权限问题执行失败，则加上su, 即su chmod u+x jdk-6u41-linux-x64.bin )

5安装JDK。

开始安装,在控制台执行命令： ./ jdk-6u41-linux-x64.bin

(如果因权限问题执行失败，则加上su , 即sud./jdk-6u41-linux-x64.bin )

文件会被安装到当前目录 /usr/local/java/jdk1.6.0_41

删除安装文件rm jdk-6u41-linux-x64.bin

安装完成后，修改/usr/local/java目录拥有着为hadoop用户，

chown -R hadoop:hadoop /usr/local/java

然后将 /usr/local/java目录需要复制到所有数据节点上。

3.2 Java环境变量配置

root用户登陆，命令行中执行命令”vim /etc/profile”,并加入以下内容，配置环境变量(注意/etc/profile这个文件很重要，后面Hadoop的配置还会用到)。

# set java environment

#set java environment

JAVA_HOME=/usr/local/java/jdk1.6.0_41

PATH=$JAVA_HOME/bin:$PATH

CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export JAVA_HOME CLASSPATH PATH

保存并退出，执行以下命令使配置生效

chmod +x /etc/profile

source /etc/profile

配置完毕，在命令行中使用命令“java -version”可以判断是否成功。在hadoop用户下测试java –version，一样成功。

a).输入命令打印三个环境变量的值:

echo $JAVA_HOME

echo $CLASSPATH

echo $PATH

b).正确的结果如下：

[root@NameNode ~]# echo $JAVA_HOME

/usr/local/java/jdk1.6.0_41

[root@NameNode ~]# echo $CLASSPATH

.:/usr/local/java/jdk1.6.0_41/lib/dt.jar:/usr/local/java/jdk1.6.0_41/lib/tools.jar

[root@NameNode ~]# echo $PATH

/usr/local/java/jdk1.6.0_41/bin:/usr/lib64/qt-3.3/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin

[root@NameNode ~]#

将Namenode上的/etc/profile复制到所有数据节点上。操作步骤如下:

root用户登录namenode；

执行命令：

scp /etc/profile root@(datanode1):/etc/profile

……

scp /etc/profile root@(datanoden):/etc/profile

4 Hadoop集群配置

在namenode上执行:

Hadoop用户登录。

下载hadoop-0.20.2，将其解压到/usr/local/hadoop目录下，解压后目录形式是/usr/local/hadoop/ hadoop-0.20.2。使用如下命令:

tar zxvf hadoop-0.20.2.tar.gz

(1)配置Hadoop的配置文件

(a)配置hadoop-env.sh

$ vim /usr/local/hadoop/hadoop-0.20.2/conf/hadoop-env.sh

# set java environment

export JAVA_HOME=/usr/local/java/jdk1.6.0_41/

export HADOOP_HOME_WARN_SUPPRESS=1

export HADOOP_CLASSPATH=/usr/local/hadoop/hadoop-0.20.2:/usr/local/hadoop/hadoop-0.20.2/lib

(b)配置/etc/profile

#set java enviroment

export HADOOP_HOME=/usr/local/hadoop/hadoop-0.20.2

export HADOOP_HOME_WARN_SUPPRESS=1

JAVA_HOME=/usr/local/java/jdk1.6.0_41

JRE_HOME=/usr/local/java/jdk1.6.0_41/jre

PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/bin:$PATH

CLASSPATH=.:$JAVA_HOME/bin/dt.jar:$JAVA_HOME/lib/tools.jar

export JAVA_HOME CLASSPATH PATH

修改完，重启/etc/profile

[root@NameNode ~]# source /etc/profile

(c)配置conf/hadoop-site.xml

Hadoop-0.20.2之后的版本请分别配置core-site.xml，hdfs-site.xml和mapred-site.xml三个配置文件。

配置文件名(xml)	字段名	字段值	说明
core-site	fs.default.name	hdfs://NameNode:9000
core-site	hadoop.tmp.dir	/usr/local/hadoop/tmp	临时目录
hdfs-site	dfs.name.dir	/usr/local/hadoop/hdfs/name	namenode上存储hdfs名字空间元数据
	dfs.data.dir	usr/local/hadoop/hdfs/data	datanode上数据块的物理存储位置
	dfs.replication	3	副本个数，不配置默认是3,应小于datanode机器数量
mapred-site	mapred.job.tracker	NameNode:9001	jobtracker标识:端口号，不是URI
	mapred.local.dir	/usr/local/hadoop/mapred/local	tasktracker上执行mapreduce程序时的本地目录
	mapred.system.dir	/usr/local/hadoop/mapred/system	这个是hdfs中的目录，存储执行mr程序时的共享文件

core-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>fs.default.name</name>

<value>hdfs://NameNode:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop/tmp</value>

</property>

</configuration>

hdfs-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<value>/usr/local/hadoop/hdfs/name</value>

</property>

<value>/usr/local/hadoop/hdfs/data</value>

</property>

<name>dfs.replication</name>

</property>

</configuration>

mapred-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>mapred.job.tracker</name>

<value>NameNode:9001</value>

</property>

<name>mapred.local.dir</name>

</property>

<name>mapred.system.dir</name>

</property>

</configuration>

(d)配置masters文件,加入namenode的主机名

NameNode

(e)配置slaves文件, 加入所有datanode的主机名

DataNode1

DataNode2

DataNode3

DataNode4

(2)复制配置好的各文件到所有数据节点上。

在每个节点，首先建立文件夹

mkdir /usr/local/hadoop

然后更改文件夹的属主

chown hadoop:hadoop /usr/local/hadoop/

在NameNode

root用户下:

scp /etc/hosts DataNode1:/etc/hosts

scp /etc/profile DataNode1:/etc/profile

scp /usr/java -r DataNode1:/usr/java

……

scp /etc/hosts DataNode4:/etc/hosts

scp /etc/profile DataNode4:/etc/profile

scp /usr/local/java/* -r DataNode4:/usr/local/java

scp -r /usr/local/hadoop/* hadoop@DataNode1:/usr/local/hadoop

scp -r /usr/local/hadoop/* hadoop@DataNode2:/usr/local/hadoop

scp -r /usr/local/hadoop/* hadoop@DataNode3:/usr/local/hadoop

scp -r /usr/local/hadoop/* hadoop@DataNode4:/usr/local/hadoop

复制完之后，需要在各个datanode节点上执行

chown -R hadoop:hadoop /usr/local/java

chown -R hadoop:hadoop /usr/local/hadoop (在各个节点上看，已经属于hadoop了，这里执行一次，以防万一)

5 Hadoop集群启动

Namenode执行：

格式化namenode，格式化后在namenode生成了hdfs/name文件夹

bin/hadoop namenode –format

[hadoop@namenode bin]$ bin/start-all.sh

[hadoop@namenode bin]$ start-all.sh

************************************************************/

[hadoop@NameNode bin]$ start-all.sh

starting namenode, logging to /usr/local/hadoop/hadoop-0.20.2/bin/../logs/hadoop-hadoop-namenode-NameNode.out

DataNode4: starting datanode, logging to /usr/local/hadoop/hadoop-0.20.2/bin/../logs/hadoop-hadoop-datanode-DateNode4.out

DataNode2: starting datanode, logging to /usr/local/hadoop/hadoop-0.20.2/bin/../logs/hadoop-hadoop-datanode-DataNode2.out

DataNode1: starting datanode, logging to /usr/local/hadoop/hadoop-0.20.2/bin/../logs/hadoop-hadoop-datanode-DataNode1.out

DataNode3: starting datanode, logging to /usr/local/hadoop/hadoop-0.20.2/bin/../logs/hadoop-hadoop-datanode-DataNode3.out

NameNode: starting secondarynamenode, logging to /usr/local/hadoop/hadoop-0.20.2/bin/../logs/hadoop-hadoop-secondarynamenode-NameNode.out

starting jobtracker, logging to /usr/local/hadoop/hadoop-0.20.2/bin/../logs/hadoop-hadoop-jobtracker-NameNode.out

DataNode2: starting tasktracker, logging to /usr/local/hadoop/hadoop-0.20.2/bin/../logs/hadoop-hadoop-tasktracker-DataNode2.out

DataNode1: starting tasktracker, logging to /usr/local/hadoop/hadoop-0.20.2/bin/../logs/hadoop-hadoop-tasktracker-DataNode1.out

DataNode3: starting tasktracker, logging to /usr/local/hadoop/hadoop-0.20.2/bin/../logs/hadoop-hadoop-tasktracker-DataNode3.out

DataNode4: starting tasktracker, logging to /usr/local/hadoop/hadoop-0.20.2/bin/../logs/hadoop-hadoop-tasktracker-DateNode4.out

[hadoop@namenode bin]$

启动hadoop所有进程，

bin/start-all.sh（或者先后执行start-dfs.sh和start-mapreduce.sh）。

可以通过以下启动日志看出，首先启动namenode,然后启动datanode1,datanode4, datanode2,datanode3,然后启动secondarynamenode。再启动jobtracker,然后启动tasktracker2, tasktracker1,tasktracker4最后启动tasktracker3。

namenode上用java自带的小工具jps查看进程

每个datanode上查看进程

在这里需要对每个NameNode进行检查，当发现用JPS命令而没有发现DataNode时，需要对集群进行重新格式化。

在namenode上查看集群状态

bin/ hadoop dfsadmin -report

Hadoop查看工作情况:http:// namenode ip地址:50030

Hadoop 的web 方式查看：http://namenode ip地址:50070

6 Hadoop使用

Hadoop有两个重要的模块：MapReduce和HDFS，HDFS是一个分布式文件系统，用于存储数据，MapReduce是一个编程框架，Hadoop中运行的程序均是MapReduce作业，一个作业分为若干个Map任务和Reduce任务。

6.1 客户机与HDFS进行交互

6.1.1 客户机配置

可以查看HDFS中的数据，向HDFS中写入数据。

(1)选择一台机器，该机器可以是Hadoop集群中的节点，也可以是集群之外的机器。下面说明在集群之外的客户机上如何操作与HDFS交互，集群之内的节点省去配置过程。

(2)集群之外的机器请保证和Hadoop集群是网络连通的，直接将NameNode的hadoop文件夹scp过去即可

(3)按照以上步骤配置完成后，即可在客户机的命令行中执行命令，查看HDFS文件系统。

6.1.2 列出HDFS根目录/下的文件

[hadoop@namenode bin]$ bin/hadoop dfs -ls /

第一列是目录权限，第二列的hadoop是目录拥有者，第三列是组名，第4列是目录大小(单位是B)，第5列是目录的绝对路径。这里表示/目录下有三个目录。这里的用户hadoop是安装hadoop的用户，是超级用户，相当于Linux操作系统的root用户，组supergroup相当于root用户组。

6.1.3 HDFS用户管理

创建HDFS用户需要使用hadoop用户登录客户机器，并且执行hadoop相关命令。由于Hadoop默认当前HDFS中的用户就是当前登录客户机的用户，所以当前HDFS用户即为Hadoop超级用户hadoop。

Hadoop似乎没有提供创建用户的命令，但要在HDFS中创建用户和用户组可以这样做。

(i)Hadoop超级用户hadoop在hdfs中创建目录/user/root，

即 hadoop dfs -mkdir /user/root

(ii)更改/user/root目录所属用户和组，

即bin/hadoop dfs -chown -R root:root /user/root,命令执行完毕Hadoop将默认创建有用户root，用户组root。

注意：若此处没有指定组，则默认将root用户分配到supergroup组， bin/hadoop dfs -chown -R root /user/root

(ii)这样就相当于在hdfs中创建了用户root，组root。并且当前客户机的root用户对hdfs中的/user/root目录进行rwx。

6.1.5 复制本地数据到HDFS中

[hadoop@namenode bin]# bin/hadoop dfs –copyFromLocal /local/x /user/root/

执行以上命令即能将本地数据上传到HDFS中，上传的文件将会被分块，并且数据块将物理存储在集群数据节点的hadoop-site.xml文件中的dfs.data.dir参数指定的目录下，用户可以登录数据节点查看相应数据块。

HDFS中一个文件对应若干数据块，如果文件小于块大小(默认64M)，则将会存储到一个块中，块大小即文件大小。若文件很大，则分为多个块存储。

6.1.6 数据副本说明

Hadoop-site.xml文件中的dfs.replication参数指定了数据块的副本数量。一个文件被分为若干数据块，其所有数据块副本的名字和元数据都是一样的，例如下图显示了上传一个目录(包含两个小文件)到HDFS后数据节点中数据块情况：

图节点一上的副本

图节点二上的副本

6.1.7 hadoop-site.xml参数说明

(1) hadoop.tmp.dir

该参数默认值是“/tmp/hadoop-{当前登录用户名}”。

它是本地路径，当第一次启动Hadoop集群进程时在namenode节点的本地创建该目录，其作用是存储相关临时文件。

(2)mapred.system.dir

该参数默认值是${hadoop.tmp.dir}/mapred/system，它所表示的目录是hdfs中的路径，是相对于dfs.default.name的路径，即它在hdfs中的绝对路径是{$dfs.default.name}/{$mapred.system.dir}。

该参数指定的目录的作用是当作业运行时，存储作业相关文件，供tasktracker节点共享。

一般hdfs系统中/目录下可以看到该参数指定的目录，如

[hadoop@namenode bin]$ hadoop dfs -lsr /

其他参数参见hadoop-default.xml中的说明。

6.1.8 HDFS中的路径

首先请查阅资料，把握URI的概念。在HDFS中，例如下面这些形式均是URI（注意不是URL，URI概念比URL更广）。例如file:///，hdfs://x/y/z，/x/y/z，z。

HDFS路径应该可以分为三种：绝对URI路径，即

hdfs://namenode:端口/xxxx/xxxx

这种形式；HDFS绝对路径，例如/user或者///user，注意使用/或者///表示根目录，而不能使用//；HDFS相对路径，例如x，此路径往往是相对于当前用户主目录/user/用户名而言，例如x对应的HDFS绝对路径是/user/hadoop/x。

6.1.8 Hadoop相关命令

Hadoop提供一系列的命令，在bin中，例如bin/hadoop fs –x；bin/hadoop namenode –x等等。其中有些命令只能在namenode上执行。

bin下还有一些控制脚本，例如start-all.sh、start-mapred.sh、start-dfs.sh等等。数据节点上运行start-all.sh将会只启动本节点上的进程，如datanode、tasktracker。

6.2 客户机提交作业到集群

6.2.1 客户机配置

可以在客户机上向Hadoop集群提交作业。

(1)选择一台机器，该机器可以是Hadoop集群中的节点，也可以是集群之外的机器。下面说明在集群之外的客户机上如何向hadoop提交作业，集群之内的节点省去配置过程。

(2)集群之外的机器请保证和Hadoop集群是网络连通的，并且安装了Hadoop(解压安装包即可)并在conf/hadoop-site.xml中做了相关配置，至少配置如下：

core-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>fs.default.name</name>

<value>hdfs://NameNode:9000</value>

</property>

</configuration>

mapred-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>mapred.job.tracker</name>

<value>NameNode:9001</value>

</property>

</configuration>

(3)按照以上步骤配置完成后，即可在客户机的命令行中执行命令，向hadoop提交作业。

6.2.2 一个测试例子WordCount

计算输入文本中词语数量的程序WordCount在Hadoop主目录下的java程序包hadoop-0.20.2-examples.jar中，执行步骤如下：

(1)上传数据到HDFS中

[hadoop@NameNode hadoop-0.20.2]$ hadoop fs -copyFromLocal /usr/local/hadoop/hadoop-0.20.2/README.txt input

[hadoop@NameNode hadoop-0.20.2]$ hadoop dfs -ls input

Found 1 items

-rw-r--r-- 3 hadoop supergroup 1366 2013-03-11 18:34 /user/hadoop/input

Datanode1下的数据

DataNode2下的数据

DataNode3下没有数据

DataNode4下的数据

在这个集群中，定义数据的副本为3，集群中有4个节点，数据分别在DataNode1、DataNode2、DataNode4 这三处存放。

(2)执行命令，提交作业

[hadoop@namenode hadoop-0.20.2]$ bin/hadoop jar hadoop-0.20.2-examples.jar wordcount input output

[hadoop@NameNode hadoop-0.20.2]$ bin/hadoop jar hadoop-0.20.2-examples.jar wordcount input output

13/03/11 18:42:42 INFO input.FileInputFormat: Total input paths to process : 1

13/03/11 18:42:42 INFO mapred.JobClient: Running job: job_201303111827_0001

13/03/11 18:42:43 INFO mapred.JobClient: map 0% reduce 0%

13/03/11 18:42:52 INFO mapred.JobClient: map 100% reduce 0%

13/03/11 18:43:04 INFO mapred.JobClient: map 100% reduce 100%

13/03/11 18:43:06 INFO mapred.JobClient: Job complete: job_201303111827_0001

13/03/11 18:43:06 INFO mapred.JobClient: Counters: 17

13/03/11 18:43:06 INFO mapred.JobClient: Job Counters

13/03/11 18:43:06 INFO mapred.JobClient: Launched reduce tasks=1

13/03/11 18:43:06 INFO mapred.JobClient: Launched map tasks=1

13/03/11 18:43:06 INFO mapred.JobClient: Data-local map tasks=1

13/03/11 18:43:06 INFO mapred.JobClient: FileSystemCounters

13/03/11 18:43:06 INFO mapred.JobClient: FILE_BYTES_READ=1836

13/03/11 18:43:06 INFO mapred.JobClient: HDFS_BYTES_READ=1366

13/03/11 18:43:06 INFO mapred.JobClient: FILE_BYTES_WRITTEN=3704

13/03/11 18:43:06 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=1306

13/03/11 18:43:06 INFO mapred.JobClient: Map-Reduce Framework

13/03/11 18:43:06 INFO mapred.JobClient: Reduce input groups=131

13/03/11 18:43:06 INFO mapred.JobClient: Combine output records=131

13/03/11 18:43:06 INFO mapred.JobClient: Map input records=31

13/03/11 18:43:06 INFO mapred.JobClient: Reduce shuffle bytes=1836

13/03/11 18:43:06 INFO mapred.JobClient: Reduce output records=131

13/03/11 18:43:06 INFO mapred.JobClient: Spilled Records=262

13/03/11 18:43:06 INFO mapred.JobClient: Map output bytes=2055

13/03/11 18:43:06 INFO mapred.JobClient: Combine input records=179

13/03/11 18:43:06 INFO mapred.JobClient: Map output records=179

13/03/11 18:43:06 INFO mapred.JobClient: Reduce input records=131

[hadoop@NameNode hadoop-0.20.2]$

命令执行完毕，在页面http://namenodeip:50030/中能够看到作业执行情况。

(3)程序输出

程序将统计input目录下的所有文本文件中词语的数量，并将结果输出到hdfs的output目录下的part-00000文件中。这里的output目录是程序生成的目录，程序运行前不可存在。执行以下命令可以查看结果。

[hadoop@namenode hadoop-0.20.2]$ hadoop fs -ls output

Found 2 items

drwxr-xr-x - hadoop supergroup 0 2013-03-09 23:35 /user/hadoop/output/_logs

-rw-r--r-- 3 hadoop supergroup 127741 2013-03-09 23:35 /user/hadoop/output/part-r-00000

6.2.3 编写Hadoop应用程序并在集群上运行

这里介绍一个向HDFS中写入数据的例子(注意不是MR程序)来说明编写Hadoop应用程序并放到集群上运行的步骤。

(1)客户端编写应用程序并编译运行，进行测试。

编写程序一般需要引入hadoop相关jar包或者直接使用hadoop整个程序包，相关代码见附录。

(2)打包应用程序

在eclipse中打包成jar文件存储到相应目录下，例如/hadoop/ jarseclipse/dfsOperator.jar。

(3)上传数据到HDFS

bin/hadoop fs –copyFromLocal local dst

本实例中不需要上传数据，一般的程序都涉及输入数据。

(4)执行应用程序

bin/hadoop jar x.jar jar包中主类名 [输入参数] [输出参数]

这里使用的命令是:
bin/hadoop jar ~/jarseclipse/dfsOperator.jar DFSOperator

6.2.4 三种模式下编译运行Hadoop应用程序

集群是完全分布式环境，Hadoop的MR程序将以作业的形式提交到集群中运行。我们在客户端编写Hadoop应用程序时一般是在伪分布式模式或单击模式下进行编译，然后将编译无误的程序打成包提交到Hadoop集群中，当然我们仍可直接让程序在Hadoop集群中编译。

(1)让Hadoop应用程序在直接在集群中编译

将hadoop整个包导入eclipse中，配置core-site.xml和mapred-site.xml文件如下：

core-site.xml

<name>fs.default.name</name>

<value>hdfs://NameNode:9000</value> </property>

</configuration>

mapred-site.xml

<name>mapred.job.tracker</name>

<value> NameNode:9001</value>

</property>

</configuration>

编写应用程序，编译运行，此时程序将直接在Hadoop集群中运行。此种方法在开发中不建议使用，以防止破坏集群环境。

(2)单机模式下编译Hadoop应用程序

将hadoop整个包导入eclipse中， hadoop-site.xml文件不做任何配置，保留默认的空配置。

单机模式下运行Hadoop应用程序时，程序使用的是本地文件系统。

(3)伪分布式模式下编译Hadoop应用程序

在单机上配置Hadoop伪分布式模式，配置文件hadoop-site.xml如下：

core-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

</property>

</configuration>

hdfs-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>dfs.replication</name>

</property>

</configuration>

mapred-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>mapred.job.tracker</name>

<value>localhost:9001</value>

</property>

</configuration>

使用bin/start-all.sh启动伪分布式集群。

将hadoop整个包导入eclipse中，并将hadoop-site.xml文件配置为以上一样的内容。（或者直接将上面的hadoop目录导入eclipse中）。

编写应用程序并运行，此时程序将在伪分布式模式下运行，使用的是HDFS。

6.2.5 提交多个作业到集群

提交一个后，可以继续提交，这样集群中将有多个作业，Hadoop有一个作业队列，可以在以下网址中查看。

http://10.88.106.187:50030/jobqueue_details.jsp?queueName=default

涉及多个作业时，Hadoop将对作业进行调度，默认调度方式是基于优先级的FIFO方式。

更改作业优先级命令

作业优先级有五种：VERY_HIGH HIGH NORMAL LOW VERY_LOW

例如：

bin/hadoop job -set-priority job_201005210042_0074 VERY_HIGH

附录：Hadoop安装常见错误

1 INFOhdfs.DFSClient: Exception in createBlockOutputStreamjava.net.NoRouteToHostException: No route to host

错误原因：没有关闭防火墙

2. be replicated to 0 nodes, instead of 1

原因：多次格式化namenode,造成namenode节点的namespaceID和datanode节点的namespaceID不一致。

处理方法1：所有的datanode删掉，重新建

处理方法2：登上datanode，把位于{dfs.data.dir}/current/VERSION中的namespaceID改为最新的版本即可

[hadoop@namenode current]$ cat VERSION

#Fri Dec 14 09:37:22 CST 2012

namespaceID=525507667

storageID=DS-120876865-10.4.124.236-50010-1354772633249

cTime=0

storageType=DATA_NODE

layoutVersion=-32

[hadoop@DataNode1 current]$ cat VERSION

#Mon Mar 11 18:27:58 CST 2013

namespaceID=1736724608

storageID=DS-203565513-10.88.106.188-50010-1362997678871

cTime=0

storageType=DATA_NODE

layoutVersion=-18

两个namespaceID不一致，把DataNode节点的namespaceID修改为NameNode的值。

3.用JPS命令，没有发现NameNode或DataNode

处理措施：

处理措施1：将NameNode和DataNode下的tmp和hdfs/name清空，重新执行格式化。

处理措施2：将NameNode下的tmp和hdfs/name清空。将DataNode下hadoop文件夹删除，重建。

然后用scp命令将 /usr/local/hadoop文件夹复制到各个DataNode下的/usr/local/hadoop

scp -r/usr/local/hadoop/* hadoop@DataNode1:/usr/local/hadoop

…

scp -r/usr/local/hadoop/* hadoop@DataNode4:/usr/local/hadoop

你可能感兴趣的:(Hadoop0.20.2在Linux X64下的分布式配置和使用)

SpringBoot编程基础教程：Spring Boot Test AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.背景介绍SpringBootTest简介测试是一个软件开发过程中的重要环节，它可以帮助我们检测出软件代码中存在的问题、错误或漏洞，提高软件质量，确保软件的可靠性和可用性。在Java开发领域，Java自带的单元测试框架（JUnit）已经成为事实上的标准，但是随着项目越来越复杂，系统越来越庞大，单元测试用例的数量也越来越多，执行时间也越来vron长。此时，我们就需要自动
智能温控风扇——ESP8266 + DS18B20 + OLED + WiFi插座 uote_e 单片机
智能温控风扇——ESP8266+DS18B20+OLED+WiFi插座在现在这个智能家居越来越普及的时代，智能温控风扇已经成为了很受欢迎的产品之一。本文将教大家如何使用ESP8266单片机、DS18B20温度传感器、OLED显示屏和WiFi插座，来实现家用风扇改造成智能温控风扇。材料准备ESP8266开发板DS18B20温度传感器OLED显示屏WiFi插座面包板、杜邦线、三极管、电阻、陶瓷电容等元
CMake string用法小米人er 我的博客 cmake
string(REPLACE"]""CLOSEBRACKET"PATCHED_LIST"${PATCHED_LIST}")是CMake里string命令的一种使用方式。下面来详细剖析这条命令：string：这是CMake里用于处理字符串的命令，能执行各类字符串操作。REPLACE：这是string命令的一个操作模式，其作用是把字符串里特定的子字符串替换成别的字符串。"]"：代表要被替换掉的子字符串
antd datepicker禁用日期设置为今天的前一天，禁用时间设置为当前时间点之前的时间每一天，每一步 ant design -react javascript 前端开发语言
在使用AntDesign(antd)的DatePicker组件时，可以通过disabledDate和showTime的disabledHours,disabledMinutes,disabledSeconds属性来禁用特定的日期和时间。1.禁用今天的前一天及之前的日期：可以提供一个函数给disabledDate属性，该函数将接收一个current参数（一个moment.js对象），然后返回一个布尔
企业级网络架构哦吼吼吼tian
目录三层交换机三层交换机使用过程:连接外网动态路由ospf协议,开放最短路径优先协议ospf区域区域ID骨干区域0ospf配置:传输层传输层的作用传输层两个重要的协议TCP的应用UDP应用ACL访问控制列表ACL的主要类型ACL规则三层交换机使用三层交换技术实现VLAN间通信三层交换=二层交换+三层转发三层交换机使用过程:1.添加VLAN(vlanbatch23)2.对应的接口添加相应的VLAN(
vue使用window.open（）跳转页面 scorpion_V vue JavaScript 前端 javascript vue.js
项目场景：提示：项目需要vue带参数跳转打开新页面、新窗口：例如：点击机巢监控按钮，在当前页面重新打开一个窗口到另一个页面（同时把参数全部带过去）window.open()的用法open()方法用于打开一个新的浏览器窗口或查找一个已命名的窗口。window.open(URL,name,specs,replace)specs可选。一个逗号分隔的项目列表。支持以下值：channelmode=yes|n
JS经纬度正则验证 scorpion_V 前端
经纬度的校验（保留5位小数）：需求：一个页面多个经纬度需要经验，然后采用此方法就可以一步到位啦~1.在util.js全局写经纬度的范围校验代码如下：constformValidation={//经度validatorLongitude:(rule,value,callback)=>{constreg=/^(\-|\+)?(((\d|[1-9]\d|1[0-7]\d|0{1,3})\.\d{0,15
贪吃蛇Python版源码+代码分析 XKETX python 游戏程序经验分享
跳转目录前言运行示例程序分析捕获键盘操作输出游戏画面代码分析一安装运行环境游戏地图的实现炸弹的实现食物的实现蛇的实现初步测试键盘控制的实现主程序game函数图形界面显示分数,得分结束函数游戏主函数源码下载前言该程序未使用pygame库,而是采用keyboard库的on_press()函数捕获键盘操作,使用windows控制台缓冲区作为图形界面。第一次写文章，如有错误请谅解运行示例程序分析捕获键盘操
【linux 时间同步】星辰&与海 linux 运维
文章目录1.使用NTP(NetworkTimeProtocol)2.使用Chrony3.使用timedatectl配置时间和时区4.手动设置时间5.检查时间同步状态6.总结.适用场景在Linux系统中，时间同步通常用于确保系统的时钟与标准时间源（如NTP服务器）保持一致。通过时间同步，可以避免系统时钟漂移导致的问题，特别是在分布式系统、日志记录和任务调度等场景中。以下是常见的Linux时间同步方法
Linux主机时间同步会飞的土拨鼠呀 Linux运维技巧 linux 服务器运维
写在前面处于内网的Linux主机，时间容易不准确，在我遇到的内网服务器中，大部分的时间会有偏差，一般偏差5到10分钟。如果系统部署在这个机器上，那么系统的时间也是不准确的，此时我们需要对Linux主机做时间同步处理。手动同步时间1.date:查看当前时间[root@localhost~]#date2021年03月22日星期一15:59:59CST2.date'+%Y%M%D'按照格式显示当前日期[
error: [Errno 2] No such file or directory: ‘:/usr/local/cuda-12.1/bin/nvcc‘: ‘:/usr/local/cuda-12.1 鲤鱼不懂 bug cuda
一背景最近在服务器使用cuda报错，昨天使用还可以，今日就出问题，在此记录解决方案。二报错信息error:[Errno2]Nosuchfileordirectory:':/usr/local/cuda-12.1/bin/nvcc':':/usr/local/cuda-12.1/bin/nvcc'三解决方案终端输入以下命令exportCUDA_HOME=/usr/local/cuda-12.1
使用Spring Actuator + Micrometer + Prometheus + Grafana监控Spring Boot应用程序帅过驴的袋鼠 java docker
前言读取本文需要的知识：Java,Docker基本命令当某个应用在生产环境中运行时,监控其运行状态是必要的和明智的。通过实时了解应用程序的运行状况,你能在问题出现之前得到警告,也可以在客户端注意到问题之前解决问题。最终的效果图模块简单介绍SpringActuator:在应用程序离提供众多Web接口,通过它们了解应用运行时的内部状况。Micrometer:为Java平台上的性能数据收集提供了一个通用
Junit5 单元测试框架的使用 qq_40815999 单元测试
Junit5简单使用总结作为一款测试框架，一般我们需要从以下几个方面去考虑TestCase：测试用例的管理Assertions:用例断言的管理TestExecution:测试执行，以何种顺序执行TestFixtures:测试装置，测试用例运行的前后动作，用来管理测试用例的执行TestSuites:测试套，控制用例批量运行TestRunner：测试用例的运行器TestResultReport：测试报
uniapp或小程序使用jsencrypt 钢铁熊猫33 小程序前端 uniapp 小程序 jsencrypt rsa
uniapp或小程序使用报错jsencrypt.js使用了window对象，app、小程序中没有窗口对象的环境解决办法在jsencrypt.js文件插入以下代码varnavigator2={appName:'Netscape',userAgent:'Mozilla/5.0(iPhone;CPUiPhoneOS9_1likeMacOSX)AppleWebKit/601.1.46(KHTML,like
Spring Boot & MyBatis Plus 版本兼容问题（记录） michael.csdn spring boot mybatis plus 后端
SpringBoot&MyBatisPlus版本兼容问题（Invalidvaluetypeforattribute'factoryBeanObjectType':java.lang.String）问题描述问题排查1.检查`@MapperScan`的路径2.项目中没有配置`FactoryBean`3.检查`Spring`和`MyBatisPlus`版本兼容性解决方法问题描述当使用spring-boo
STM32学习和实践笔记（28）：printf重定向实验复业思维20240108 STM32 stm32 学习笔记
1.printf重定向简介在C语言中printf函数里，默认输出设备是显示器，如果想要用这个函数将输出结果到串口或者LCD上显示，就必须重定义标准库函数里中printf函数调用的与输出设备相关的函数。比如要使用printf输出到串口，需要先将fputc函数里面的输出指向串口,这个更改就叫重定向。
STM32CubeIDE 的应用: 重定向printf 到stm32串口 logan_lei stm32 uart 串口通信
一。导入stdio.h库文件/*Privateincludes----------------------------------------------------------*//*USERCODEBEGINIncludes*/#include/*USERCODEENDIncludes*/二。重写函数/*USERCODEBEGIN4*/#ifdef__GNUC__#definePUTCHAR_
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶网罗开发 AI 大模型人工智能机器学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
导出 YOLOv11 模型的详细步骤和说明 old_power 计算机视觉 YOLO 人工智能计算机视觉
以下是关于如何导出YOLOv11模型的详细步骤和说明：1.导出YOLOv11模型的基本步骤YOLOv11模型可以通过Ultralytics提供的接口轻松导出为多种格式，如ONNX、TensorRT、CoreML等。以下是导出模型的基本步骤：1.1安装Ultralytics库首先，确保已安装Ultralytics库：pipinstallultralytics1.2加载模型并导出使用Python代码加
【Redis】golang操作Redis基础入门 m0_74825360 面试学习路线阿里巴巴 redis golang 数据库
【Redis】golang操作Redis基础入门大家好我是寸铁??总结了一篇【Redis】golang操作Redis基础入门sparkles:喜欢的小伙伴可以点点关注??Redis的作用Redis（RemoteDictionaryServer）是一个开源的内存数据库，它主要用于存储键值对，并提供多种数据结构的支持。Redis的主要作用包括：1.缓存:Redis可以作为缓存系统，将常用的数据缓存在内
【route】route add命令详解 m0_74825360 面试学习路线阿里巴巴 php 网络开发语言
routeadd命令的主要作用是添加静态路由，通常的格式是：routeADD157.0.0.0MASK255.0.0.0157.55.80.1METRIC3IF2参数含义：^destination^mask^gatewaymetric^^interfacedestination【网段地址】mask【子网掩码】gateway【网关地址】metric【路由跳数】if【端口号】一般情况下，不涉及本机地址
Element-plus封装表格Validate 努力搬砖的宣 vue.js 前端 javascript elementui
Element-plus实现表格内的表单验证：useAttrValidateHook在Vue.js项目中，表单验证是一个常见的需求，尤其在处理复杂表格编辑场景时。本文将详细介绍一个基于Vue3的自定义Hook——useAttrValidate，它提供了一种便捷的方式来处理表格组件中的字段校验。效果如下：1.导入与初始化Javascriptimport{reactive,nextTick}from"
软件测试工具——Junit单元测试衣衣困 junit 单元测试
什么是单元测试定义：单元测试是对软件中的最小可测试单元（通常是一个函数或方法）进行的验证性测试，旨在确保其按预期工作。目的：通过测试单元代码来发现并修复错误，提高代码的可靠性和维护性。“单元”的大小或范围，并没有一个明确的标准，“单元”可以是一个函数、方法、类、功能模块或者子系统。单元测试一般是有开发人员或测试人员来做。单元测试通常和白盒测试联系到一起，如果单从概念上来讲两者是有区别的，不过我们通
大腾智能CAD：基于云原生架构，融合AI技术的高效三维设计解决方案大腾智能 cad 工业软件信创国产化工业数字化
CAD（计算机辅助设计）技术自诞生以来，在工业设计中经历了从二维到三维、从单一功能到集成化、智能化的飞跃式发展。这一技术不仅极大地提高了设计效率，还使得设计精度和创新能力得到了前所未有的提升，已成为现代工业设计不可或缺的重要工具。随着“中国制造2025”等战略的实施，国产CAD软件迎来了前所未有的市场机遇。大腾智能公司紧跟时代步伐，推出了一款完全基于云原生架构的国产三维CAD设计软件，它集三维建模
微信小程序开发工具介绍及安装（上）计算机萍萍学姐小程序开发微信小程序小程序微信
本章主要介绍微信小程序开发工具的介绍小程序开发工具的安装方法开发工具的基本功能介绍微信小程序开发工具的介绍微信小程序开发工具是一款由微信官方提供的集成开发环境（IDE），旨在帮助开发者更便捷地创建、调试和发布微信小程序。该开发工具具备丰富的功能和工具集，可以极大地提高小程序开发的效率和质量。以下是对微信小程序开发工具的介绍：一、简介微信小程序开发工具是微信官方推出的一款跨平台开发工具，适用于开发者
Copilot 概述计算机萍萍学姐 copilot copilot 人工智能机器学习
Copilot是什么？它有什么用途？Copilot是由人工智能公司和GitHub合作开发的一个基于人工智能的代码提示工具，它可以利用机器学习技术和大量训练数据生成高质量的代码。Copilot的目标是在保持代码质量和可读性的前提下，提高开发者的编码效率，使得编码工作更为高效和便捷。Copilot的出现是解决编程过程中可能遇到的一些难点和瓶颈问题，特别是在快速迭代的敏捷开发场景中，提高编码效率和减少编
Python模拟发送SOME/IP消息（Scapy模块）李星星BruceL 车载总线及以太网 python tcp/ip 网络协议车载系统服务发现
Python模拟服务端或客户端发送SOME/IP消息1说明2依赖3服务端3.1导包3.2参数定义3.3提供服务（OfferService）3.4订阅ACK/NACK（SubscribeACK/NACK）3.5通知（Notifier）3.6请求/响应ACK（ResponseACK）1说明主要介绍如何使用Python+scapy模块进行SOME/IP以及SOME/IP-SD消息的发送和解析；关于SOM
JS通过ASCII码值实现随机字符串的生成（可指定长度以及解决首位不出现数值）觉醒法师 JavaScript javascript 前端开发语言 typescript
在之前写过一篇“JS实现随机生成字符串（可指定长度）”，当时写的过于简单和传统，比较粗放。此次针对此问题，对随机生成字符串的功能进行优化处理，对随机取到的字符都通过程序自动来完成。在写之前，我们先了解下String.charCodeAt、Array.from()、String.fromCharCode等方法，以及随机获取指定范围中的值，这些在此次功能优化中起到关键作用。一、String.charC
Spring Boot快速接入Prometheus监控|写给Java开发运维 ikyrxbxfas Spring Java Java编程 java spring boot 运维 mysql 分布式
不想听我废话的，直接看代码就行：https://github.com/strictnerd/spring-petclinic-compose最近跟几个粉丝聊天吹水，说最近公司裁员严重，不仅裁掉了大部分的人，也裁掉了大部分的业务；之前公司有钱赚，什么产品都愿意做，无论行不行都会试一试，一堆没有什么流量的系统都在线上跑着，但是没有上级发话，一个也不敢停掉。站着资源不说，关键还得保证活着，基本就是运维人
uniapp小程序项目从0到1开发扶园 uni-app 小程序
一、在HBuilderX新建项目,然后可以先把可能用到的文件夹建好二、引入UI框架,根据npm方式配置文档uView2地址:https://uviewui.com/components/install.htmlcmd执行[email protected]引入并使用uView的JS库，注意这两行要放在importVue之后。//main.jsimportuViewfrom"uview
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

Hadoop0.20.2在Linux X64下的分布式配置和使用

jie介绍 介绍

1 集群网络环境介绍及快速部署

2 SSH无密码验证配置

2.1配置所有节点之间SSH无密码验证

3 JDK安装和Java环境变量配置

3.1 安装 JDK 1.6

3.2 Java环境变量配置

4 Hadoop集群配置

5 Hadoop集群启动

6 Hadoop使用

6.1 客户机与HDFS进行交互

6.1.1 客户机配置

6.1.2 列出HDFS根目录/下的文件

6.1.3 HDFS用户管理

6.1.5 复制本地数据到HDFS中

6.1.6 数据副本说明

6.1.7 hadoop-site.xml参数说明

6.1.8 HDFS中的路径

6.1.8 Hadoop相关命令

6.2 客户机提交作业到集群

6.2.1 客户机配置

6.2.2 一个测试例子WordCount

6.2.3 编写Hadoop应用程序并在集群上运行

6.2.4 三种模式下编译运行Hadoop应用程序

6.2.5 提交多个作业到集群

你可能感兴趣的:(Hadoop0.20.2在Linux X64下的分布式配置和使用)

jie介绍

介绍