东明山庄

Install Hadoop1.2.1 in Ubuntu12.04

Install Hadoop121 in Ubuntu1204
- - 配置Java环境变量
- 禁用ipv6
- 配置 SSH
- 下载解压hadoop-121
- 配置Hadoop
- Hadoop的运行
  - 运行Hadoop前要删除临时文件
  - 打开SSH
  - 格式化HDFS文件系统
  - 启动Hadoop环境
  - 执行Hadoop自带例子
  - 停止Hadoop守护进程
进一步阅读
- most relevant
- less relevant

## 1.安装VirtualBox虚拟机这里用的版本是VirtualBox-4.3.20-96997-Win.exe。该虚拟机是开源的，安装文件只有100M多，与VMware相比，系统资源消耗得少。 ##2.安装Ubuntu 在VirtualBox虚拟机上安装64位的Ubuntu12.04，具体版本 ubuntu-12.04.3-desktop-amd64。 ## 3.安装Java ### 下载解压安装我这里的版本是jdk-7u51-linux-x64.tar.gz，将其解压到安装目录，安装后的目录如下：

root@jin-VirtualBox:~# ls /usr/java/jdk1.7.0_51/
bin        jre      README.html                         THIRDPARTYLICENSEREADME.txt
COPYRIGHT  lib      release
db         LICENSE  src.zip
include    man      THIRDPARTYLICENSEREADME-JAVAFX.txt

配置Java环境变量

打开文件 /etc/profile ，在文件结尾处添加以下几行与上一步安装Java的目录相关的内容

JAVA_HOME=/usr/java/jdk1.7.0_51
CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar
PATH=$JAVA_HOME/bin:$PATH
export JAVA_HOME CLASSPATH PATH

以后每次可能用到JavaVM之前，要检查Java是否可用，可以通过打印JRE版本(java -version)和JDK版本(javac -version)的命令来达到这种效果

执行

java -version

如果打印出JRE版本信息，说明JRE环境变量有效，即类似下面的情况

root@jin-VirtualBox:/usr/local/hadoop# java -version
java version "1.7.0_51"
Java(TM) SE Runtime Environment (build 1.7.0_51-b13)
Java HotSpot(TM) 64-Bit Server VM (build 24.51-b03, mixed mode)

执行

javac -version

如果打印出JDK的版本信息，说明JDK环境变量设置有效，即类似下面的情况

root@jin-VirtualBox:/usr/local/hadoop# javac -version
1.7.0_51

其中任何一个的版本信息打印异常，就执行以下命令

source profile

然后再次检查Java是否可用，如果仍不能打印出Java版本信息，可能是/etc/profile 没有设置好，或者Java没有正确安装。查找原因，再次检查，直到其可用为止。

4.禁用ipv6

打开 /etc/sysctl.conf 文件，在文件末尾添加如下内容并保存


net.ipv6.conf.all.disable_ipv6 = 1
net.ipv6.conf.default.disable_ipv6 = 1
net.ipv6.conf.lo.disable_ipv6 = 1

重启Ubuntu系统，执行如下命令

cat$/proc/sys/net/ipv6/conf/all/disable_ipv6

如果打印 1 ，说明设置成功，ipv6已被禁用。

5.配置 SSH

生成秘钥对

root@jin-VirtualBox:/usr/local/hadoop# ssh-keygen -t rsa
然后一直按键，就会按默认的选项将生成的秘钥对保存在 ~/.ssh/id_rsa 文件中。
进入 .ssh目录，执行如下命令

root@jin-VirtualBox:~/.ssh# cp id_rsa.pub authorized_keys
然后执行如下命令

ssh localhost

如果不用输入密码，说明配置成功。
配置SSH过程的屏幕输出记录如下：

root@jin-VirtualBox:/usr/local/hadoop# ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa): 
Enter passphrase (empty for no passphrase): 
Enter same passphrase again: 
Your identification has been saved in /root/.ssh/id_rsa.
Your public key has been saved in /root/.ssh/id_rsa.pub.
The key fingerprint is:
67:cc:ea:e5:a3:60:47:7f:cd:94:04:13:7d:dd:58:40 root@jin-VirtualBox
The key's randomart image is:
+--[ RSA 2048]----+
|            ++E++|
|             oo +|
|              .. |
|         o   . . |
|        S =   o  |
|       . =   +   |
|      o o o . o  |
|     . + o..     |
|        o...     |
+-----------------+
root@jin-VirtualBox:/usr/local/hadoop# cd ~/.ssh/
root@jin-VirtualBox:~/.ssh# ls
id_rsa  id_rsa.pub  known_hosts
root@jin-VirtualBox:~/.ssh# cp id_rsa.pub authorized_keys
root@jin-VirtualBox:~/.ssh# cd 
root@jin-VirtualBox:~# ssh localhost
Welcome to Ubuntu 12.04.3 LTS (GNU/Linux 3.8.0-29-generic x86_64)

 * Documentation:  https://help.ubuntu.com/

388 packages can be updated.
212 updates are security updates.

New release '14.04.2 LTS' available.
Run 'do-release-upgrade' to upgrade to it.

Last login: Sun Mar 15 09:05:03 2015 from localhost

6.下载解压hadoop-1.2.1

这里给出个下载各个版本的Hadoop的安装文件的网址http://archive.apache.org/dist/hadoop/core/ ，我这里下载的是 hadoop-1.2.1.tar.gz。

下载后解压到安装目录，我的安装目录如下所示

root@jin-VirtualBox:/usr/local/hadoop# ls
bin          google-chrome_amd64.deb       hadoop-tools-1.2.1.jar  logs
build.xml    hadoop-ant-1.2.1.jar          input                   NOTICE.txt
c++          hadoop-client-1.2.1.jar       ivy                     README.txt
CHANGES.txt  hadoop-core-1.2.1.jar         ivy.xml                 sbin
conf         hadoop-examples-1.2.1.jar     lib                     share
contrib      hadoop-minicluster-1.2.1.jar  libexec                 src
docs         hadoop-test-1.2.1.jar         LICENSE.txt             webapps

7.配置Hadoop

打开文件 /usr/local/hadoop/conf/hadoop-env.sh ，在文件末尾添加Java目录，内容如下

export JAVA_HOME=/usr/java/jdk1.7.0_51

由于我要安装为分布式（Pseudo-Distributed）的Hadoop平台，所以需要配置conf/core-site.xml、conf/hdfs-site.xml和conf/mapred-site.xml，这三个文件都在Hadoop安装目录下。下面分别是配置后的这三个文件的内容

conf/core-site.xml：






<configuration>
     <property>
         <name>fs.default.namename>
         <value>hdfs://localhost:9000value>
     property>
configuration>

conf/hdfs-site.xml：






<configuration>
     <property>
         <name>dfs.replicationname>
         <value>1value>
     property>
configuration>

conf/mapred-site.xml






<configuration>
     <property>
         <name>mapred.job.trackername>
         <value>localhost:9001value>
     property>
configuration>

8.Hadoop的运行

运行Hadoop前要删除临时文件

如果不是第一次运行，需要删除 /tmp/* 临时文件，否则一些进程如 datanode 可能无法启动。
如下所示，/tmp/ 目录下有之前启动Hadoop所产生的一些文件，将其删除即可

root@jin-VirtualBox:/usr/local/hadoop# ls /tmp/
hadoop-root                        hsperfdata_root
hadoop-root-datanode.pid           Jetty_0_0_0_0_50030_job____yn7qmk
hadoop-root-jobtracker.pid         Jetty_0_0_0_0_50060_task____.2vcltf
hadoop-root-namenode.pid           Jetty_0_0_0_0_50070_hdfs____w2cu08
hadoop-root-secondarynamenode.pid  Jetty_0_0_0_0_50075_datanode____hwtdwq
hadoop-root-tasktracker.pid        Jetty_0_0_0_0_50090_secondary____y6aanv
root@jin-VirtualBox:/usr/local/hadoop# rm -rf /tmp/*

打开SSH

执行命令

ssh localhost

屏幕输出：

root@jin-VirtualBox:~# ssh localhost
Welcome to Ubuntu 12.04.3 LTS (GNU/Linux 3.8.0-29-generic x86_64)

 * Documentation:  https://help.ubuntu.com/

388 packages can be updated.
212 updates are security updates.

New release '14.04.2 LTS' available.
Run 'do-release-upgrade' to upgrade to it.

Last login: Sun Mar 15 09:05:03 2015 from localhost

格式化HDFS文件系统

执行命令：

root@jin-VirtualBox:/usr/local/hadoop# bin/hadoop namenode -format

屏幕输出：

root@jin-VirtualBox:/usr/local/hadoop# bin/hadoop namenode -format
15/03/15 09:21:44 INFO namenode.NameNode: STARTUP_MSG: 
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG:   host = jin-VirtualBox/127.0.1.1
STARTUP_MSG:   args = [-format]
STARTUP_MSG:   version = 1.2.1
STARTUP_MSG:   build = https://svn.apache.org/repos/asf/hadoop/common/branches/branch-1.2 -r 1503152; compiled by 'mattf' on Mon Jul 22 15:23:09 PDT 2013
STARTUP_MSG:   java = 1.7.0_51
************************************************************/
15/03/15 09:21:45 INFO util.GSet: Computing capacity for map BlocksMap
15/03/15 09:21:45 INFO util.GSet: VM type       = 64-bit
15/03/15 09:21:45 INFO util.GSet: 2.0% max memory = 1013645312
15/03/15 09:21:45 INFO util.GSet: capacity      = 2^21 = 2097152 entries
15/03/15 09:21:45 INFO util.GSet: recommended=2097152, actual=2097152
15/03/15 09:21:45 INFO namenode.FSNamesystem: fsOwner=root
15/03/15 09:21:45 INFO namenode.FSNamesystem: supergroup=supergroup
15/03/15 09:21:45 INFO namenode.FSNamesystem: isPermissionEnabled=true
15/03/15 09:21:45 INFO namenode.FSNamesystem: dfs.block.invalidate.limit=100
15/03/15 09:21:45 INFO namenode.FSNamesystem: isAccessTokenEnabled=false accessKeyUpdateInterval=0 min(s), accessTokenLifetime=0 min(s)
15/03/15 09:21:45 INFO namenode.FSEditLog: dfs.namenode.edits.toleration.length = 0
15/03/15 09:21:45 INFO namenode.NameNode: Caching file names occuring more than 10 times 
15/03/15 09:21:46 INFO common.Storage: Image file /tmp/hadoop-root/dfs/name/current/fsimage of size 110 bytes saved in 0 seconds.
15/03/15 09:21:46 INFO namenode.FSEditLog: closing edit log: position=4, editlog=/tmp/hadoop-root/dfs/name/current/edits
15/03/15 09:21:46 INFO namenode.FSEditLog: close success: truncate to 4, editlog=/tmp/hadoop-root/dfs/name/current/edits
15/03/15 09:21:46 INFO common.Storage: Storage directory /tmp/hadoop-root/dfs/name has been successfully formatted.
15/03/15 09:21:46 INFO namenode.NameNode: SHUTDOWN_MSG: 
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at jin-VirtualBox/127.0.1.1
************************************************************/

启动Hadoop环境

执行命令：

root@jin-VirtualBox:/usr/local/hadoop# bin/start-all.sh

屏幕输出：

root@jin-VirtualBox:/usr/local/hadoop# bin/start-all.sh
starting namenode, logging to /usr/local/hadoop/libexec/../logs/hadoop-root-namenode-jin-VirtualBox.out
root@localhost's password: 
localhost: starting datanode, logging to /usr/local/hadoop/libexec/../logs/hadoop-root-datanode-jin-VirtualBox.out
root@localhost's password: 
localhost: starting secondarynamenode, logging to /usr/local/hadoop/libexec/../logs/hadoop-root-secondarynamenode-jin-VirtualBox.out
starting jobtracker, logging to /usr/local/hadoop/libexec/../logs/hadoop-root-jobtracker-jin-VirtualBox.out
root@localhost's password: 
localhost: starting tasktracker, logging to /usr/local/hadoop/libexec/../logs/hadoop-root-tasktracker-jin-VirtualBox.out

然后可以用 jps 命令查看Hadoop进程启动情况，如下

root@jin-VirtualBox:/usr/local/hadoop# jps
24194 JobTracker
24430 TaskTracker
23854 DataNode
24111 SecondaryNameNode
24557 Jps
23618 NameNode

从 jps 命令的打印输出可以看到一共有6个进程，这六个进程缺一不可，否则就意味着启动Hadoop失败，意味着前边步骤有误。

Hadoop守护进程的日志目录是${HADOOP_LOG_DIR} ，即(默认是 ${HADOOP_HOME}/logs).
可以通过浏览器查看NameNode和JobTracker，默认情况下她们的地址:
NameNode - http://localhost:50070/
JobTracker - http://localhost:50030/
下面第一张截图为JobTracker的WEB接口页面

下面一张截图是NameNode的WEB接口页面

执行Hadoop自带例子

将conf文件夹的内容拷贝到分布式文件系统 的input文件，作为样例程序的输入:

bin/hadoop fs -put conf input

执行样例程序：

 bin/hadoop jar hadoop-examples-*.jar grep input output 'dfs[a-z.]+'

我们执行的样例程序就是 hadoop-examples-1.2.1.jar，这是个编译好的jar包；参数input是输入，它位于的伪分布式文件系统中，供Hadoop程序调用，在本地文件是不能直接看到的；参数output是输出，它也位于分布式文件系统中，不能直接在本地系统看到。

Hadoop程序执行过程的屏幕输出内容如下：

root@jin-VirtualBox:/usr/local/hadoop# bin/hadoop jar hadoop-examples-*.jar grep input output 'dfs[a-z.]+' 
15/03/15 09:23:15 INFO util.NativeCodeLoader: Loaded the native-hadoop library
15/03/15 09:23:15 WARN snappy.LoadSnappy: Snappy native library not loaded
15/03/15 09:23:15 INFO mapred.FileInputFormat: Total input paths to process : 17
15/03/15 09:23:16 INFO mapred.JobClient: Running job: job_201503150922_0001
15/03/15 09:23:17 INFO mapred.JobClient:  map 0% reduce 0%
15/03/15 09:23:52 INFO mapred.JobClient:  map 11% reduce 0%
15/03/15 09:24:23 INFO mapred.JobClient:  map 23% reduce 0%
15/03/15 09:24:34 INFO mapred.JobClient:  map 23% reduce 7%
15/03/15 09:24:38 INFO mapred.JobClient:  map 35% reduce 7%
15/03/15 09:24:47 INFO mapred.JobClient:  map 35% reduce 11%
15/03/15 09:24:50 INFO mapred.JobClient:  map 41% reduce 11%
15/03/15 09:24:52 INFO mapred.JobClient:  map 47% reduce 11%
15/03/15 09:24:56 INFO mapred.JobClient:  map 47% reduce 15%
15/03/15 09:25:02 INFO mapred.JobClient:  map 58% reduce 15%
15/03/15 09:25:12 INFO mapred.JobClient:  map 58% reduce 19%
15/03/15 09:25:15 INFO mapred.JobClient:  map 70% reduce 19%
15/03/15 09:25:21 INFO mapred.JobClient:  map 82% reduce 19%
15/03/15 09:25:27 INFO mapred.JobClient:  map 94% reduce 27%
15/03/15 09:25:31 INFO mapred.JobClient:  map 100% reduce 27%
15/03/15 09:25:36 INFO mapred.JobClient:  map 100% reduce 31%
15/03/15 09:25:40 INFO mapred.JobClient:  map 100% reduce 100%
15/03/15 09:25:43 INFO mapred.JobClient: Job complete: job_201503150922_0001
15/03/15 09:25:45 INFO mapred.JobClient: Counters: 30
15/03/15 09:25:45 INFO mapred.JobClient:   Job Counters 
15/03/15 09:25:45 INFO mapred.JobClient:     Launched reduce tasks=1
15/03/15 09:25:45 INFO mapred.JobClient:     SLOTS_MILLIS_MAPS=230152
15/03/15 09:25:45 INFO mapred.JobClient:     Total time spent by all reduces waiting after reserving slots (ms)=0
15/03/15 09:25:45 INFO mapred.JobClient:     Total time spent by all maps waiting after reserving slots (ms)=0
15/03/15 09:25:45 INFO mapred.JobClient:     Launched map tasks=17
15/03/15 09:25:45 INFO mapred.JobClient:     Data-local map tasks=17
15/03/15 09:25:45 INFO mapred.JobClient:     SLOTS_MILLIS_REDUCES=98921
15/03/15 09:25:45 INFO mapred.JobClient:   File Input Format Counters 
15/03/15 09:25:45 INFO mapred.JobClient:     Bytes Read=34251
15/03/15 09:25:45 INFO mapred.JobClient:   File Output Format Counters 
15/03/15 09:25:45 INFO mapred.JobClient:     Bytes Written=180
15/03/15 09:25:45 INFO mapred.JobClient:   FileSystemCounters
15/03/15 09:25:45 INFO mapred.JobClient:     FILE_BYTES_READ=82
15/03/15 09:25:45 INFO mapred.JobClient:     HDFS_BYTES_READ=36085
15/03/15 09:25:45 INFO mapred.JobClient:     FILE_BYTES_WRITTEN=985546
15/03/15 09:25:45 INFO mapred.JobClient:     HDFS_BYTES_WRITTEN=180
15/03/15 09:25:45 INFO mapred.JobClient:   Map-Reduce Framework
15/03/15 09:25:45 INFO mapred.JobClient:     Map output materialized bytes=178
15/03/15 09:25:45 INFO mapred.JobClient:     Map input records=959
15/03/15 09:25:45 INFO mapred.JobClient:     Reduce shuffle bytes=178
15/03/15 09:25:45 INFO mapred.JobClient:     Spilled Records=6
15/03/15 09:25:45 INFO mapred.JobClient:     Map output bytes=70
15/03/15 09:25:45 INFO mapred.JobClient:     Total committed heap usage (bytes)=2363408384
15/03/15 09:25:45 INFO mapred.JobClient:     CPU time spent (ms)=15020
15/03/15 09:25:45 INFO mapred.JobClient:     Map input bytes=34251
15/03/15 09:25:45 INFO mapred.JobClient:     SPLIT_RAW_BYTES=1834
15/03/15 09:25:45 INFO mapred.JobClient:     Combine input records=3
15/03/15 09:25:45 INFO mapred.JobClient:     Reduce input records=3
15/03/15 09:25:45 INFO mapred.JobClient:     Reduce input groups=3
15/03/15 09:25:45 INFO mapred.JobClient:     Combine output records=3
15/03/15 09:25:45 INFO mapred.JobClient:     Physical memory (bytes) snapshot=2922946560
15/03/15 09:25:45 INFO mapred.JobClient:     Reduce output records=3
15/03/15 09:25:45 INFO mapred.JobClient:     Virtual memory (bytes) snapshot=17545351168
15/03/15 09:25:45 INFO mapred.JobClient:     Map output records=3
15/03/15 09:25:46 INFO mapred.FileInputFormat: Total input paths to process : 1
15/03/15 09:25:49 INFO mapred.JobClient: Running job: job_201503150922_0002
15/03/15 09:25:50 INFO mapred.JobClient:  map 0% reduce 0%
15/03/15 09:25:59 INFO mapred.JobClient:  map 100% reduce 0%
15/03/15 09:26:13 INFO mapred.JobClient:  map 100% reduce 100%
15/03/15 09:26:15 INFO mapred.JobClient: Job complete: job_201503150922_0002
15/03/15 09:26:15 INFO mapred.JobClient: Counters: 30
15/03/15 09:26:15 INFO mapred.JobClient:   Job Counters 
15/03/15 09:26:15 INFO mapred.JobClient:     Launched reduce tasks=1
15/03/15 09:26:15 INFO mapred.JobClient:     SLOTS_MILLIS_MAPS=9585
15/03/15 09:26:15 INFO mapred.JobClient:     Total time spent by all reduces waiting after reserving slots (ms)=0
15/03/15 09:26:15 INFO mapred.JobClient:     Total time spent by all maps waiting after reserving slots (ms)=0
15/03/15 09:26:15 INFO mapred.JobClient:     Launched map tasks=1
15/03/15 09:26:15 INFO mapred.JobClient:     Data-local map tasks=1
15/03/15 09:26:15 INFO mapred.JobClient:     SLOTS_MILLIS_REDUCES=13744
15/03/15 09:26:15 INFO mapred.JobClient:   File Input Format Counters 
15/03/15 09:26:15 INFO mapred.JobClient:     Bytes Read=180
15/03/15 09:26:15 INFO mapred.JobClient:   File Output Format Counters 
15/03/15 09:26:15 INFO mapred.JobClient:     Bytes Written=52
15/03/15 09:26:15 INFO mapred.JobClient:   FileSystemCounters
15/03/15 09:26:15 INFO mapred.JobClient:     FILE_BYTES_READ=82
15/03/15 09:26:15 INFO mapred.JobClient:     HDFS_BYTES_READ=295
15/03/15 09:26:15 INFO mapred.JobClient:     FILE_BYTES_WRITTEN=107941
15/03/15 09:26:15 INFO mapred.JobClient:     HDFS_BYTES_WRITTEN=52
15/03/15 09:26:15 INFO mapred.JobClient:   Map-Reduce Framework
15/03/15 09:26:15 INFO mapred.JobClient:     Map output materialized bytes=82
15/03/15 09:26:15 INFO mapred.JobClient:     Map input records=3
15/03/15 09:26:15 INFO mapred.JobClient:     Reduce shuffle bytes=82
15/03/15 09:26:15 INFO mapred.JobClient:     Spilled Records=6
15/03/15 09:26:15 INFO mapred.JobClient:     Map output bytes=70
15/03/15 09:26:15 INFO mapred.JobClient:     Total committed heap usage (bytes)=123277312
15/03/15 09:26:15 INFO mapred.JobClient:     CPU time spent (ms)=2080
15/03/15 09:26:15 INFO mapred.JobClient:     Map input bytes=94
15/03/15 09:26:15 INFO mapred.JobClient:     SPLIT_RAW_BYTES=115
15/03/15 09:26:15 INFO mapred.JobClient:     Combine input records=0
15/03/15 09:26:15 INFO mapred.JobClient:     Reduce input records=3
15/03/15 09:26:15 INFO mapred.JobClient:     Reduce input groups=1
15/03/15 09:26:15 INFO mapred.JobClient:     Combine output records=0
15/03/15 09:26:15 INFO mapred.JobClient:     Physical memory (bytes) snapshot=247898112
15/03/15 09:26:15 INFO mapred.JobClient:     Reduce output records=3
15/03/15 09:26:15 INFO mapred.JobClient:     Virtual memory (bytes) snapshot=1954955264
15/03/15 09:26:15 INFO mapred.JobClient:     Map output records=3

查看Hadoop程序的输出文件内容
有两种方法，一个是在本地文件系统上查看，一个是直接在分布式文件系统上查看。
- 把程序输出从分布式文件系统拷贝到本地系统，然后在本地系统查看文件内容
  
  bin/hadoop fs -get output output
  cat output/*
- 直接在分布式文件系统查看
  
  bin/hadoop fs -cat output/*
文件内容如下：

cat: output/_logs: Is a directory
1 dfs.replication
1 dfs.server.namenode.
1 dfsadmin

停止Hadoop守护进程

每次使用Hadoop结束后不要忘了关闭Hadoop程序，命令：

root@jin-VirtualBox:/usr/local/hadoop# bin/stop-all.sh

屏幕输出：

root@jin-VirtualBox:/usr/local/hadoop# bin/stop-all.sh
stopping jobtracker
root@localhost's password: 
localhost: stopping tasktracker
stopping namenode
root@localhost's password: 
localhost: stopping datanode
root@localhost's password: 
localhost: stopping secondarynamenode

进一步阅读

most relevant

Cluster Setup
http://hadoop.apache.org/docs/r1.2.1/cluster_setup.html
Single Node Setup
http://hadoop.apache.org/docs/r1.2.1/single_node_setup.html
HADOOP TUTORIALS
http://hadooptutorials.co.in/index.html
INSTALL HADOOP ON UBUNTU
http://hadooptutorials.co.in/tutorials/hadoop/install-hadoop-on-ubuntu.html#

less relevant

用MapReduce实现矩阵乘法
http://blog.fens.me/hadoop-mapreduce-matrix/
MapReduce实现大矩阵乘法
http://blog.csdn.net/xyilu/article/details/9066973
PageRank算法并行实现
http://blog.fens.me/algorithm-pagerank-mapreduce/
Ubuntu上搭建Hadoop环境（单机模式+伪分布模式）
http://blog.csdn.net/hitwengqi/article/details/8008203
运行Hadoop遇到的问题
http://www.cnblogs.com/liangzh/archive/2012/04/06/2434602.html
hadoop 配置中的几个小笔记
http://blog.csdn.net/shomy_liu/article/details/43192231
hadoop-2.6.0集群环境搭建
http://blog.csdn.net/fteworld/article/details/41944597
Hadoop-2.6.0环境搭建精简极致指导
http://www.linuxidc.com/Linux/2015-01/111258.htm

你可能感兴趣的:(IDE)

git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
你可能遗漏的一些C#/.NET/.NET Core知识点追逐时光者 C#.NET DotNetGuide编程指南 c#.net .netcore microsoft
前言在这个快速发展的技术世界中，时常会有一些重要的知识点、信息或细节被忽略或遗漏。《C#/.NET/.NETCore拾遗补漏》专栏我们将探讨一些可能被忽略或遗漏的重要知识点、信息或细节，以帮助大家更全面地了解这些技术栈的特性和发展方向。拾遗补漏GitHub开源地址https://github.com/YSGStudyHards/DotNetGuide/blob/main/docs/DotNet/D
「豆包Marscode体验官」 | 云端 IDE 启动 & Rust 体验张风捷特烈 ide rust 开发语言后端
theme:cyanosis我正在参加「豆包MarsCode初体验」征文活动MarsCode可以看作一个运行在服务端的远程VSCode开发环境。对于我这种想要学习体验某些语言，但不想在电脑里装环境的人来说非常友好。本文就来介绍一下在MarsCode里，我的体验rust开发体验。一、MarsCode是什么它的本质是:提供代码助手和云端IDE服务的web网站，可通过下面的链接访问https://www
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
ESP32-C3入门教程网络篇⑩——基于esp_https_ota和MQTT实现开机主动升级和被动触发升级的OTA功能小康师兄 ESP32-C3入门教程 https 服务器 esp32 OTA MQTT
文章目录一、前言二、软件流程三、部分源码四、运行演示一、前言本文基于VSCodeIDE进行编程、编译、下载、运行等操作基础入门章节请查阅：ESP32-C3入门教程基础篇①——基于VSCode构建HelloWorld教程目录大纲请查阅：ESP32-C3入门教程——导读ESP32-C3入门教程网络篇⑨——基于esp_https_ota实现史上最简单的ESP32OTA远程固件升级功能二、软件流程
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
python爬取微信小程序数据,python爬取小程序数据 2301_81900439 前端
大家好，小编来为大家解答以下问题，python爬取微信小程序数据，python爬取小程序数据，现在让我们一起来看看吧！Python爬虫系列之微信小程序实战基于Scrapy爬虫框架实现对微信小程序数据的爬取首先，你得需要安装抓包工具，这里推荐使用Charles，至于怎么使用后期有时间我会出一个事例最重要的步骤之一就是分析接口，理清楚每一个接口功能，然后连接起来形成接口串思路,再通过Spider的回调
You have an error in your SQL syntax； check the manual that corresponds to your MySQL server version 努力的菜鸟~ sql 数据库
YouhaveanerrorinyourSQLsyntax;checkthemanualthatcorrespondstoyourMySQLserverversionfortherightsyntaxtousenear‘IDENTIFIEDBY‘123456’WITHGRANTOPTION’atline1在mysql5.7之前GRANTALLPRIVILEGESON*.*TO'root'@'%'I
《Veronika decides to die》 Ooutstanding
Whatismadness？——Madnessistheinabilitytocommunicate.Betweennormalityandmadness,whicharebasicallythesamething,thereexistsanintermediarystage：itiscalled"beingdifferent."Andpeoplewerebecomingmoreandmoreaf
Vicky的ScalersTalk第六轮新概念朗读持续力训练Day73 20210411 Vicky_b9de
练习材料：ModerncavemenPart-3ˈmɒdənˈkeɪvmənpɑːt-3Theyplungedintothelake,andafterloadingtheirgearonaninflatablerubberdinghy,letthecurrentcarrythemtotheotherside.Toprotectthemselvesfromtheicywater,theyhadtow
自定义分区我的K8409 Hadoop hdfs hadoop 大数据
通过简单例子了解partition分区类的重写方法分区是在MR的过程中进行的，属于Shuffle阶段但是在Job端不要忘记进行调用：job.setPartitionerClass(xxx.class)按照年龄分区：classAgePartitionerextendsPartitioner{@OverridepublicintgetPartition(MyComparablekey,NullWrit
idea使用自定义checkstyle.xml配置文件 Gemkey
1.下载插件image.png2.插件安装完后,找到设置中的checkstyle,点击"+",新增自定义规则image.png3.输入描述信息,点击Browse找到对应的文件image.pngimage.png4.可以把active勾上,则使用默认校验规则,点击OK,则可以开始使用自定义规则检测单个文件了image.png
spring security中几大组件的作用和执行顺序阿信在这里 java spring
springsecurity中几大组件的作用和执行顺序在SpringSecurity中，AuthenticationProvider、GroupPermissionEvaluator、PermissionEvaluator、AbstractAuthenticationProcessingFilter、DefaultMethodSecurityExpressionHandler和ManageSecu
101个浪漫的点子..哈哈有需要可以试试...中英对照~ Hecks 学习心得 IDEA UP Go 音乐网页游戏
Thisisafreebonusversionof101RomanticIdeas.Feelfreetoforwardtoormakecopiesforyourfriends.下面是101个浪漫的点子。可随意转发给你的朋友们IDEA#1点子1Ifyourpartnerisgoingawayforafewdays,tellherthatyouareworriedabouthersoyouhaveor
广告你哦哦
图片1头http://120.77.37.40/yhml/xiaode/lun1.jpg图片1尾图片2头http://pic2016.ytqmx.com:82/2017/0220/35/06.jpg!960.jpg图片2尾图片3头http://pic2016.ytqmx.com:82/2017/0220/35/15.jpg!960.jpg图片3尾广告1头http://wm.video.baomih
1.8，69 知行思合一
运气动力学万维钢老师提出的名词，不愧是物理博士出身，good1idea，创意一些新名词。开文引用查理芒格的话：得到你想要的东西，最保险的办法，就是让自己配得上你想要的那个东西。接着举例《绝命毒师》Breakingbad导演文斯·吉里根接受采访说的话，引出成功的经验——运气。我们现在所处的这个社会不管是美国还是中国，大体上都是一个精英社会——人们可以靠天赋和努力去争取财富和地位，而不像历史上那样家庭
python比较字符串是否一样,Python如何确定两个字符串是否相同鲁东学子 python比较字符串是否一样
I'vetriedtounderstandwhenPythonstringsareidentical(akasharingthesamememorylocation).Howeverduringmytests,thereseemstobenoobviousexplanationwhentwostringvariablesthatareequalsharethesamememory:importsy
单线程执行器（`SingleThreadedExecutor`）来处理节点的任务课堂随想 moveit2 机器人
intmain(intargc,char**argv){rclcpp::init(argc,argv);rclcpp::NodeOptionsnode_options;node_options.automatically_declare_parameters_from_overrides(true);automove_group_node=rclcpp::Node::make_shared("mo
SPI机制我们仍未知道那天所看见的猫的名
1、SPI机制：ServiceProviderInterface：服务提供发现机制，类型IOCJavaSPI实现：ServiceLoader定义接口A；实现接口A的实现类，B和C；在/META-INF/services/下创建文件，文件名为A类的全名称，内容为B和C的类全名调用：ServiceLoaderload=ServiceLoader.load(A.class);Interatori=loa
静态常量（static const）|| 日志记录器课堂随想 moveit2 机器人
//AllsourcefilesthatuseROSloggingshoulddefineafile-specific//staticconstrclcpp::LoggernamedLOGGER,locatedatthetopofthefile//andinsidethenamespacewiththenarrowestscope(ifthereisone)staticconstrclcpp::L
np.identity()/np.eye() 听风1996
两个函数的原型为：np.identity(n,dtype=None)np.eye(N,M=None,k=0,dtype=)；np.identity只能创建方形矩阵np.eye可以创建矩形矩阵，且k值可以调节，为1的对角线的位置偏离度，0居中，1向上偏离1，2偏离2，以此类推，-1向下偏离。值绝对值过大就偏离出去了，整个矩阵就全是0了。两者在创建单位矩阵上，并无区别，两者的区别主要在接口上；np.i
Rides实现分布式锁，保障数据一致性,Redisson分布式事务处理朱杰jjj 缓存分布式
分布式环境下分布式锁有三种方式：基于数据库分布式锁基于Redis分布式锁基于zk分布式锁本帖只介绍Redis分布式锁为什么需要用到分布式锁？在单机环境下一个服务中多个线程对同一个事物或数据资源进行操作时，可以通过添加加锁方式（synchronized和lock）来解决数据一致性的问题。但是如果出现多个服务的情况下，这时候我们在通过synchronized和lock的方式来加锁会出现问题，因为多个服
py获取系统缩放比例 xu-jssy Python自动化脚本 python 前端
fromwin32.libimportwin32conimportwin32api,win32gui,win32printscaling=1.0defget_real_resolution():"""获取真实的分辨率"""hDC=win32gui.GetDC(0)wide=win32print.GetDeviceCaps(hDC,win32con.DESKTOPHORZRES)high=win32
Dubbo架构概览：服务注册与发现、远程调用、监控与管理木南曌 dubbo 架构
Dubbo是一个成熟的、高性能的、基于Java的微服务开发框架，它主要用于解决分布式系统中的服务治理问题，包括服务的注册与发现、远程过程调用（RPC）、服务监控与管理等多个关键环节。以下是Dubbo架构概览的详细介绍：服务注册与发现Dubbo的服务注册与发现机制是其核心功能之一，它依赖于注册中心来管理服务的生命周期和定位服务提供者。1.服务提供者（Provider）服务提供者是实际提供服务的节点，
git 恢复误删的远程分支 Hanfank
需求实际工作上，肯定会有不小心的时候，比如我吧，删除了本地dev分支，intellijidea提示是否将trackedbranch也删掉，结果一不小心将远程分支也删除了，接下来就是我的救赎之旅。查看reflog，找到最后一次commitidgitreflog--date=isoreflog是referencelog的意思，也就是引用log，记录HEAD在各个分支上的移动轨迹。选项--date=is
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
HALTT4LLM：大型语言模型的幻觉检测指标谢忻含Norma
HALTT4LLM：大型语言模型的幻觉检测指标haltt4llmThisprojectisanattempttocreateacommonmetrictotestLLM'sforprogressineliminatinghallucinationswhichisthemostseriouscurrentprobleminwidespreadadoptionofLLM'sformanyrealpur
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1