LLy_Alex

Hadoop安装教4程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.0

Hadoop安装教4程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.0

当开始着手实践 Hadoop 时，安装 Hadoop 往往会成为新手的一道门槛。尽管安装其实很简单，书上有写到，官方网站也有 Hadoop 安装配置教程，但由于对 Linux 环境不熟悉，书上跟官网上简略的安装步骤新手往往 Hold 不住。加上网上不少教程也甚是坑，导致新手折腾老几天愣是没装好，很是打击学习热情。

本教程由厦门大学数据库实验室出品，转载 http://www.powerxing.com/install-hadoop/。本教程适合于原生 Hadoop 2，包括 Hadoop 2.6.0, Hadoop 2.7.1 等版本，主要参考了官方安装教程，步骤详细，辅以适当说明，相信按照步骤来，都能顺利安装并运行Hadoop。另外有Hadoop安装配置简略版方便有基础的读者快速完成安装。此外，希望读者们能多去了解一些 Linux 的知识，以后出现问题时才能自行解决。

环境
本教程使用 Ubuntu 14.04 64位作为系统环境（Ubuntu 12.04 也行，32位、64位均可），请自行安装系统（可参考使用VirtualBox安装Ubuntu）。

如果用的是 CentOS/RedHat 系统，请查看相应的CentOS安装Hadoop教程_单机伪分布式配置。

本教程基于原生 Hadoop 2，在 Hadoop 2.6.0 (stable) 版本下验证通过，可适合任何 Hadoop 2.x.y 版本，例如 Hadoop 2.4.1。

Hadoop版本
Hadoop 有两个主要版本，Hadoop 1.x.y 和 Hadoop 2.x.y 系列，比较老的教材上用的可能是 0.20 这样的版本。Hadoop 2.x 版本在不断更新，本教程均可适用。如果需安装 0.20，1.2.1这样的版本，本教程也可以作为参考，主要差别在于配置项，配置请参考官网教程或其他教程。

新版是兼容旧版的，书上旧版本的代码应该能够正常运行（我自己没验证，欢迎验证反馈）。

装好了 Ubuntu 系统之后，在安装 Hadoop 前还需要做一些必备工作。

创建hadoop用户
如果你安装 Ubuntu 的时候不是用的 “hadoop” 用户，那么需要增加一个名为 hadoop 的用户。

首先按 ctrl+alt+t 打开终端窗口，输入如下命令创建新用户 :

sudo useradd -m hadoop -s /bin/bash
Shell 命令
这条命令创建了可以登陆的 hadoop 用户，并使用 /bin/bash 作为 shell。

Ubuntu终端复制粘贴快捷键
在Ubuntu终端窗口中，复制粘贴的快捷键需要加上 shift，即粘贴是 ctrl+shift+v。

接着使用如下命令设置密码，可简单设置为 hadoop，按提示输入两次密码：

sudo passwd hadoop
Shell 命令
可为 hadoop 用户增加管理员权限，方便部署，避免一些对新手来说比较棘手的权限问题：

sudo adduser hadoop sudo
Shell 命令
最后注销当前用户（点击屏幕右上角的齿轮，选择注销），在登陆界面使用刚创建的 hadoop 用户进行登陆。

更新apt
用 hadoop 用户登录后，我们先更新一下 apt，后续我们使用 apt 安装软件，如果没更新可能有一些软件安装不了。按 ctrl+alt+t 打开终端窗口，执行如下命令：

sudo apt-get update
Shell 命令
若出现如下 “Hash校验和不符” 的提示，可通过更改软件源来解决。若没有该问题，则不需要更改。

Ubuntu更新软件源时遇到Hash校验和不符的问题

点击查看：如何更改软件源

后续需要更改一些配置文件，我比较喜欢用的是 vim（vi增强版，基本用法相同），建议安装一下（如果你实在还不会用 vi/vim 的，请将后面用到 vim 的地方改为 gedit，这样可以使用文本编辑器进行修改，并且每次文件更改完成后请关闭整个 gedit 程序，否则会占用终端）：

sudo apt-get install vim
Shell 命令
安装软件时若需要确认，在提示处输入 y 即可。

通过命令行安装软件

安装SSH、配置SSH无密码登陆
集群、单节点模式都需要用到 SSH 登陆（类似于远程登陆，你可以登录某台 Linux 主机，并且在上面运行命令），Ubuntu 默认已安装了 SSH client，此外还需要安装 SSH server：

sudo apt-get install openssh-server
Shell 命令
安装后，可以使用如下命令登陆本机：

ssh localhost
Shell 命令
此时会有如下提示(SSH首次登陆提示)，输入 yes 。然后按提示输入密码 hadoop，这样就登陆到本机了。

SSH首次登陆提示

但这样登陆是需要每次输入密码的，我们需要配置成SSH无密码登陆比较方便。

首先退出刚才的 ssh，就回到了我们原先的终端窗口，然后利用 ssh-keygen 生成密钥，并将密钥加入到授权中：

exit # 退出刚才的 ssh localhost
cd ~/.ssh/ # 若没有该目录，请先执行一次ssh localhost
ssh-keygen -t rsa # 会有提示，都按回车就可以
cat ./id_rsa.pub >> ./authorized_keys # 加入授权
Shell 命令
~的含义
在 Linux 系统中，~ 代表的是用户的主文件夹，即 “/home/用户名” 这个目录，如你的用户名为 hadoop，则 ~ 就代表 “/home/hadoop/”。此外，命令中的 # 后面的文字是注释。

此时再用 ssh localhost 命令，无需输入密码就可以直接登陆了，如下图所示。

SSH无密码登录

安装Java环境
Java环境可选择 Oracle 的 JDK，或是 OpenJDK，按http://wiki.apache.org/hadoop/HadoopJavaVersions中说的，新版本在 OpenJDK 1.7 下是没问题的。为图方便，这边直接通过命令安装 OpenJDK 7。

sudo apt-get install openjdk-7-jre openjdk-7-jdk
Shell 命令
JRE和JDK的区别
JRE（Java Runtime Environment，Java运行环境），是运行 Java 所需的环境。JDK（Java Development Kit，Java软件开发工具包）即包括 JRE，还包括开发 Java 程序所需的工具和类库。

通过上述命令安装 OpenJDK，默认安装位置为 /usr/lib/jvm/java-7-openjdk-amd64（32位系统则是 /usr/lib/jvm/java-7-openjdk-i386，该路径可以通过执行 dpkg -L openjdk-7-jdk | grep '/bin/javac' 命令确定，执行后会输出一个路径，除去路径末尾的 “/bin/javac”，剩下的就是正确的路径了）。OpenJDK 安装后就可以直接使用 java、javac 等命令了。

接着需要配置一下 JAVA_HOME 环境变量，为方便，我们在 ~/.bashrc 中进行设置（扩展阅读: 设置Linux环境变量的方法和区别）：

vim ~/.bashrc
Shell 命令
在文件最前面添加如下单独一行（注意 = 号前后不能有空格），并保存：

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
Shell
如下图所示（该文件原本可能不存在，内容为空，这不影响）：

配置JAVA_HOME变量

接着还需要让该环境变量生效，执行如下代码：

source ~/.bashrc # 使变量设置生效
Shell 命令
设置好后我们来检验一下是否设置正确：

echo $JAVA_HOME # 检验变量值
java -version
$JAVA_HOME/bin/java -version # 与直接执行 java -version 一样
Shell 命令
如果设置正确的话，$JAVA_HOME/bin/java -version 会输出 java 的版本信息，且和 java -version 的输出结果一样，如下图所示：

成功配置JAVA_HOME变量

这样，Hadoop 所需的 Java 运行环境就安装好了。

安装 Hadoop 2
Hadoop 2 可以通过 http://mirror.bit.edu.cn/apache/hadoop/common/ 或者 http://mirrors.cnnic.cn/apache/hadoop/common/ 下载，本教程选择的是 2.6.0 版本，下载时请下载 hadoop-2.x.y.tar.gz 这个格式的文件，这是编译好的，另一个包含 src 的则是 Hadoop 源代码，需要进行编译才可使用。

下载时强烈建议也下载 hadoop-2.x.y.tar.gz.mds 这个文件，该文件包含了检验值可用于检查 hadoop-2.x.y.tar.gz 的完整性，否则若文件发生了损坏或下载不完整，Hadoop 将无法正常运行。

本文涉及的文件均通过浏览器下载，默认保存在 “下载” 目录中（若不是请自行更改 tar 命令的相应目录）。另外，如果你用的不是 2.6.0 版本，则将所有命令中出现的 2.6.0 更改为你所使用的版本。

cat ~/下载/hadoop-2.6.0.tar.gz.mds | grep 'MD5' # 列出md5检验值
# head -n 6 ~/下载/hadoop-2.7.1.tar.gz.mds # 2.7.1版本格式变了，可以用这种方式输出
md5sum ~/下载/hadoop-2.6.0.tar.gz | tr "a-z" "A-Z" # 计算md5值，并转化为大写，方便比较
Shell 命令
若文件不完整则这两个值一般差别很大，可以简单对比下前几个字符跟后几个字符是否相等即可，如下图所示，如果两个值不一样，请务必重新下载。

检验文件完整性

我们选择将 Hadoop 安装至 /usr/local/ 中：

sudo tar -zxf ~/下载/hadoop-2.6.0.tar.gz -C /usr/local # 解压到/usr/local中
cd /usr/local/
sudo mv ./hadoop-2.6.0/ ./hadoop # 将文件夹名改为hadoop
sudo chown -R hadoop:hadoop ./hadoop # 修改文件权限
Shell 命令
Hadoop 解压后即可使用。输入如下命令来检查 Hadoop 是否可用，成功则会显示 Hadoop 版本信息：

cd /usr/local/hadoop
./bin/hadoop version
Shell 命令
相对路径与绝对路径的区别
请务必注意命令中的相对路径与绝对路径，本文后续出现的 ./bin/...，./etc/... 等包含 ./ 的路径，均为相对路径，以 /usr/local/hadoop 为当前目录。例如在 /usr/local/hadoop 目录中执行 ./bin/hadoop version 等同于执行 /usr/local/hadoop/bin/hadoop version。可以将相对路径改成绝对路径来执行，但如果你是在主文件夹 ~ 中执行 ./bin/hadoop version，执行的会是 /home/hadoop/bin/hadoop version，就不是我们所想要的了。

Hadoop单机配置(非分布式)
Hadoop 默认模式为非分布式模式，无需进行其他配置即可运行。非分布式即单 Java 进程，方便进行调试。

现在我们可以执行例子来感受下 Hadoop 的运行。Hadoop 附带了丰富的例子（运行 ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar 可以看到所有例子），包括 wordcount、terasort、join、grep 等。

在此我们选择运行 grep 例子，我们将 input 文件夹中的所有文件作为输入，筛选当中符合正则表达式 dfs[a-z.]+ 的单词并统计出现的次数，最后输出结果到 output 文件夹中。

cd /usr/local/hadoop
mkdir ./input
cp ./etc/hadoop/*.xml ./input # 将配置文件作为输入文件
./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep ./input ./output 'dfs[a-z.]+'
cat ./output/* # 查看运行结果
Shell 命令
执行成功后如下所示，输出了作业的相关信息，输出的结果是符合正则的单词 dfsadmin 出现了1次

Hadoop单机模式运行grep的输出结果

注意，Hadoop 默认不会覆盖结果文件，因此再次运行上面实例会提示出错，需要先将 ./output 删除。

rm -r ./output
Shell 命令
Hadoop伪分布式配置
Hadoop 可以在单节点上以伪分布式的方式运行，Hadoop 进程以分离的 Java 进程来运行，节点既作为 NameNode 也作为 DataNode，同时，读取的是 HDFS 中的文件。

Hadoop 的配置文件位于 /usr/local/hadoop/etc/hadoop/ 中，伪分布式需要修改2个配置文件 core-site.xml 和 hdfs-site.xml 。Hadoop的配置文件是 xml 格式，每个配置以声明 property 的 name 和 value 的方式来实现。

修改配置文件 core-site.xml (通过 gedit 编辑会比较方便: gedit ./etc/hadoop/core-site.xml)，将当中的

XML
修改为下面配置：

hadoop.tmp.dir
file:/usr/local/hadoop/tmp
Abase for other temporary directories.

fs.defaultFS
hdfs://localhost:9000

XML
同样的，修改配置文件 hdfs-site.xml：

dfs.replication
1

dfs.namenode.name.dir
file:/usr/local/hadoop/tmp/dfs/name

dfs.datanode.data.dir
file:/usr/local/hadoop/tmp/dfs/data

XML
关于Hadoop配置项的一点说明
虽然只需要配置 fs.defaultFS 和 dfs.replication 就可以运行（官方教程如此），不过若没有配置 hadoop.tmp.dir 参数，则默认使用的临时目录为 /tmp/hadoo-hadoop，而这个目录在重启时有可能被系统清理掉，导致必须重新执行 format 才行。所以我们进行了设置，同时也指定 dfs.namenode.name.dir 和 dfs.datanode.data.dir，否则在接下来的步骤中可能会出错。

配置完成后，执行 NameNode 的格式化:

./bin/hdfs namenode -format
Shell 命令
成功的话，会看到 “successfully formatted” 和 “Exitting with status 0” 的提示，若为 “Exitting with status 1” 则是出错。

执行namenode格式化

注意
在这一步时若提示 Error: JAVA_HOME is not set and could not be found. 的错误，则需要在文件 ./etc/hadoop/hadoop-env.sh 中设置 JAVA_HOME 变量，即在该文件中找到：
export JAVA_HOME=${JAVA_HOME}
将这一行改为JAVA安装位置：
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
再重新尝试格式化即可。

接着开启 NameNode 和 DataNode 守护进程。

./sbin/start-dfs.sh
Shell 命令
若出现如下SSH提示，输入yes即可。

启动Hadoop时的SSH提示

启动时可能会出现如下 WARN 提示：WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-java classes where applicable WARN 提示可以忽略，并不会影响正常使用。

启动完成后，可以通过命令 jps 来判断是否成功启动，若成功启动则会列出如下进程: “NameNode”、”DataNode” 和 “SecondaryNameNode”（如果 SecondaryNameNode 没有启动，请运行 sbin/stop-dfs.sh 关闭进程，然后再次尝试启动尝试）。如果没有 NameNode 或 DataNode ，那就是配置不成功，请仔细检查之前步骤，或通过查看启动日志排查原因。

通过jps查看启动的Hadoop进程

一般情况下，若是 DataNode 没有启动，可尝试如下的方法（注意这会删除 HDFS 中原有的所有数据，如果原有的数据很重要请不要这样做）：

./sbin/stop-dfs.sh # 关闭
rm -r ./tmp 删除 tmp 文件，注意这会删除 HDFS 中原有的所有数据
./bin/hdfs namenode -format 重新格式化 NameNode
./sbin/start-dfs.sh # 重启
Shell 命令
Hadoop无法正常启动的解决方法
一般可以查看启动日志来排查原因，注意几点：

启动时会提示形如 “DBLab-XMU: starting namenode, logging to /usr/local/hadoop/logs/hadoop-hadoop-namenode-DBLab-XMU.out”，其中 DBLab-XMU 对应你的机器名，但其实启动日志信息是记录在 /usr/local/hadoop/logs/hadoop-hadoop-namenode-DBLab-XMU.log 中，所以应该查看这个后缀为 .log 的文件；
每一次的启动日志都是追加在日志文件之后，所以得拉到最后面看，对比下记录的时间就知道了。
一般出错的提示在最后面，通常是写着 Fatal、Error、Warning 或者 Java Exception 的地方。
可以在网上搜索一下出错信息，看能否找到一些相关的解决方法。
此外，若是 DataNode 没有启动，可尝试如下的方法（注意这会删除 HDFS 中原有的所有数据，如果原有的数据很重要请不要这样做）：

# 针对 DataNode 没法启动的解决方法
./sbin/stop-dfs.sh # 关闭
rm -r ./tmp # 删除 tmp 文件，注意这会删除 HDFS 中原有的所有数据
./bin/hdfs namenode -format # 重新格式化 NameNode
./sbin/start-dfs.sh # 重启
Shell 命令
成功启动后，可以访问 Web 界面 http://localhost:50070 查看 NameNode 和 Datanode 信息，还可以在线查看 HDFS 中的文件。

Hadoop的Web界面

运行Hadoop伪分布式实例
上面的单机模式，grep 例子读取的是本地数据，伪分布式读取的则是 HDFS 上的数据。要使用 HDFS，首先需要在 HDFS 中创建用户目录：

./bin/hdfs dfs -mkdir -p /user/hadoop
Shell 命令
接着将 ./etc/hadoop 中的 xml 文件作为输入文件复制到分布式文件系统中，即将 /usr/local/hadoop/etc/hadoop 复制到分布式文件系统中的 /user/hadoop/input 中。我们使用的是 hadoop 用户，并且已创建相应的用户目录 /user/hadoop ，因此在命令中就可以使用相对路径如 input，其对应的绝对路径就是 /user/hadoop/input:

./bin/hdfs dfs -mkdir input
./bin/hdfs dfs -put ./etc/hadoop/*.xml input
Shell 命令
复制完成后，可以通过如下命令查看文件列表：

./bin/hdfs dfs -ls input
Shell 命令
伪分布式运行 MapReduce 作业的方式跟单机模式相同，区别在于伪分布式读取的是HDFS中的文件（可以将单机步骤中创建的本地 input 文件夹，输出结果 output 文件夹都删掉来验证这一点）。

./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep input output 'dfs[a-z.]+'
Shell 命令
查看运行结果的命令（查看的是位于 HDFS 中的输出结果）：

./bin/hdfs dfs -cat output/*
Shell 命令
结果如下，注意到刚才我们已经更改了配置文件，所以运行结果不同。

Hadoop伪分布式运行grep结果

我们也可以将运行结果取回到本地：

rm -r ./output # 先删除本地的 output 文件夹（如果存在）
./bin/hdfs dfs -get output ./output # 将 HDFS 上的 output 文件夹拷贝到本机
cat ./output/*
Shell 命令
Hadoop 运行程序时，输出目录不能存在，否则会提示错误 “org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://localhost:9000/user/hadoop/output already exists” ，因此若要再次执行，需要执行如下命令删除 output 文件夹:

./bin/hdfs dfs -rm -r output # 删除 output 文件夹
Shell 命令
运行程序时，输出目录不能存在
运行 Hadoop 程序时，为了防止覆盖结果，程序指定的输出目录（如 output）不能存在，否则会提示错误，因此运行前需要先删除输出目录。在实际开发应用程序时，可考虑在程序中加上如下代码，能在每次运行时自动删除输出目录，避免繁琐的命令行操作：

Configuration conf = new Configuration();
Job job = new Job(conf);

/* 删除输出目录 */
Path outputPath = new Path(args[1]);
outputPath.getFileSystem(conf).delete(outputPath, true);
Java
若要关闭 Hadoop，则运行

./sbin/stop-dfs.sh
Shell 命令
注意
下次启动 hadoop 时，无需进行 NameNode 的初始化，只需要运行 ./sbin/start-dfs.sh 就可以！

启动YARN
（伪分布式不启动 YARN 也可以，一般不会影响程序执行）

有的读者可能会疑惑，怎么启动 Hadoop 后，见不到书上所说的 JobTracker 和 TaskTracker，这是因为新版的 Hadoop 使用了新的 MapReduce 框架（MapReduce V2，也称为 YARN，Yet Another Resource Negotiator）。

YARN 是从 MapReduce 中分离出来的，负责资源管理与任务调度。YARN 运行于 MapReduce 之上，提供了高可用性、高扩展性，YARN 的更多介绍在此不展开，有兴趣的可查阅相关资料。

上述通过 ./sbin/start-dfs.sh 启动 Hadoop，仅仅是启动了 MapReduce 环境，我们可以启动 YARN ，让 YARN 来负责资源管理与任务调度。

首先修改配置文件 mapred-site.xml，这边需要先进行重命名：

mv ./etc/hadoop/mapred-site.xml.template ./etc/hadoop/mapred-site.xml
Shell 命令
然后再进行编辑，同样使用 gedit 编辑会比较方便些 gedit ./etc/hadoop/mapred-site.xml ：

mapreduce.framework.name
yarn

XML
接着修改配置文件 yarn-site.xml：

yarn.nodemanager.aux-services
mapreduce_shuffle

XML
然后就可以启动 YARN 了（需要先执行过 ./sbin/start-dfs.sh）：

./sbin/start-yarn.sh # 启动YARN
./sbin/mr-jobhistory-daemon.sh start historyserver # 开启历史服务器，才能在Web中查看任务运行情况
Shell 命令
开启后通过 jps 查看，可以看到多了 NodeManager 和 ResourceManager 两个后台进程，如下图所示。

开启YARN

启动 YARN 之后，运行实例的方法还是一样的，仅仅是资源管理方式、任务调度不同。观察日志信息可以发现，不启用 YARN 时，是 “mapred.LocalJobRunner” 在跑任务，启用 YARN 之后，是 “mapred.YARNRunner” 在跑任务。启动 YARN 有个好处是可以通过 Web 界面查看任务的运行情况：http://localhost:8088/cluster，如下图所示。

开启YARN后可以查看任务运行信息

但 YARN 主要是为集群提供更好的资源管理与任务调度，然而这在单机上体现不出价值，反而会使程序跑得稍慢些。因此在单机上是否开启 YARN 就看实际情况了。

不启动 YARN 需重命名 mapred-site.xml
如果不想启动 YARN，务必把配置文件 mapred-site.xml 重命名，改成 mapred-site.xml.template，需要用时改回来就行。否则在该配置文件存在，而未开启 YARN 的情况下，运行程序会提示 “Retrying connect to server: 0.0.0.0/0.0.0.0:8032” 的错误，这也是为何该配置文件初始文件名为 mapred-site.xml.template。

同样的，关闭 YARN 的脚本如下：

./sbin/stop-yarn.sh
./sbin/mr-jobhistory-daemon.sh stop historyserver
Shell 命令
自此，你已经掌握 Hadoop 的配置和基本使用了。

附加教程: 配置PATH环境变量
在这里额外讲一下 PATH 这个环境变量（可执行 echo $PATH 查看，当中包含了多个目录）。例如我们在主文件夹 ~ 中执行 ls 这个命令时，实际执行的是 /bin/ls 这个程序，而不是 ~/ls 这个程序。系统是根据 PATH 这个环境变量中包含的目录位置，逐一进行查找，直至在这些目录位置下找到匹配的程序（若没有匹配的则提示该命令不存在）。

上面的教程中，我们都是先进入到 /usr/local/hadoop 目录中，再执行 sbin/hadoop，实际上等同于运行 /usr/local/hadoop/sbin/hadoop。我们可以将 Hadoop 命令的相关目录加入到 PATH 环境变量中，这样就可以直接通过 start-dfs.sh 开启 Hadoop，也可以直接通过 hdfs 访问 HDFS 的内容，方便平时的操作。

同样我们选择在 ~/.bashrc 中进行设置（vim ~/.bashrc，与 JAVA_HOME 的设置相似），在文件最前面加入如下单独一行:

export PATH=$PATH:/usr/local/hadoop/sbin:/usr/local/hadoop/bin
添加后执行 source ~/.bashrc 使设置生效，生效后，在任意目录中，都可以直接使用 hdfs 等命令了，读者不妨现在就执行 hdfs dfs -ls input 查看 HDFS 文件试试看。

大数据教材推荐
大数据入门教材哪本好？必须强推我的研究生导师林子雨老师编著的《大数据技术原理与应用》，该教程是针对高校学生打造的入门级教材，目前已被多所高校作为大数据课程指定教材。厦大数据库实验室为该教材倾注了许多努力，精心编写了许多配套学习博文、配套上机习题等。博主也参与了该教材的编写等工作，见证了该教程的从无到有，所以绝不是瞎打广告，欢迎了解！

林子雨编著《大数据技术原理与应用》官网
林子雨主讲入门级大数据在线课程: 喜欢通过视频的方式学习？那就不要错过
《大数据技术原理与应用》教材配套学习指南: 不仅有教材疑难点解答，还有相关拓展学习资料
《大数据技术原理与应用》教材配套上机练习题目: 实践才是硬道理
安装Hadoop集群
在平时的学习中，我们使用伪分布式就足够了。如果需要安装 Hadoop 集群，请查看Hadoop集群安装配置教程。

相关教程
使用Eclipse编译运行MapReduce程序: 使用 Eclipse 可以方便的开发、运行 MapReduce 程序，还可以直接管理 HDFS 中的文件。
使用命令行编译打包运行自己的MapReduce程序: 有时候需要直接通过命令来编译、打包 MapReduce 程序。
参考资料
http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html
http://www.cnblogs.com/xia520pi/archive/2012/05/16/2503949.html
http://www.micmiu.com/bigdata/hadoop/hadoop-2x-ubuntu-build/
http://www.powerxing.com/install-hadoop/
笔记Hadoop
相关文章

Hadoop集群安装配置教程_Hadoop2.6.0_Ubuntu/CentOS
使用命令行编译打包运行自己的MapReduce程序 Hadoop2.6.0
使用Eclipse编译运行MapReduce程序 Hadoop2.6.0_Ubuntu/CentOS
Hadoop-in-Practice第四章MapReduce-Join代码运行问题
Hadoop安装配置简略教程
Hadoop安装教程_单机/伪分布式配置_CentOS6.4/Hadoop2.6.0
最新最早最热
171条评论

flhami
博主好人，超赞的教程！
19小时前回复顶转发

江哥改名字啦
这是我见过的最良心的教程，感谢。
2月25日回复顶转发

戴德陶之御林军
写的很好，超赞的！没有bug，一次过
2月25日回复顶转发

解梦
学长你好遇到这个问题怎么解决
./bin/hdfs namenode -format
Could not find or load main class org.apache.hadoop.hdfs.server.namenode.NameNode
2月23日回复顶转发

给力星
可尝试在 ~/.bashrc 中加入 Hadoop 环境变量：

# Hadoop Environment Variables
export HADOOP_PREFIX=/usr/local/hadoop
export HADOOP_HOME=/usr/local/hadoop
export HADOOP_INSTALL=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
2月24日回复顶转发

赵锋杰
你好，我在配置伪分布式时，出现这样的问题。
noexecstack'.: ssh: Could not resolve hostname noexecstack'.: Name or service not known
OpenJDK: ssh: Could not resolve hostname openjdk: Name or service not known
warning:: ssh: Could not resolve hostname warning:: Name or service not known
Server: ssh: Could not resolve hostname server: Name or service not known
VM: ssh: Could not resolve hostname vm: Name or service not known
disabled: ssh: Could not resolve hostname disabled: Name or service not known
You: ssh: Could not resolve hostname you: Name or service not known
VM: ssh: Could not resolve hostname vm: Name or service not known
you: ssh: Could not resolve hostname you: Name or service not known
will: ssh: Could not resolve hostname will: Name or service not known
The: ssh: Could not resolve hostname the: Name or service not known
might: ssh: Could not resolve hostname might: Name or service not known
stack: ssh: Could not resolve hostname stack: Name or service not known
library: ssh: Could not resolve hostname library: Name or service not known
stack: ssh: Could not resolve hostname stack: Name or service not known
which: ssh: Could not resolve hostname which: Name or service not known
recommended: ssh: Could not resolve hostname recommended: Name or service not known
the: ssh: Could not resolve hostname the: Name or service not known
have: ssh: Could not resolve hostname have: Name or service not known
have: ssh: Could not resolve hostname have: Name or service not known
the: ssh: Could not resolve hostname the: Name or service not known
guard: ssh: Could not resolve hostname guard: Name or service not known
it: ssh: Could not resolve hostname it: No address associated with hostname
loaded: ssh: Could not resolve hostname loaded: Name or service not known
fix: ssh: Could not resolve hostname fix: Name or service not known
library: ssh: Could not resolve hostname library: Name or service not known
try: ssh: Could not resolve hostname try: Name or service not known
fix: ssh: Could not resolve hostname fix: Name or service not known
highly: ssh: Could not resolve hostname highly: Name or service not known
that: ssh: Could not resolve hostname that: Name or service not known
with: ssh: Could not resolve hostname with: Name or service not known
link: ssh: Could not resolve hostname link: No address associated with hostname
'execstack: ssh: Could not resolve hostname 'execstack: Name or service not known

请问如何解决，谢谢
2月19日回复顶转发

给力星
修改 /etc/hosts 文件。假设你的主机名是 machine （执行命令 hostname 可以查看到），那么增加如下记录：
127.0.0.1 machine
2月19日回复顶转发

赵锋杰
回复给力星: 127.0.0.1 localhost
127.0.1.1 ubuntu
127.0.0.1 ubuntu

# The following lines are desirable for IPv6 capable hosts
::1 ip6-localhost ip6-loopback
fe00::0 ip6-localnet
ff00::0 ip6-mcastprefix
ff02::1 ip6-allnodes
ff02::2 ip6-allrouters

请问是这样吗？我运行了还是没有解决
2月22日回复顶转发

给力星
回复赵锋杰: 你主机名 ubuntu ？一个主机名只能对应一条 ip 地址，应该是（删掉 127.0.1.1 ubuntu）：
127.0.0.1 ubuntu
2月22日回复顶转发

赵锋杰
回复给力星: 是ubuntu.删了还是不行
2月22日回复顶转发

给力星
回复赵锋杰: 以前我也有遇到这个问题，印象中，Ubuntu系统是需要改 hosts 文件， CentOS 系统是还要加上 HADOOP_COMMON_LIB_NATIVE_DIR 等环境变量。如果这样还不能解决，那我就不清楚了。
2月22日回复顶转发

Alex
你好，按照你的教程配置，出现以下错误，请指点，谢谢！
HOSTNAME=Master:/usr/local/hadoop$ sbin/start-dfs.sh
Starting namenodes on [Master]
The authenticity of host 'master (172.16.30.203)' can't be established.
ECDSA key fingerprint is f1:ed:93:09:8d:ca:e8:b6:b1:8c:13:25:eb:fa:f5:9b.
Are you sure you want to continue connecting (yes/no)? yes
Master: Warning: Permanently added 'master,172.16.30.203' (ECDSA) to the list of known hosts.
Master: starting namenode, logging to /usr/local/hadoop/logs/hadoop-hadoop-namenode-NWTWORKING=yes
Master: Error: Could not find or load main class HOSTNAME=Master.log
Slave1: /usr/local/hadoop/sbin/hadoop-daemon.sh: 第 69 行: [: HOSTNAME=Slave1.out: 期待整数表达式
Slave1: starting datanode, logging to /usr/local/hadoop/logs/hadoop-hadoop-datanode-NETWORKING=yes
Slave1: 错误: 找不到或无法加载主类 HOSTNAME=Slave1.log
Starting secondary namenodes [Master]
Master: starting secondarynamenode, logging to /usr/local/hadoop/logs/hadoop-hadoop-secondarynamenode-NWTWORKING=yes
Master: Error: Could not find or load main class HOSTNAME=Master.log

HOSTNAME=Master: /usr/local/hadoophadoop@NWTWORKING=yes
HOSTNAME=Master:/usr/local/hadoop$ sbin/start-yarn.sh
starting yarn daemons
starting resourcemanager, logging to /usr/local/hadoop/logs/yarn-hadoop-resourcemanager-NWTWORKING=yes
Error: Could not find or load main class HOSTNAME=Master.log
Slave1: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-hadoop-nodemanager-NETWORKING=yes
Slave1: 错误: 找不到或无法加载主类 HOSTNAME=Slave1.log
2月19日回复顶转发

给力星
你用的是 CentOS 6.x 系统？再检查下 /etc/sysconfig/network 这个文件，至少有一个地方拼写错误，是 NETWORKING 不是 NWTWORKING。
2月19日回复顶转发

Alex
回复给力星: 您好，ubuntu server14.04和ubuntu kylin14.02我都试过了，一样的错误；另外，您提到的那处错误我也已经修改过，记过也是一样的，或者我再重新搭建一次试一试；对了，我是在一台ESXi服务器上建立的两台VM来做测试的
2月23日回复顶转发

Alex
回复给力星: 你好，其实我是在配置全分布式；已经按照你分享的SOP完成整个配置，非常感谢！
2月25日回复顶转发

kenneth
写得很详细
2月16日回复顶转发

一个好人
给力星，能不能留一个qq的联系方式？我是做数据挖掘的，希望能和你交个朋友。
2月4日回复顶转发

给力星
不好意思，以后的就业方向是前端，今后应该不太会接触数据挖掘了，可能给不了什么帮助~
2月4日回复顶转发

昶
还有一个 shell 命令的样式非常漂亮是用了什么插件吗
1月24日回复顶转发

给力星
代码高亮: Google Code Prettify；高亮主题: google-prettify-monokai-theme，显示“shell 命令” 还有复制代码的功能是自己写的。
1月24日回复顶转发

昶
博主，想问一下博客文章的阅读量还有评论数是如何获取的，访问量是通过数据库建立浏览量每次访问加一这样实现的吗
1月24日回复顶转发

给力星
网站用的是 WordPress，评论数是自身功能，另外可以安装相应的插件获取阅读数，阅读数实现的话就如你所示。
1月24日回复顶转发

昶
回复给力星: 非常感谢
2月13日回复顶转发

袁玉
必须得点赞！！
1月22日回复顶转发

zhiye
教程太好了，必须给你点个赞
1月16日回复顶转发

给力星
谢谢支持~
1月17日回复顶转发

zhiye
回复给力星: 你这个网站是怎么弄的能出篇教程吗，赶脚不错；还有看了你其他的文章也都很不错啊，再点个赞
1月18日回复顶转发

给力星
回复 zhiye: WordPress搭建的，自己写的主题，也有很多免费、好看的主题可以直接用就是了。
1月18日回复顶转发

zhiye
回复给力星: 赞！已经收藏了，会经常光顾的，以后再有什么问题希望不吝赐教哈；ps：回复还蛮快的
1月18日回复顶转发

VELONICA_CECI
学长你好~ 我按照你的教程安装配置好之后hadoop能跑起来，但是当我下了mahout0.11，配置完成后hadoop就无法正常启动了，改了好几次~/.bashrc 都没有用，输入mahout 命令还是能运行起来：MAHOUT_LOCAL is not set; adding HADOOP_CONF_DIR to classpath.
Running on hadoop, using /usr/local/hadoop/bin/hadoop and HADOOP_CONF_DIR=/usr/local/hadoop/conf
MAHOUT-JOB: /usr/local/mahout/mahout-examples-0.11.1-job.jar

但是，启动hadoop就是如下错误：Incorrect configuration: namenode address dfs.namenode.servicerpc-address or dfs.namenode.rpc-address is not configured.
Starting namenodes on []
Error: Cannot find configuration directory: /usr/local/hadoop/conf
Error: Cannot find configuration directory: /usr/local/hadoop/conf
Starting secondary namenodes [0.0.0.0]
Error: Cannot find configuration directory: /usr/local/hadoop/conf

搜了好几天，也没能解决问题，很困惑，希望你有时间能与我交流交流
1月14日回复顶转发

给力星
单从启动信息能发现一个问题：HADOOP_CONF_DIR 的配置有错。
Hadoop 配置文件的目录应为 /usr/local/hadoop/etc/hadoop
1月14日回复顶转发

VELONICA_CECI
回复给力星: 我路径改了 /usr/local/hadoop/etc/hadoop之后：
Incorrect configuration: namenode address dfs.namenode.servicerpc-address or dfs.namenode.rpc-address is not configured.
Starting namenodes on [2016-01-13 20:10:55,208 WARN [main] util.NativeCodeLoader (NativeCodeLoader.java:(62)) - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable]
Error: Cannot find configuration directory: /usr/local/hadoop/etc/hadoop/conf
Error: Cannot find configuration directory: /usr/local/hadoop/etc/hadoop/conf
Starting secondary namenodes [2016-01-13 20:10:58,304 WARN [main] util.NativeCodeLoader (NativeCodeLoader.java:(62)) - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
0.0.0.0]
Error: Cannot find configuration directory: /usr/local/hadoop/etc/hadoop/conf
1月14日回复顶转发

给力星
回复 VELONICA_CECI: 要学会看启动信息，Error: Cannot find configuration directory: /usr/local/hadoop/etc/hadoop/conf
这条信息已经说得很清楚了，读取的目录仍然是错的，后面有个 conf。
实在不知道哪里改的话，就建个符号链接尝试应付一下吧：
ln -s /usr/local/hadoop/etc/hadoop /usr/local/hadoop/etc/hadoop/conf
1月14日回复顶转发

VELONICA_CECI
回复给力星: 谢谢学长~ 问题解决了，我把配置环境改成正确的路径了。
1月14日回复顶转发

Blue
很不错的Hadoop教程，按照步骤来很顺利的就装好了。
1月6日回复顶转发

ss
真的是最好的教程
1月4日回复顶转发

peter
我见过的最给力的教程，感谢给力兄，对我帮助很大
2015年12月23日回复顶转发

xuanyeyu
我为什么总是提示找不到.bin/hdfs :not found
2015年12月21日回复顶转发

给力星
1. 是 ./bin/hdfs 2. 注意区分相对路径与绝对路径，教程中类似 ./bin/hdfs 、 ./etc/hadoop 的路径均是相对路径，需要在 /usr/local/hadoop 目录下才正确（文章中有说明这一点的，请仔细阅读）。
2015年12月21日回复顶转发

wantrd
楼主，你这个hadoop2.6 伪分布配好后为什么只有 SecondaryNameNode DataNode DataNode 没有 JobTracker 和 TaskTracker 是版本问题吗？还有，我配好了伪分布后，使用eclipse做开发环境，为什么在web上监控不到我的job，而且我观察控制台有“ mapred.Task: Task 'attempt_local1469050249_0001_m_000000_0' done.” 这样的语句输出，这个“local”感觉是本地模式，我是按照 Run Configurations 方式运行的。这样运行算是伪分布吗？谢谢
2015年12月13日回复顶转发

给力星
新版 Hadoop 使用了 MapReduce V2 架构，也叫做 YARN，跟以往的不一样，你可以自己去了解下。要在 Web 上监控 job，需要开启 YARN 和 historyserver。伪分布式是只有一台机器，同时运行 namenode 跟 datanode ，并且访问的是 HDFS 上的文件。
2015年12月17日回复顶转发

十月的阳光
楼主你好，我头天按照你的教程一步一步走下去，都没有问题，但是我第二天按照您的另外一个教程就是配置ecilipse那个操作，就出现了不能连接到//:localhost：9000的错误，然后我在命令行启动Hadoop也出现这个错误，也不能登录到http://localhost:50070，后来一直百度，感觉也没改什么，又出现这样的hadoop@ydc-VirtualBox:/usr/local/hadoop$ ./sbin/start-dfs.shStarting namenodes on [localhost]
localhost: namenode running as process 11293. Stop it first.
localhost: starting datanode, logging to /usr/local/hadoop/logs/hadoop-hadoop-datanode-ydc-VirtualBox.out
Starting secondary namenodes [0.0.0.0]
0.0.0.0: secondarynamenode running as process 11587. Stop it first.
hadoop@ydc-VirtualBox:/usr/local/hadoop$ jps
12106 DataNode
11293 NameNode
10588 org.eclipse.equinox.launcher_1.3.0.dist.jar
12366 Jps
11587 SecondaryNameNode
hadoop@ydc-VirtualBox:/usr/local/hadoop$
不知道怎么办，故请教您，忘您不吝赐教
2015年12月12日回复顶转发

给力星
查看一下 /usr/local/hadoop/logs/hadoop-hadoop-datanode-ydc-VirtualBox.log 这个文件，看文件最后面有出现Fatal、Error 或者 Java Exception 的地方，可以知道是什么原因。可以尝试删除 /usr/local/hadoop/tmp 文件夹，重新执行一次 ./bin/hdfs namenode -format ，然后再启动实时。
2015年12月12日回复顶转发

ggjjl1
你好，我在centos6.5(64位)上安装的hadoop2.6.2集群，运行以下命令出现问题：

[root@host02 ~]# hadoop fs -put a.txt /test
Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCrc32.nativeComputeChunkedSumsByteArray(II[BI[BIILjava/lang/String;JZ)V
at org.apache.hadoop.util.NativeCrc32.nativeComputeChunkedSumsByteArray(Native Method)
at org.apache.hadoop.util.NativeCrc32.calculateChunkedSumsByteArray(NativeCrc32.java:86)
at org.apache.hadoop.util.DataChecksum.calculateChunkedSums(DataChecksum.java:430)
at org.apache.hadoop.fs.FSOutputSummer.writeChecksumChunks(FSOutputSummer.java:202)
at org.apache.hadoop.fs.FSOutputSummer.flushBuffer(FSOutputSummer.java:163)
at org.apache.hadoop.fs.FSOutputSummer.flushBuffer(FSOutputSummer.java:144)
at org.apache.hadoop.hdfs.DFSOutputStream.close(DFSOutputStream.java:2217)
at org.apache.hadoop.fs.FSDataOutputStream$PositionCache.close(FSDataOutputStream.java:72)
at org.apache.hadoop.fs.FSDataOutputStream.close(FSDataOutputStream.java:106)
at org.apache.hadoop.io.IOUtils.copyBytes(IOUtils.java:54)
at org.apache.hadoop.io.IOUtils.copyBytes(IOUtils.java:112)
at org.apache.hadoop.fs.shell.CommandWithDestination$TargetFileSystem.writeStreamToFile(CommandWithDestination.java:466)
at org.apache.hadoop.fs.shell.CommandWithDestination.copyStreamToTarget(CommandWithDestination.java:391)
at org.apache.hadoop.fs.shell.CommandWithDestination.copyFileToTarget(CommandWithDestination.java:328)
at org.apache.hadoop.fs.shell.CommandWithDestination.processPath(CommandWithDestination.java:263)
at org.apache.hadoop.fs.shell.CommandWithDestination.processPath(CommandWithDestination.java:248)
at org.apache.hadoop.fs.shell.Command.processPaths(Command.java:306)
at org.apache.hadoop.fs.shell.Command.processPathArgument(Command.java:278)
at org.apache.hadoop.fs.shell.CommandWithDestination.processPathArgument(CommandWithDestination.java:243)
at org.apache.hadoop.fs.shell.Command.processArgument(Command.java:260)
at org.apache.hadoop.fs.shell.Command.processArguments(Command.java:244)
at org.apache.hadoop.fs.shell.CommandWithDestination.processArguments(CommandWithDestination.java:220)
at org.apache.hadoop.fs.shell.CopyCommands$Put.processArguments(CopyCommands.java:267)
at org.apache.hadoop.fs.shell.Command.processRawArguments(Command.java:190)
at org.apache.hadoop.fs.shell.Command.run(Command.java:154)
at org.apache.hadoop.fs.FsShell.run(FsShell.java:287)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:84)
at org.apache.hadoop.fs.FsShell.main(FsShell.java:340)

请问，这怎么解决？
另外我在ubuntu 14.04 64位上安装hadoop 2.6.2伪分布式版，却没有出现这样的问题。
2015年12月4日回复顶转发

给力星
这个好像是JDK的问题，你可以网上搜索看看，我也不是很清楚，例如 http://tieba.baidu.com/p/518443482 16楼提到的原因与解决方法。
2015年12月4日回复顶转发

zestinc
教程非常给力，thanks
2015年12月4日回复顶转发

SXT加油
运行jps命令，datanode没有啊，你这是只需要配置本身自己电脑就够了吗
2015年12月3日回复顶转发

给力星
是的，这是伪分布式配置，是在单机上运行的。建议再检查一下步骤。
2015年12月3日回复顶转发

cx
回复给力星: 这是说伪分布式的设置中，运行jps命令，没有出现datanode是正常的吗
2015年12月13日回复顶转发

给力星
回复 cx: 是只需要配置本身自己的电脑。在伪分布式运行模式下，没有出现 datanode 说明配置有错，程序是跑不起来的。
2015年12月15日回复顶转发

陈小予
过来踩踩
2015年11月30日回复顶转发

gxz
hadoop@ubuntu:/usr/local/hadoop$ bin/hdfs dfs -ls input
OpenJDK Client VM warning: You have loaded library /usr/local/hadoop/lib/native/libhadoop.so.1.0.0 which might have disabled stack guard. The VM will try to fix the stack guard now.
It's highly recommended that you fix the library with 'execstack -c ', or link it with '-z noexecstack'.
15/11/28 18:51:54 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
虽然楼主说警报并影响正常使用，但是我想查看hdfs中的文件，它却只显示这个警报，而并没有显示给我hdfs中有些什么，我该怎么办呢？ [email protected]
2015年11月29日回复顶转发

gxz
hadoop@ubuntu:/usr/local/hadoop$ bin/hdfs dfs -cat output/*
OpenJDK Client VM warning: You have loaded library /usr/local/hadoop/lib/native/libhadoop.so.1.0.0 which might have disabled stack guard. The VM will try to fix the stack guard now.
It's highly recommended that you fix the library with 'execstack -c ', or link it with '-z noexecstack'.
15/11/28 18:58:46 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
输入这个cat命令也是一样，它只显示警报，而并不显示 cat出来的结果。此时我的心是崩溃的。
2015年11月29日回复顶转发

gxz
回复 gxz: hadoop@ubuntu:/usr/local/hadoop/etc/hadoop$ hdfs dfs -rm -r /user/hadoop/output
Exception in thread "main" java.lang.RuntimeException: core-site.xml not found
at org.apache.hadoop.conf.Configuration.loadResource(Configuration.java:2566)
at org.apache.hadoop.conf.Configuration.loadResources(Configuration.java:2492)
at org.apache.hadoop.conf.Configuration.getProps(Configuration.java:2405)
at org.apache.hadoop.conf.Configuration.set(Configuration.java:1143)
at org.apache.hadoop.conf.Configuration.set(Configuration.java:1115)
at org.apache.hadoop.conf.Configuration.setBoolean(Configuration.java:1451)
at org.apache.hadoop.util.GenericOptionsParser.processGeneralOptions(GenericOptionsParser.java:321)
at org.apache.hadoop.util.GenericOptionsParser.parseGeneralOptions(GenericOptionsParser.java:487)
at org.apache.hadoop.util.GenericOptionsParser.(GenericOptionsParser.java:170)
at org.apache.hadoop.util.GenericOptionsParser.(GenericOptionsParser.java:153)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:64)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:84)
at org.apache.hadoop.fs.FsShell.main(FsShell.java:340)
而后又出现了一个异常。唉~
2015年11月29日回复顶转发

benjamin
你试试 bin/hdfs dfs -ls ./input("."代表当前目录)
2015年11月30日回复顶转发

zyx
回复 gxz: 1.Exception in thread "main" java.lang.RuntimeException: core-site.xml not found
2.节点都启动了吗？
2015年12月4日回复顶转发

zz
请教下，按照上面配置，core-site.xml配置defaultFs为hdfs://main:9000(main 为我主机名)，为什么启动hadoop成功，能看到namenode,datanode等进程，日志也没打印错误，但是9000端口就是拒绝连接呢？我看了下，9000端口没在监听状态，知道的麻烦告知下，谢谢啦～～～～～～～～～～
2015年11月25日回复顶转发

benjamin
将main改成localhost呢？localhost不就是指代了自己的电脑吗
2015年11月26日回复顶转发

给力星
应为 hdfs://localhost:9000
2015年11月30日回复顶转发

benjamin
给力星，能不能建立一个关于hadoop学习的群，大家有什么问题可以一起讨论？意下如何
2015年11月23日回复顶转发

给力星
很遗憾，虽然我研究生期间接触的是Hadoop相关的东西，但我校招找的还是前端方向的工作... 在还没毕业之前还会帮老师做些相关事情，等毕业上班了应该不会再有接触了...
2015年11月30日回复顶转发

benjamin
回复给力星: 恩，好吧，不过不相关也可以了解一下，我觉得大数据这个方向还是很有发展前景的。一同学习，话说工作找到互联网公司了吗？
2015年11月30日回复顶转发

给力星
回复 benjamin: 签了美团。
2015年11月30日回复顶转发

benjamin
回复给力星: 恩，美团在厦门也有研发，厦门城市不错。美团同学也蛮多
2015年12月1日回复顶转发

benjamin
各位在启用分布式，使用命令 sbin/start-dfs.sh 时出现了什么问题吗？为什么我运行这个命令要等待很长的时间，老是卡到这个地方
The: ssh: Could not resolve hostname the: Name or service not known
highly: ssh: Could not resolve hostname highly: Name or service not known
have: ssh: Could not resolve hostname have: Name or service not known
It's: ssh: Could not resolve hostname it's: Name or service not known
recommended: ssh: Could not resolve hostname recommended: Name or service not known
fix: ssh: Could not resolve hostname fix: Name or service not known
link: ssh: Could not resolve hostname link: No address associated with hostname
with: ssh: Could not resolve hostname with: Name or service not known
with: ssh: Could not resolve hostname with: Name or service not known
or: ssh: Could not resolve hostname or: Name or service not known
which: ssh: connect to host which port 22: Connection refused
stack: ssh: connect to host stack port 22: Connection refused
might: ssh: connect to host might port 22: Connection refused
try: ssh: connect to host try port 22: Connection refused
VM: ssh: connect to host vm port 22: Connection refused
fix: ssh: connect to host fix port 22: Connection refused
OpenJDK: ssh: connect to host openjdk port 22: Connection refused
you: ssh: connect to host you port 22: Connection refused
the: ssh: connect to host the port 22: Connection refused
stack: ssh: connect to host stack port 22: Connection refused
library: ssh: connect to host library port 22: Connection refused
loaded: ssh: connect to host loaded port 22: Connection refused
2015年11月23日回复顶转发

Wang
我也在这里卡住了请问你的问题解决了没有
2015年11月26日回复顶转发

benjamin
回复 Wang: 没有啊，现在开启不了HDFS伪分布模式，我的邮箱[email protected]，有什么问题可以一起交流下
2015年11月26日回复顶转发

gxz
输入 yes就好了
2015年11月28日回复顶转发

benjamin
回复 gxz: 恩已经安装成功了
2015年11月29日回复顶转发

benjamin
请问各位，为什么我配置ssh无密码登录不成功，每次进入运行 ssh localhost命令，都要输入hadoop用户的登录密码？
2015年11月22日回复顶转发

daidaixiong
最棒的文档
2015年11月14日回复顶转发

hunter
请问我在Red Hat 4.8.2-16 搭建了hdfs,在使用httpfs的时候，日志中出现了

log4j:WARN No appenders could be found for logger (org.apache.hadoop.util.Shell).
log4j:WARN Please initialize the log4j system properly.
log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.

请问这是为什么，而且我需要把hadoop-env.sh 中的JAVA_HOME改成/home/java....jdk才能用，是不是和这个问题有关联啊？？
现在不管做什么操作json都会显示NullException 求教求教
2015年11月11日回复顶转发

给力星
log4j是用来记录日志信息的。你这两问题我不是很清楚，得你自行搜索一下了...
2015年11月30日回复顶转发

凯
你好：我在做格式化时
hadoop@martinpoint4:~$ bin/hdfs namenode -format
bash: bin/hdfs: 没有那个文件或目录
请问怎么解决呀？谢谢！
2015年11月10日回复顶转发

给力星
教程中涉及到的 bin/hdfs ... , sbin/start-dfs.sh ... 等命令，都是以 /usr/local/hadoop 为当前目录来执行的。你把目录切换到 /usr/local/hadoop 下，再去执行就好了。
2015年11月30日回复顶转发

geek
同为厦大学生！良心之作！
2015年11月7日回复顶转发

同
给力兄，我在sbin/start-dfs.sh这一步卡住了，显示没有创建文件夹的权限，比如logs文件夹，namenode.out
2015年11月4日回复顶转发

同
因为普通用户没有权限，但是如果加sudo的话，又得root密码连接ssh
2015年11月4日回复顶转发

同
回复同: 细细看了一下，发现漏了一步，修改hadoop文件夹的权限，不过还是请教那条命令的作用？
2015年11月4日回复顶转发

CXY
为什么 bin/hdfs dfs -mkdir input失败？mkdir: `input': No such file or directory
2015年10月18日回复顶转发

给力星
在这一步之前你没有先执行 bin/hdfs dfs -mkdir -p /user/hadoop 吧。需要先创建 hdfs 上的用户目录。
2015年10月18日回复顶转发

CXY
回复给力星: 谢谢楼主呢~成功啦
2015年10月19日回复顶转发

dal
回复给力星: 我以root身份执行hdfs dfs -mkdir -p /user/hadoop 时，就出现了`/user/hadoop': No such file or directory
怎破？
2015年10月22日回复顶转发

小样
bin/hdfs dfs -mkdir /input 这样就对了
2015年11月3日回复顶转发

wang
whx@whx-desktop:/usr/local/hadoop$ bin/hdfs dfs -put etc/hadoop/*.xml input
15/10/17 21:31:52 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
put: Call From whx-desktop/127.0.1.1 to localhost:9000 failed on connection exception: java.net.ConnectException: Connection refused; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused
whx@whx-desktop:/usr/local/hadoop$
你能帮我解决一下不呢？十分感谢
email:[email protected]
2015年10月17日回复顶转发

孙毛毛蛋蛋
WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable，我也遇到这个问题了，你的解决了吗？肿么办？万分感谢！！！
2015年11月19日回复顶转发

鹏霖
你好，学长，请问我在 sudo sbin/start-dfs.sh
这步之后出现了
Starting namenodes on [localhost]
root@localhost's password:
我该怎么办，问题是出在哪里
注：我刚开始学不到一个月，麻烦您说的详细点，谢谢
2015年10月13日回复顶转发

大大
应该是ssh没有配置好
2015年10月14日回复顶转发

faker
不用加sudo，因为是创建的用户是hadoop，加sudo是用root身份
2015年10月20日回复顶转发

鹏霖
回复大大: 就是这个原因已经解决谢谢
2015年10月21日回复顶转发

鹏霖
回复 faker: 是 hadoop权限设置的问题和 ssh 没配好
2015年10月21日回复顶转发

visitor
wonderful tutorial！thanks for your help
2015年9月28日回复顶转发

lq
比一些书上讲的好多了
2015年9月27日回复顶转发

专攻鸡兔同笼等一系列学术问题
楼主你好，请问下我关掉终端，然后再重新打开终端输入sbin/start-dfs.sh，结果提示-bash: sbin/start-dfs.sh: No such file or directory这是为什么呢？（我想关掉重新打开hadoop试试）
2015年9月21日回复顶转发

专攻鸡兔同笼等一系列学术问题
哦明白了，要先cd路径到hadoop的文件夹
2015年9月21日回复顶转发

专攻鸡兔同笼等一系列学术问题
成功了谢谢楼主！！希望自己能坚持下去，能进一步学习
2015年9月21日回复顶转发

给力星
嗯，加油~
2015年9月21日回复顶转发

victor
想請問一下，解壓縮後，執行cd ./hadoop 與 ./bin/hadoop 都顯示bash:./bin/hadoop:No such file or directory
2015年9月8日回复顶转发

给力星
解压是解压到 /usr/local 目录下，并且执行 cd ./hadoop 之前，还执行了如下操作，更改了解压后的文件名：

cd /usr/local/
sudo mv ./hadoop-2.6.0/ ./hadoop # 将文件夹名改为hadoop
sudo chown -R hadoop:hadoop ./hadoop # 修改文件权限

这样操作后，最终的目录是 /usr/local/hadoop，请自行检查。
2015年9月8日回复顶转发

victor
回复给力星: 感謝樓主，可以了!!
2015年9月8日回复顶转发

harrywater
在这一段 “在这一步以及后面启动 Hadoop 时若提示 Error: JAVA_HOME is not set and could not be found. 的错误，则需要在文件 ./etc/hadoop/hadoop-env.sh 。。。”中地址好像写错了，根本没有那个文件应该是/usr/local/hadoop/etc/hadoop/hadoop-env.sh
2015年9月2日回复顶转发

clgsnail
mapreduce能否直接读取本地目录文件？
2015年8月25日回复顶转发

给力星
Hadoop单机配置(非分布式) 就是读取本地目录文件。
2015年8月25日回复顶转发

欧祥钦
用虚拟机安装的，执行这句话的时候 bin/hdfs dfs -mkdir -p /user/hadoop ，出现OpenJDK Client VM warning: You have loaded library /usr/local/hadoop/lib/native/libhadoop.so.1.0.0 which might have disabled stack guard. The VM will try to fix the stack guard now.
It's highly recommended that you fix the library with 'execstack -c ', or link it with '-z noexecstack'.
15/08/18 02:29:27 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
2015年8月18日回复顶转发

给力星
WARN 提示不影响正常功能，可以放心使用。若要消除该提醒，可自行搜索网上解决方法~
2015年8月25日回复顶转发

骆元
楼主你好，按照你的教程安装了伪分布式后，localhost:50070页面能够正常显示结点信息。但运行mapreduce程序后,http://localhost:8088/cluster 却看不到运行程序的相关信息。。。这个问题困扰了我好几天，请不吝赐教～
2015年7月30日回复顶(2)转发

zz
楼主问题终于弄好了，hadoop2.6.0伪分布式运行mapreduce程序，需要添加yarn-site.xml配置文件。
yarn-site.xml：
mapreduce.framework.nameyarnyarn.nodemanager.aux-servicesmapreduce_shuffle

这样http://localhost:8088/cluster 才能看到运行程序的相关信息
2015年7月31日回复顶转发

zz
回复 zz: 参考网址：http://www.centoscn.com/hadoop/2015/0118/4525.html
2015年7月31日回复顶转发

给力星
回复 zz: 目前单机教程只是涉及如何启动Hadoop，还没有涉及通过 http://localhost:8088/cluster 查看 MapReduce 任务。谢谢你的反馈，后续考虑补充上。
2015年8月4日回复顶转发

王雪洁
楼主，jobtracker和tasktracker是旧版本Hadoop才有的。那现在这个mapreduce是怎么管理的那？并且mapred-site.sh里面再配置jobtracker是无效的吧
2015年7月29日回复顶(2)转发

给力星
新版本采用的是 Yarn 框架，你可以自行搜索一下相关介绍。新版没有 jobtracker，再去配置自然是无效的。
2015年7月29日回复顶转发

贾睿
真的很棒谢谢你
2015年7月27日回复顶转发

贾睿
哈哈哈
2015年7月27日回复顶转发

正在学习Hadoop的包包
补充一点点内容。第一次使用start-all.sh启动Hadoop时，若出现报错：localhost:Error: JAVA_HOME is not set and could not be found.则是因为JAVA_HOME环境变量没有设置，需要在./etc/hadoop/hadoop-env.sh中设置JAVA_HOME，
export JAVA_HOME=$JAVA_HOME
这样设置仍然会报错，只有使用绝对路径才不会报错。如：
export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_51
2015年7月25日回复顶转发

czb
我也是。
2015年7月25日回复顶转发

给力星
估计是通过 ~/.bashrc 来设置 $JAVA_HOME 还是不能保证有效，之前是在 /etc/environment 中进行设置，不过需要重启才能保证生效，比较麻烦。我已在文章中作了相应补充。
2015年7月27日回复顶转发

czb
每次重启ubuntu后，$ echo $HADOOP_HOME时发现都是空的，现在只好每次重启后手工执行source命令生效：
$source /usr/local/hadoop/etc/hadoop/hadoop-env.sh
这应该属linux知识，但我不知如何解决，望各位给予指导。
2015年7月25日回复顶转发

给力星
在启动Hadoop时会运行hadoop-env.sh这个脚本让$HADOOP_HOME变量生效的，应该是不需要你预先使其生效的。重启ubuntu后 echo $HADOOP_HOME 为空是正常的，不会影响启动。
2015年7月27日回复顶转发

正在学习Hadoop的包包
赞！这是我见过的最棒的安装文档！很多小问题都想到了！负责任的作者！
2015年7月25日回复顶转发
1 2
社交帐号登录:
微信
微博
QQ
人人
更多»

发布
多说
© 2014 给力星

你可能感兴趣的:(Hadoop安装教4程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.0)

求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
发票合并工具小朋的软件园前端 javascript java html 服务器
"发票合并工具"是一款专为高效整理票据设计的实用工具，支持将来自不同渠道的发票文件（如PDF文档、各类图片格式）快速整合为排版规范的PDF文件，尤其适用于财务报销场景下的批量票据处理需求。核心功能亮点多格式兼容：无缝导入PDF文件及常见图片格式（.png/.jpg/.jpeg/.bmp），适配多来源发票整合需求。智能布局配置：提供灵活的页面布局选项（每页2/3/4张发票），其中"2合1"模式针对报
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
2025代码块种类以及作用 2501_92758067 intellij-idea phpstorm idea jupyter
https://www.bilibili.com/opus/1088624478422827030https://www.bilibili.com/opus/1088624529930977287https://t.bilibili.com/1088633635294150662https://www.bilibili.com/opus/1088633635294150662https://t.b
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
深入解析 TCP 连接状态与进程挂起、恢复与关闭誰能久伴不乏 tcp/ip 网络服务器
文章目录深入解析TCP连接状态与进程挂起、恢复与关闭一、TCP连接的各种状态1.**`LISTEN`**（监听）2.**`SYN_SENT`**（SYN已发送）3.**`SYN_RECEIVED`**（SYN已接收）4.**`ESTABLISHED`**（已建立）5.**`FIN_WAIT_1`**（关闭等待1）6.**`FIN_WAIT_2`**（关闭等待2）7.**`CLOSE_WAIT`**
Leetcode 3604. Minimum Time to Reach Destination in Directed Graph Espresso Macchiato leetcode笔记 leetcode 3604 leetcode medium leetcode双周赛160 BFS 广度优先遍历最优路径
Leetcode3604.MinimumTimetoReachDestinationinDirectedGraph1.解题思路2.代码实现题目链接：3604.MinimumTimetoReachDestinationinDirectedGraph1.解题思路这一题思路上就是一个广度优先遍历，我们不断考察当前时间点以及位置的情况下，下一个点可行的位置，然后考察最近的时间点能够到达的位置，遍历全部可能
洛谷 P11120 [ROIR 2024 Day 1] 登机题解殇之夜洛谷 c++c语言算法
Part0前言这种题一看就是签到题，也是特水，建议评红或橙。Part1思路就是先将已有位置先填对称，然后将剩余还未添加的乘客以对称方式填入。首先可以特判掉需要的位置大于空位的情况，直接输出Impossible。然后用数组记录.和X的位置，先遍历所有X的位置，然后看他的对称位置是否为空，若为空，则填入X，然后m--。最后若musingnamespacestd;chara[1010][10];stru
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
EMQX 社区版单机和集群部署 pcj_888 MQTT MQTT EMQ
EMQ支持Docker，宿主机，k8s部署；支持单机或集群部署。以下给出EMQX社区版单机和集群部署方法1.Docker单机部署官方推荐最小配置：2核4G下载容器镜像dockerpullemqx/emqx:5.3.2启动容器dockerrun-d--nameemqx\-p1883:1883\-p8083:8083\-p8883:8883\-p8084:8084\-p18083:18083\emqx
npm proxy setting kjndppl [Node.js JavaScript npm https proxy password
清理npmconfigdeletehttp-proxynpmconfigdeletehttps-proxy具体设置步骤如下：1.执行npmconfig后，将看到下一行提示信息npmconfigls-ltoshowalldefaults.2.执行npmconfigls-l后，在一大长串的settign中找出userconfig项(大概位于倒数第4项)[b]userconfig[/b]="C:\\Us
Linux/Centos7离线安装并配置MySQL 5.7 有事开摆无事百杜同学 LInux/CentOS7 linux mysql 运维
Linux/Centos7离线安装并配置MySQL5.7超详细教程一、环境准备1.下载MySQL5.7离线包2.使用rpm工具卸载MariaDB（避免冲突）3.创建系统级别的MySQL专用用户二、安装与配置1.解压并重命名MySQL目录2.创建数据目录和配置文件3.设置目录权限4.初始化MySQL5.配置启动脚本6.配置环境变量三、启动与验证1.启动MySQL服务2.获取初始密码3.登录并修改密码
本地包解决npm error code E404 雅痞yuppie npm 前端 node.js
这个错误提示表明npm找不到名为create-vue-admin-cli的包。这是因为你开发的CLI工具还没有发布到npm官方注册表。要解决这个问题，有两种方法：方法一：使用本地开发模式测试1.确保你的CLI已正确链接到全局在你的vue-admin-cli项目根目录下执行：npmlink这会在全局环境中创建一个符号链接，指向你本地的CLI项目。2.使用本地链接的CLI创建项目直接使用命令：vue-
windows安装pnpm后报错：pnpm : 无法将“pnpm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。 Ithao2 Vue npm 前端 node.js
使用npm方式安装pnpm,命令如下：npminstall-gpnpm安装完以后，执行pnpm-v查看版本号：pnpm-v执行完发现报错：pnpm:无法将“pnpm”项识别为cmdlet、函数、脚本文件或可运行程序的名称。尝试配置环境变量，重启后均不生效。解决方案：使用PowerShell进行安装1.以管理员用户打开PowerShell，执行如下命令：iwrhttps://get.pnpm.io/
Linux操作系统磁盘管理 CZZDg linux 运维服务器
目录一.硬盘介绍1.硬盘的物理结构2.CHS编号3.磁盘存储划分4.开机流程5.要点6.磁盘存储数据的形式二.Linux文件系统1.根文件系统2.虚拟文件系统3.真文件系统4.伪文件系统三.磁盘分区与挂载1.磁盘分区方式2.分区命令3.查看与识别命令4.格式化命令5.挂载命令四.LVM逻辑卷1.概述2.管理命令五.磁盘配额1.概述usrquota:支持对用户的磁盘配额grpquota：支持对组的磁
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象