Finderme

记Hadoop安装中出现的各种问题

Hadoop安装中出现的各种问题及解决办法

前言

经历了几天的不断尝试，最终成功的安装并配置了Hadoop3.1.3，在安装的过程中踩了很多的坑，在此将我的经历分享给各位，希望在大家遇到问题时能给予一定的帮助，特别是初次接触或者打算学习大数据的朋友们，在安装及配置Hadoop之前如果能仔细阅读我的这篇文章，可以避免很多不必要的错误和麻烦，使安装过程更加顺利。

本文涉及安装过程：VirtualBox——Ubuntu18.04.4——Hadoop3.1.3

注：作者是按照厦门大学林子雨的系列安装教程进行安装操作的，其中不仅包含上述的版本，还有针对Mac系统，以及Centos、Ubuntu不同版本、Hadoop不同版本的详细安装教程，本文的写作目的就是在参考林子雨或其它安装教程安装Hadoop及之后的单机/伪分布式配置的过程中可能出现的问题进行统一的整理收纳，如已经安装好Ubuntu，请在内置的火狐浏览器打开本文，方便文中链接的访问与资源的下载。

关于VBox安装

VirtualBox下载地址(Win64bit)
可能出现的问题：
（1）虚拟机需要开启CPU 虚拟化，而进入BIOS的方式有所不同，需要根据自己的电脑型号搜索进入BIOS的方式。
（2）在安装VirtualBox虚拟机时，可能会弹出一些窗口询问是否要安装某些软件，一定要点击同意安装，否则，虚拟机不能正常运行。
（3）卸载虚拟机时，切不可直接在文件夹里删除，应该点击安装包，通过安装程序的“卸载”功能完成卸载。
（4）关于厦大数据库实验室提供的“大数据Linux实验环境虚拟机镜像文件”
在虚拟机软件VirtualBox中直接导入该镜像文件，可以立即生成包含了全套大数据软件的Ubuntu系统，作者首先实用的就是这个镜像文件，但是在导入的过程中出现了无法解决的错误，便也只能放弃。可能配置不同，在此附上链接，可以试一试大数据Linux实验环境虚拟机镜像文件

关于Ubuntu安装及使用

在Windows中使用VirtualBox安装Ubuntu
可能出现的问题及解决办法：
（1）强烈建议使用Ubuntu官方的18.04或14.04
附：Ubuntu18.04.4官网下载链接下载下来是iso镜像文件，先不要急着解压，之后要在VBox内使用盘片导入，具体操作教程中有

Ubuntu安装时一定注意不要选择kylin版本，有很多人包括作者最初使用的是优麒麟版本的Ubuntu（在Vbox导入盘片时要看清iso文件）安装配置，从安装开始到后期配置有很多不同的地方(安装Ubuntu时会优麒麟会显示kylin的字样，且系统主题为蓝色 )，并且使用例如apt get-update等更新时经常出现更新失败的情况，影响后续的配置安装，后改为Ubuntu18.04 一些问题就迎刃而解，并且Ubuntu的新版提升了使用体验，诸如对分辨率设置很友好，在调整对话框大小后，系统会根据当显示情况自动调整分辨率，不需要经常的打开设置调整分辨率，等等。

优麒麟 Ubuntu Kylin是由中国CCN联合实验室支持和主导的开源项目，其宗旨是采用平台国际化与应用本地化融合的设计理念，通过定制本地化的桌面用户环境以及开发满足广大中文用户特定需求的应用软件来提供细腻的中文用户体验，做更有中国特色的操作系统。

（2）如果直接在文件夹中删除了虚拟机，导致虚拟机无法运行，建议下载360安全助手，彻底清理注册表后，再次安装。
（3）在VirtualBox创建虚拟电脑，建议安装Ubuntu16.04，不要安装CentOS，这样可以和林子雨老师课程实验环境完全吻合。Unbuntu的安装时间较长，一些老的电脑可能一次安装就会花掉6-8个小时，所以在选择版本时一定要考虑好，避免后续的多次安装产生的麻烦。
（4）在Ubuntu内，如果出现窗口显示不全的情况，就按住alt键，再把鼠标移动到对话框上端，点击鼠标左键拖拽移动对话框就可以显示其他的内容这个问题一般在安装时出现，当安装完成后，根据教程修改Ubuntu的显示分辨率后再全屏，就不会出现显示不全的情况
（5）Ubuntu18.0.4安装时选择分区后需要点击继续安装时如果出现按住alt还无法拖拽，无法单击继续安装按钮的情况，重新退出安装，选择英语语言就可以解决问题，但是后续安装好以后需要重新下载汉语的语言包及输入法。
附：Ubuntu如何修改默认语言为中文
（6）最好安装Ubuntu设置用户时就设置用户名为hadoop，这样会在后续的安装过程中省掉很多不必要的麻烦，不然后续安装hadoop时还需要新建hadoop用户。
（7）键盘布局问题，如果有时出现无法输入"~"的情况，在设置里边将输入设置从英语(英国)调到英语(美国)就行，设置完成可以查看一下键盘布局，此时就能输入了。
（8）关于Vbox提供的虚拟机和电脑之间的双向传输剪切板，可以在Vbox设置里打开双向复制粘贴，如果还是不能在虚拟机和电脑之间复制内容，需要再查找相关的解决办法。

在Ubuntu终端窗口中，复制粘贴的快捷键需要加上 shift，即粘贴是 ctrl+shift+v。

（9）Ubuntu卡顿掉帧现象比较严重的话，可以在退出Ubuntu后在Vbox里边适当增加显存和内存

在分配内存时有条件的主机最好分配大一些的运行内存通常4G对应1-2G、8G对应3G，Ubuntu的使用会更加流畅。

（10）如果有时出现解决不了的问题，可以输入以下命令，尝试更新

sudo apt-get update

关于Hadoop安装及调试

Hadoop3.1.3安装教程_单机/伪分布式配置-Ubuntu18.04(16.04)
Hadoop2.6.0(2.7.1)安装教程-单机-伪分布式配置–Ubuntu14.04(16.04)

（1）Hadoop最好直接在Ubuntu的火狐浏览器里下载，注意是tar.gz不是src ，src是未编译版本，无法直接使用。
Hadoop3.1.3官网下载链接（在虚拟机用Firefox浏览器打开下载）
（2）关于使用什么分布式的安装，由于分布式需要多个主机同时运行，对电脑的要求很高，所以建议使用单机/伪分布式安装。

单机模式：单机模式：Hadoop 默认模式为非分布式模式（本地模式），无需进行其他配置即可运行。非分布式即单 Java 进程，方便进行调试。
伪分布式模式：Hadoop 可以在单节点上以伪分布式的方式运行，Hadoop 进程以分离的 Java 进程来运行，节点既作为 NameNode 也作为 DataNode，同时，读取的是 HDFS 中的文件。
分布式模式：使用多个节点构成集群环境来运行Hadoop。

（3）关于安装java环境有两种办法，第一个就是按照教程中操作，下载安装JDK，第二种则是打开终端，输入下边命令，等待更新就好，安装时会自动生成usr／lib／jvｍ文件夹，如果安装成功，按照这个路径就能找到JDK

sudo apt install openjdk-8-jdk
apt search openjdk
sudo apt-get install default-jre

第一条输入以后如果安装成功就不用输入23条，当安装失败时再输入2和3条

（4）配置环境变量时，如果成功用vim编辑器打开文件，会弹出编辑窗口的，若没有弹出，则需要检查vim的安装是否成功，在编辑环境变量时如果安装的是openjdk-8-jdk，在配置环境变量时将路径里边相应的jdk换成openjdk-8-jdk就行，基本的vim编辑器操作方法参考下边教程
Linux系统中vim编辑器的安装和使用方法

vim编辑器是Linux系统上最著名的文本/代码编辑器，是vi编辑器的加强版，可以帮助我们完成文件的创建和代码的编写

（5）在Linux的终端中输入密码，终端是不会显示任何你当前输入的密码，也不会提示你已经输入了多少字符密码。而在windows系统中,输入密码一般都会以“*”表示你输入的密码字符，在输入sudo命令后，需要输入密码时，不要认为没有反应就是没输入，所以为了方便建议设置密码时就设置比较简单的密码。

sudo命令
安装中会大量使用到sudo命令。sudo是ubuntu中一种权限管理机制，管理员可以授权给一些普通用户去执行一些需要root权限执行的操作。当使用sudo命令时，就需要输入您当前用户的密码.

（6）执行相对路径时要保证已经cd进要执行相对路径的目录，比如下边的usr/local/hadoop,如果直接执行相对路径会提示找不到目标文件

cd /usr/local/hadoop
./bin/hadoop version

（7）输入shell命令时，注意不要出现拼写错误，例如将"start"拼成"strat"、将"local"拼成"loacl"的情况，否则会报错，找不到对应文件。
———————————————————————————————————
下面是关于Hadoop启动后出现的错误及解决办法（错误主要集中在NameNode/DataNode/SecondaryNode的启动上）：

（8）执行./sbin/start-dfs.sh启动Hadoop进程后日志报告中出现错误：
ERROR　conf.Configuration:error parsing conf hdfs-site.xml或core-sit.xml时，原因是在伪分布式配置修改core-site.xml和hdfs-site.xml时出现了拼写错误，需要先关闭进程sbin/stop-dfs.sh，再重新进入/usr/local/hadoop/etc/hadoop/使用gedit ./hdfs-site.xml打开相应的xml文件仔细查找错误，保存后重启hadoop进程
core-site.xml文件正确配置：

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/local/hadoop/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

hdfs-site.xml文件正确配置

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/data</value>
    </property>
</configuration>

（9）执行过一次NameNode格式化后，若后续开启Hadoop进程后输入jps没有列出相应成功进程提示的话，不要急着再一次格式化NameNode，因为多次格式化NameNode之后可能出现即便成功配置，启动进程后输入jps仍只显示jps的情况，而没有其它三个Node的情况，那样问题就比较麻烦了
要按照以下顺序排除所有错误后再格式化：

先重启Hadoop

 ./sbin/stop-dfs.sh #关闭Hadoop
 ./sbin/start-dfs.sh #开启Hadoop进程

重新打开core-site.xml和hdfs-site.xml核对错误
排除java环境变量问题
格式化NameNode

（10）权限被拒绝错误Permission denied访问输入jps后，只有jps参数，没有其他三个Node参数的情况，检查日志文件发现

localhost: hadoop@localhost:Permission denied (publickey,password).
进程权限不够，访问被拒绝，则是之前配置SSH无密码登录时出现错误，需要重新进行SSH链接公钥认证

cd ~/.ssh/                     # 若没有该目录，请先执行一次ssh localhost
ssh-keygen -t rsa              # 会有提示，注意要一直按回车
cat ./id_rsa.pub >> ./authorized_keys  # 加入授权

Hadoop启动失败，输入jps 之显示jps而没有其他几个Node参数的另一个原因可能是ssh的安装配置出现问题，输入

ssh localhost

若没有显示地址，ssh可能没有安装好
重新安装SSH server，并重设无密码登录

sudo apt-get install openssh-server

（11）启动 Hadoop 时出现很多 Could not resolve hostname提示
可通过设置 Hadoop 环境变量来解决。首先按键盘的 ctrl + c 中断启动，然后在 ~/.bashrc 中，增加如下两行内容（设置过程与 JAVA_HOME 变量一样，其中 HADOOP_HOME 为 Hadoop 的安装目录）

export HADOOP_HOME=/usr/local/hadoop
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

（12）若只有 DataNode 没有启动，可尝试如下的方法（注意这会删除 HDFS 中原有的所有数据，如果原有的数据很重要请不要这样做）：

cd /usr/local/hadoop
./sbin/stop-dfs.sh   # 关闭
rm -r ./tmp     # 删除 tmp 文件，注意这会删除 HDFS 中原有的所有数据
./bin/hdfs namenode -format   # 重新格式化 NameNode
./sbin/start-dfs.sh  # 重启

（13）如果 SecondaryNameNode 没有启动，运行关闭进程，然后再次尝试启动尝试

 sbin/stop-dfs.sh #注意要在cd /usr/local/hadoop下

（14）关于Hadoop伪分布式配置会出现很多不同的错误一般出错的提示在最后面，通常是写着 Fatal、Error、Warning 或者 Java Exception 的地方。不同环境出现的错误也不同，需要自己查看日志来分析错误原因，在网上搜索一下出错信息，尝试一些相关的解决方法。
如果启动成功，输入jps则会列出如下进程: “NameNode”、”DataNode” 和 “SecondaryNameNode，在火狐浏览器访问 Web 界面 http://localhost:9870 可以查看 NameNode 和 Datanode 信息，到这一步就算成功的安装并配置好Hadoop伪分布式了，给自己点掌声

关于虚拟机和电脑间数据传输

虚拟机和电脑之间的文件传输有几种方法
1）直接拖拽传输，只能传输到当前用户的主文件夹下，也就是我们常说的 ~，而想把文件从主文件夹复制到安装软件的计算机目录下，则需要开启权限，并且一般来说root文件夹的权限不能更改，复制文件时会出现权限不够无法传输的情况
2) 使用Vbox虚拟机的文件管理器，打开方法：控制~文件管理器，使用方法：现在下方输入虚拟机的用户名和密码，点击创建链接，左边是电脑文件，右边是虚拟机文件，点击文件后再点复制按钮就可以传输文件，但同样的文件管理器也会出现权限不够的问题，仅从Ubuntu的计算机向电脑复制文件时可以，但返过来传输文件则没有反应

3）使用Linux系统Filezilla工具，具体的下载如下（Filezilla安装在Windows上）：
官网下载链接Windows64位
使用教程：FileZilla的使用教程

FileZilla是一个免费开源的FTP软件，分为客户端版本和服务器版本，
具备所有的FTP软件功能。
可控性、有条理的界面和管理多站点的简化方式
使得Filezilla客户端版成为一个方便高效的FTP客户端工具

4）在Windows系统中利用FTP软件向Ubuntu系统上传文件
使用方法：FTP软件使用方法

FTP就是文件传输协议。用于互联网双向传输，
控制文件下载空间在服务器复制文件从本地计算机
或本地上传文件复制到服务器上的空间。

虚拟机和电脑之间的双向剪切板不容易设置，安装时需要访问的链接最好直接在虚拟机的火狐浏览器上访问，同样下载的软件最好也直接在虚拟机里边下载，

关于Linux的提示

（1）Linux中英文的切换方式是使用键盘“shift”键来切换。
（2）~的含义
在 Linux 系统中，~ 代表的是用户的主文件夹，即 “/home/用户名” 这个目录，如你的用户名为 hadoop，则 ~ 就代表 “/home/hadoop/”。此外，命令中的 # 后面的文字是注释，只需要输入前面命令即可。
（3）查询虚拟机的ip地址
打开终端——输入"ifconfig"——查看"inet地址" （每次不同，每次登陆，重新查询）
（4）在Linux的终端中输入密码，终端是不会显示任何你当前输入的密码，也不会提示你已经输入了多少字符密码。而在windows系统中,输入密码一般都会以“*”表示你输入的密码字符，在输入sudo命令后，需要输入密码时，不要认为没有反应就是没输入，所以为了方便建议设置密码时就设置比较简单的密码。

涉及Hadoop的常用命令

（1）启动Hadoop(要先进入Hadoop安装目录):

cd /usr/local/hadoop
./sbin/start-dfs.sh

（2）关闭Hadoop

 ./sbin/stop-dfs.sh

（3）更新apt

  sudo apt-get update

Linux系统的常用命令及基本练习

Linux系统常用命令
下面是一些基础的操作可以在自己的虚拟机上进行实验，里边的文件增加删除操作是安全的闭环动作，完成操作后不会对系统造成影响
1.切换到local文件夹：

 cd /usr/local

2.返回上一级：

cd ..

3.切换到用户主文件夹：

cd ~

4.查看usr下所有的文件和目录：

cd /usr
ls-al

———————————————————————————————————
目录（文件夹管理）
1.进入/tmp目录，创建一个名为a的目录，并查看/tmp目录下已经存在的哪些目录

cd /tmp
mkdir a 
ls -al

2.删除空目录:

 cd /tmp     rmdir a

3.在/tmp目录下新建test：

cd /tmp
mkdir test

3.将/usr目录下的文件bashrcl复制到/usr/test目录下:

sudo cp /usr/bashrcl /usr/test

4.将/usr目录下的test重命名为test2：

sudo mv /usr/test /usr/test2

5.将/usr/test2 目录下的移除(删除)bashrcl：

sudo rm /usr/test2/bashrcl

6.查看当前主用户文件夹下的.bashrc文件的内容(cat命令)：

cat ~/.bashrc

7.文件查找(finder命令)找出主文件夹下文佳名为.bashrc文件：

find ~ -name .bashrc

8.压缩命令(tar)，在根目录"/“下新建文件夹test，然后在根目录”/"下打包成

test.tar.gz
sudo mkdir /test
sudo tar -zcv -f /test.tar.gz test

9.解压缩命令，把上面的test.tar.gz压缩包，解压缩到/tmp目录

sudo tar -zxv -f /test.tar.gz -C /tmp

本文涉及名词解释

（1）单机模式：单机模式：Hadoop 默认模式为非分布式模式（本地模式），无需进行其他配置即可运行。非分布式即单 Java 进程，方便进行调试。
（2）伪分布式模式：Hadoop 可以在单节点上以伪分布式的方式运行，Hadoop 进程以分离的 Java 进程来运行，节点既作为 NameNode 也作为 DataNode，同时，读取的是 HDFS 中的文件。
（3）分布式模式：使用多个节点构成集群环境来运行Hadoop。
（4）优麒麟：Ubuntu Kylin是由中国CCN联合实验室支持和主导的开源项目，其宗旨是采用平台国际化与应用本地化融合的设计理念，通过定制本地化的桌面用户环境以及开发满足广大中文用户特定需求的应用软件来提供细腻的中文用户体验，做更有中国特色的操作系统。
优麒麟（Ubuntu Kylin）以Ubuntu为参考，得到来自Debian、Ubuntu、LUPA及各地Linux用户组等国内外众多社区爱好者的广泛参与和热情支持，其开发贡献者可参见Ubuntu Kylin开发者团队列表。现在最新的正式版本是19.10。
（5）Linux：Linux是一套免费使用和自由传播的操作系统内核，是一个基于POSIX和Unix的多用户、多任务、支持多线程和多CPU的操作系统内核。它能运行主要的Unix工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了Unix以网络为核心的设计思想，是一个性能稳定的多用户网络操作系统内核。
（6）VirtualBox 是一款开源虚拟机软件。VirtualBox 是由德国 Innotek 公司开发，由Sun Microsystems公司出品的软件，使用Qt编写，在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。Innotek 以 GNU General Public License (GPL) 释出 VirtualBox，并提供二进制版本及 OSE 版本的代码。使用者可以在VirtualBox上安装并且执行Solaris、Windows、DOS、Linux、OS/2 Warp、BSD等系统作为客户端操作系统。已由甲骨文公司进行开发，是甲骨文公司xVM虚拟化平台技术的一部份。
（7）Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。
)
（8）FTP就是文件传输协议。用于互联网双向传输，控制文件下载空间在服务器复制文件从本地计算机或本地上传文件复制到服务器上的空间。
（9）FileZilla是一个免费开源的FTP软件，分为客户端版本和服务器版本，
具备所有的FTP软件功能。可控性、有条理的界面和管理多站点的简化方式使得Filezilla客户端版成为一个方便高效的FTP客户端工具

结语

如有错误，欢迎指正，后续有机会还会继续做一些问题补充，祝大家都能成功的安装好自己的Hadoop

转载请注明出处

你可能感兴趣的:(Hadoop安装)

《Hadoop系列》Docker安装Hadoop DATA数据猿 Hadoop Docker docker hadoop
文章目录Docker安装Hadoop1安装docker1.1添加docker到yum源1.2安装docker2安装Hadoop2.1使用docker自带的hadoop安装2.2免密操作2.2.1master节点2.2.2slave1节点2.2.3slave2节点2.2.4将三个容器中的authorized_keys拷贝到本地合并2.2.5将本地authorized_keys文件分别拷贝到3个容器中
【笔记】HDFS基础笔记哇咔咔哇咔 Hadoop hdfs 笔记 hadoop 大数据 ubuntu
启动hadoop命令（未配环境变量）：进入hadoop安装目录输入./sbin/start-dfs.sh已配环境变量：start-dfs.sh关闭hadoop命令：stop-dfs.sh启动完成后，可以通过命令jps来判断是否成功启动，若成功启动则会列出如下进程:"NameNode"、"DataNode"和"SecondaryNameNode"三种Shell命令方式：1.hadoopfs2.had
macos安装local模式spark SparklingTheo 大数据-linux macos spark 大数据
文章目录配置说明安装hadoop安装Spark测试安装成功配置说明Scala-3.18+Spark-3.5.0Hadoop-3.3.6安装hadoop从这里下载相应版本的hadoop下载后解压，配置系统环境变量>sudovim/etc/profile添加以下两行exportHADOOP_HOME=/Users/collinsliu/hadoop-3.3.6/exportPATH=$PATH:$HA
Hadoop搭建（完全分布式）莫噶搭建分布式 hadoop 大数据
节点分布：bigdata-masterbigdata-slave1bigdata-salve2NameNodeNodeManagerNodeManagerSecondaryNameNodeDataNodeDataNodeResourceManagerNodeManagerDataNode目录一、jdk安装：二、hadoop安装一、jdk安装：jdk-8u212链接：https://pan.baid
现成Hadoop安装和配置，图文手把手交你叫我小唐就好了一些好玩的事 hadoop 大数据分布式课程设计运维
为了可以更加快速的可以使用Hadoop，便写了这篇文章，想尝试自己配置一下的可以参考从零开始配置Hadoop，图文手把手教你，定位错误资源1.两台已经配置好的hadoop2.xshell+Vmware链接：https://pan.baidu.com/s/1oX35G8CVCOzVqmtjdwrfzQ?pwd=3biz提取码：3biz--来自百度网盘超级会员V4的分享两台虚拟机用户名和密码均为roo
CentOS7搭建Hadoop集群在下区区俗物 Hadoop集群安装部署 hadoop eclipse java
准备工作1、准备三台虚拟机，参考：CentOS7集群环境搭建（3台）-CSDN博客2、配置虚拟机之间免密登录，参考：CentOS7集群配置免密登录-CSDN博客3、虚拟机分别安装jdk，参考：CentOS7集群安装JDK1.8-CSDN博客4、下载Hadoop安装包，下载地址：链接：https://pan.baidu.com/s/1f1DmqNNFBvBDKi5beYl3Jg?pwd=6666搭建
linux安装hadoop详细步骤（伪分布式）红烧柯基 linux hadoop linux
今天重装了下hadoop，特在此记录下！一.准备好hdk和hadoop安装文件，上传到linux二.安装jdk，我之前博客有专门写过安装jdk步骤，这里就不重复了，有需要的小伙伴可以去翻翻之前的三.安装hadoop1.解压hadooptar-zxvfhadoop文件2.修改配置文件/usr/wangjian/software/hadoop/hadoop-2.10.0/etc/hadoop第一个：h
Hadoop环境搭建业里村牛欢喜 hadoop 大数据 hdfs
目录一、简介1.1、概念1.2、优势1.3、Hadoop组成部分二、Hadoop运行环境搭建2.1安装VM（虚拟机管理环境）2.2VM网络设置2.3安装CentOS7系统2.4master主机进行网络配置2.5同步时间2.6Xshell6的安装与使用2.7关闭防火墙2.8设置主机名2.9hosts设置2.10安装JDK2.11Hadoop安装与环境配置启动关闭Hadoop一、简介1.1、概念Had
解决There are 0 datanode(s) running and no node(s) are excluded in this operation. 有一束阳光叫温暖
出现上述问题可能是格式化两次hadoop，导致没有datanode解决方法1：重启linux,再使用start-dfs.sh和start-yarn.sh重启一下hadoop解决办法2：找到hadoop安装目录下hadoop-2.4.1/data/dfs/data里面的current文件夹删除然后从新执行一下hadoopnamenode-format再使用start-dfs.sh和start-yar
IDEA中Hadoop的环境配置 hhhhhhhhhhhnb intellij-idea java intellij idea hadoop linux
没有配置HadoopHome：在Windows下解压一份Hadoop安装包Hadoop使用log4j进行日志输出，明显没有配置log4j再次运行，显示了作业的运行情况
WARNING: HADOOP_SECURE_DN_USER has been replaced by HDFS_DATANODE_SECURE_USER. Using value of HADOOP W_yhhh hadoop hdfs 大数据
Hadoop启动时报错WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedbyHDFS_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER.原因是Hadoop安装配置于root用户下，对文件需要进一步的配置，应该是由于新版Hadoop这个配置的参数更新了，所以出现了警告。只需将参数更新即可。需要更新的文件
大数据[1] -- 安装hadoop 天下一般环境的配置与软件的使用操作系统大数据 linux
文章目录Hadoop安装以及配置一、安装1.安装SSH，设置SSH无密码登录2.安装jdk3.安装Hadoop二、配置三、其他配置四、出现的问题五参考文章Hadoop安装以及配置一、安装1.安装SSH，设置SSH无密码登录ssh可以让访问其他Linux虚拟机而不用输入密码，可以为集群做准备在被访问主机上生成公钥ssh-keygen-trsa-P''-f~/.ssh/id_rsa在访问主机上获取公钥
Hadoop搭建集群中输入hdfs namenode -format格式化节点时，提示：hdfs command not found 解决办法 drhrht java java 后端
分析原因：hadoop的安装路径没有加入到当前路径中解决办法：方法1：进入hadoop的安装目录，在执行hadoop命令时在前面加上：./bin./sbin方法2:进入/etc/profile文件中添加hadoop的安装路径sudovim/etc/profile添加：exportHADOOP_HOME=本机的hadoop安装路径exportPATH=$HADOOP_HOME/bin:$HADOOP
Hadoop中hdfs-default.xml的位置 BugEveryday Hadoop hadoop
在hadoop安装包中hadoop-2.7.2\share\hadoop\hdfs\hadoop-hdfs-2.7.jar里面
搭建vmware虚拟化平台的基础配置，以及Hadoop平台的搭建 rootwiki 云计算与大数据技术学习专栏 hadoop big data 大数据
需要准备的东西：vmwareworkstationscentos.isohadoop3.3.0mobaxterm/xshell/pietty/winscpjdk的tar包第一步：安装centos操作系统第二步：克隆虚拟机（也可以在hadoop安装后再克隆）我们这里需要选择完整克隆然后稍作等待，在列表中会刷新虚拟计算机第三步：配置虚拟网络3.1预备知识网络模式简介：VMWare提供了3种工作模式，它
hadoop安装遇到的一些障碍 GetIdea
一.start-dfs.sh（开启不成功）原因：1.dadoop文件所属者与执行时登陆者不一致（权限不足）报错：WARNING:HADOOP_SECURE_DN_USERhasbeenreplacedbyHDFS_DATANODE_SECURE_USER.UsingvalueofHADOOP_SECURE_DN_USER.Startingnamenodeson[centos7]centos7:Pe
基于CentOS7 Hadoop-2.7.2伪分布式部署程序员小H
1、基本环境Linux版本：CentOS7.0JDK版本：jdk-7u79-linux-x64.tar.gzHadoop版本：hadoop-2.7.2.tar.gzjdk以及Hadoop安装在/usr目录下2、安装JDK注意：若CentOS7已安装OpenJDK，可以使用以下命令进行卸载。2.1查看系统中的jdk#rpm-qa|grepjdk（查看目前系统中jdk版本）file2.2卸载#yum-
部署Hadoop集群 %HelloWorld% java 开发语言
在node1节点执行，以root身份1：在VMware虚拟机集群上部署HDFS集群1）准备好hadoop安装包；目前最新3.3.4；了解：2）上传解压hadoop①：上传hadoop到node1节点；②：解压安装包到/export/server（自己定的文件夹）中：tar-zxvfhadoop-3.3.4.tar.gz-C/export/server③：构建软连接也可改名（修改文件名用mv）cd/
Hadoop安装配置HBase m0_69595107 Hadoop hadoop hbase 大数据分布式 centos
1、文件准备http://archive.apache.org/dist/hbase/1.3.1/下载hbase-1.3.1-bin.tar.gz并上传到虚拟机/root目录下。2、安装切换目录[root@hadoop00~]#cd/usr/local新建文件夹[root@hadoop00local]#mkdirhbase解压文件[root@hadoop00local]#tarzxvf/root/
Linux修改hadoop配置文件及启动hadoop集群详细步骤 CatalinaCatherine Linux linux hadoop 运维
目录一、配置Hadoop环境1.查看Hadoop解压位置2.配置环境变量3.编辑环境变量4.重启环境变量5.查看Hadoop版本，查看成功就表示Hadoop安装成功了二、修改配置文件1.检查三台虚拟机：2.切换到配置文件目录3.修改hadoop-env.sh文件4.修改core-site.xml文件5.修改mapred-site.xml文件6.修改hdfs-site.xml文件7.修改yarn-s
hadoop dfs web页面访问增加鉴权花菜回锅肉大数据数据仓库 hadoop 前端大数据 dfs
前言装好了Hadoop，通过浏览器访问，发现竟然不需要鉴权就能访问，且暴露了很多服务器层文件路径信息，基于多年积累的安全意识，必须得配置些鉴权信息，就有了该文，仅做学习记录，下次自己再装时能提高效率。生成密码//hadoop安装目录下创建secret目录，存放密码mkdir-p/home/test/hadoop-3.2.2/secret//创建密码文件touchhadoop-http-auth-s
记录学习Spark+Kafka构建实时分析Dashboard案例中遇到的问题（一）安装白令屿大数据处理 spark kafka python 大数据
目录推荐环境系统和软件安装安装Ubuntu分辨率问题虚拟机桥接模式连不上网Hadoop安装Ubuntu16.04下用aria2下载百度网盘大文件其他在安装hadoop时遇到的问题hadoop用法小结单机模式伪分布式Spark、Kafka、python依赖包、pycharm安装SparkKafkaPyCharmPython依赖现阶段在学习大数据处理相关的项目，先通过厦门大学林子雨老师的案例教程学习S
Hadoop/Spark安装周倜吉
单机安装Hadoop安装Javasudoapt-getinstalldefault-jdkjava-version2.设置Hadoop用户和组sudoaddgrouphadoopsudoadduser--ingrouphadoophduser3.安装并配置SSH$sudoapt-getinstallssh$suhduser$ssh-keygen-trsa-P""cat~/.ssh/id_rsa.p
Hadoop安装遇到的一些问题博弈史密斯
image.pngimage.png解决选择CentOs.vmx无反应问题：image.png打开之后，选择Poweron之后，选择Imovedit：第一次点mved，以后点copiedroot登陆，密码：hadoop修改时间，选择时区打开一个终端查看ip查看主机名、防火墙状态在桌面中打开的终端，以root权限运行，否则一些文件没有修改权限
YARN 配置文件 capacity-scheduler.xml 参数解读我很ruo hadoop 大数据
capacity-scheduler.xml文件中配置了yarn资源调度器运行中的各项参数，位于hadoop安装目录/hadoop-2.7.2/etc/hadoop目录下。打开后可以看到默认配置。所有的配置有注有英文注释，考虑到可能对部分朋友不太友好，所以笔者结合自己的理解对这些注释进行了翻译，如有错误，恳请指正：#最多可以运行的应用数，默认10000yarn.scheduler.capacity
《数据采集与预处理环境》实验环境安装活下去. python mysql hadoop
文章目录1.安装Python及第三方库2.jupyternotebook安装3.jdk安装4.MySQL安装1.在根目录下创建文件my.ini2.初始化3.安装服务4.启动服务5.登录6.配置环境变量5.hadoop安装1.文件解压缩，删除bin文件，解压缩apache-hadoop-3.1.3-winutils-master.zip文件，将bin文件复制到hadoop根目录中。2.在根目录下，新
1.大数据概述流月up 大数据 hadoop 大数据发行版模块
目录概述hadoophadoop模块hadoop发行版apache社区版本CDP(CDH+HDP)其它云产商框架选择hadoop安装结束概述先了解几个常用的网站apache官网hadoop官网hadoopgithubhttps://github.com/apache/xxx[https://github.com/apache/spark(example)]hadoophadoop模块hadoop包
【2023】hadoop基础介绍方渐鸿数据分析 hadoop 大数据分布式 python
目录Hadoop组成HDFSHDFS操作HDFS分布式文件存储NameNode元数据数据读写流程YARN和MapReduceMapReduce：分布式计算YARN：资源管控调度YARN架构提交任务到**YARN中运行**Hadoop组成hadoop安装教程可以看我这篇文章===>hadoop通过docker安装HDFS组件：是Hadoop内的分布式存储组件，可以构建分布式文件系统用于数据存储。Ma
Linux Hadoop安装神游御风
Hadoop下载地址：http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.7.0.tar.gz
VitulBox中Ubuntu虚拟机安装JAVA环境——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项 Stitch . 我的大学笔记 Linux ubuntu java 笔记大数据 linux
前言在进行之后操作是请下载好JDK，之后的内容是以Ubuntu虚拟机中安装java环境续写。提示：以下操作是在虚拟机hadoop用户下操作的，并为安装java环境作准备一、更新APT为了确保Hadoop安装过程顺利进行，建议用hadoop用户登录Linux系统后打开一个终端，执行下面命令更新APT软件：sudoapt-getupdate二、安装SSH1，安装SSH服务端代码如下（示例）：sudoa
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多