Hadoop实战(7)_Apache Hadoop安装和配置Hue

系列目录:

Hadoop实战(1)_阿里云搭建Hadoop2.x的伪分布式环境

Hadoop实战(2)_虚拟机搭建Hadoop的全分布模式

Hadoop实战(3)_虚拟机搭建CDH的全分布模式

Hadoop实战(4)_Hadoop的集群管理和资源分配

Hadoop实战(5)_Hadoop的运维经验

Hadoop实战(6)_搭建Apache Hadoop的Eclipse开发环境

配置Hue的主要步骤:

  • 安装所需的rpm包
  • 编辑Hadoop的配置文件
  • 安装Hue
  • 启动Hue及验证

安装所需的rpm包

yum install ant
yum install asciidoc
yum install cyrus-sasl-devel
yum install cyrus-sasl-gssapi
yum install gcc
yum install gcc-c++
yum install krb5-devel

# for unit tests only
yum install libtidy 

yum install libxml2-devel
yum install libxslt-devel
yum install make
# yum install mvn (from maven package or maven3 tarball)
yum install mysql
yum install mysql-devel
yum install openldap-devel
yum install python-devel
yum install sqlite-devel

# for version 7+
yum install openssl-devel

yum install gmp-devel

编辑Hadoop的配置文件

参数文件 参数 参考值 说明
hdfs-site.xml dfs.webhdfs.enabled true 开启webhdfs功能
core-site.xml hadoop.proxyuser.root.hosts * 设置Hadoop集群的代理用户,*表示任何用户
core-site.xml hadoop.proxyuser.root.groups * 设置Hadoop集群的代理用户组

hdfs-site.xml


    dfs.webhdfs.enabled
    true

core-site.xml


    hadoop.proxyuser.root.hosts
    *


    hadoop.proxyuser.root.groups
    *

安装Hue

解压hue-3.7.0-cdh5.4.2.tar.gz

mkdir -p /root/tools
tar -zxvf hue-3.7.0-cdh5.4.2.tar.gz -C ~/training/

编译安装:注意系统时间

cd ~/training/hue-3.7.0-cdh5.4.2
PREFIX=/root/training/ make install

bug解决

/usr/include/gnu/stubs.h:9:27: error: gnu/stubs-64.h: No such file or direct                          ory
error: command 'gcc' failed with exit status 1

[root@hadoop25pseudo hue-3.7.0-cdh5.4.2]# rpm -qa | grep glibc*
glibc-headers-2.12-1.132.el6.x86_64
glibc-static-2.12-1.132.el6.i686
glibc-common-2.12-1.132.el6.x86_64
glibc-2.12-1.132.el6.x86_64
glib2-2.26.1-3.el6.x86_64
dbus-glib-0.86-6.el6.x86_64
glibc-2.12-1.132.el6.i686
glibc-devel-2.12-1.132.el6.i686

# 缺少64位的
yum install -y glibc-devel
/bin/bash: rsync: command not found

yum install -y rsync

添加用户hue

adduser hue
chown -R hue.hue /root/training/hue/

修改hue.ini($HUE_HOME/desktop/conf/hue.ini)参数文件

参数 参考值
http_host hadoop25pseudo
http_port 8888
server_user root
server_group root
default_user root
default_hdfs_superuser root
fs_defaultfs hdfs://hadoop25pseudo:9000
webhdfs_url http://hadoop25pseudo:50070/webhdfs/v1
hadoop_conf_dir /root/training/hadoop-2.4.1/etc/hadoop
resourcemanager_host hadoop25pseudo
resourcemanager_api_url http://hadoop25pseudo:8088
proxy_api_url http://hadoop25pseudo:8088
history_server_api_url http://hadoop25pseudo:19888
find . -name hue.ini
# ./desktop/conf/hue.ini
cd desktop/conf/
vi hue.ini
http_host=hadoop25pseudo
http_port=8888
server_user=root
server_group=root
default_user=root
default_hdfs_superuser=root

fs_defaultfs=hdfs://hadoop25pseudo:9000
webhdfs_url=http://hadoop25pseudo:50070/webhdfs/v1
hadoop_conf_dir=/root/training/hadoop-2.4.1/etc/hadoop
resourcemanager_host=hadoop25pseudo
resourcemanager_api_url=http://hadoop25pseudo:8088
proxy_api_url=http://hadoop25pseudo:8088
history_server_api_url=http://hadoop25pseudo:19888

启动Hue及验证

启动Hadoop相关组件start-all.sh

启动Hue:

cd ~/training/hue/build/env
bin/supervisor

验证,访问首页:http://hadoop25pseudo:8888/


您可能还想看

数据分析/数据挖掘/机器学习

Python数据挖掘与机器学习_通信信用风险评估实战(1)——读数据

Python数据挖掘与机器学习_通信信用风险评估实战(2)——数据预处理

Python数据挖掘与机器学习_通信信用风险评估实战(3)——特征工程

Python数据挖掘与机器学习_通信信用风险评估实战(4)——模型训练与调优

爬虫

Python爬虫实战之爬取链家广州房价_01简单的单页爬虫

Python爬虫实战之爬取链家广州房价_02把小爬虫变大

Python爬虫实战之爬取链家广州房价_03存储

Python爬虫实战之爬取链家广州房价_04链家的模拟登录(记录)

搜狗词库爬虫(1):基础爬虫架构和爬取词库分类

搜狗词库爬虫(2):基础爬虫框架的运行流程


微信公众号「数据分析」,分享数据科学家的自我修养,既然遇见,不如一起成长。

Hadoop实战(7)_Apache Hadoop安装和配置Hue_第1张图片
数据分析

转载请注明:转载自微信公众号「数据分析」


你可能感兴趣的:(Hadoop实战(7)_Apache Hadoop安装和配置Hue)