一、安装Java
第一步:去Oracle官网下载Java,安装系统32位和64位要求下载相应版本。
第二步:将下载下来的java进行解压,为方便将下载下来的java版本放在Downloads目录,推荐安装英文版Ubuntu系统,能避免很多bug。
tar -zxvf jdk1.8.0_131
第三步:配置java环境变量
sudo gedit /etc/profile
第四步:在文件下方输入
#Java
export JAVA_HOME=/home/blackrose/Downloads/jdk1.8.0_131 #设置你自己的目录,命令窗口到jdk1.8.0_131下运行pwd查看路径
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:{JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
保存退出。
第五步:一定不要忘记运行
source /etc/profile
在命令窗口输入java -version,即可显示出安装是否成功!
二、安装Hadoop
第一步:在Hadoop官网下载稳定的Hadoop版本,尽量不要使用Hadoop3.0版本。
第二步:和java一样在下载目录Downloads直接解压
tar -zxvf hadoop-2.7.3
第三步:配置Hadoop环境变量
# set hadoop classpath
export HADOOP_HOME=/home/blackrose/Downloads/hadoop-2.7.3
export HADOOP_INSTALL=/home/blackrose/Downloads/hadoop-2.7.3
export HADOOP_MAPRED_HOME=/home/blackrose/Downloads/hadoop-2.7.3
export HADOOP_COMMON_HOME=/home/blackrose/Downloads/hadoop-2.7.3
export HADOOP_HDFS_HOME=/home/blackrose/Downloads/hadoop-2.7.3
export YARN_HOME=/home/blackrose/Downloads/hadoop-2.7.3
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
export HADOOP_CONF_DIR=/home/blackrose/Downloads/hadoop-2.7.3
export HADOOP_PREFIX=/home/blackrose/Downloads/hadoop-2.7.3
export HADOOP_LIBEXEC_DIR=$HADOOP_HOME/libexec
export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native:$JAVA_LIBRARY_PATH
export HADOOP_CONF_DIR=$HADOOP_PREFIX/etc/hadoop
保存退出。
第四步:source /etc/profile
第五步:命令窗口切换到Hadoop路径下,运行
bin/hadoop
查看是否配置成功!
第六步:其他接下来的配置看Hadoop官网详细配置。包括伪分布式和全分布式。
三、安装RHadoop
第一步:sudo apt-get install default-jdk
第二步:安装rJava包
sudo apt-get install r-cran-rjava
第三步:将其他需要的r包在Rstudio中安装好,镜像选择中国科技大,这样速度能快点。
install.packages("reshape2")
install.packages("Rcpp")
install.packages("iterators")
install.packages("itertools")
install.packages("digest")
install.packages("RJSONIO")
install.packages("functional")
第四步:配置RHadoop环境变量
#RHadoop
export HADOOP_STREAMING=/home/blackrose/Downloads/hadoop-2.7.3/share/hadoop/tools/lib/hadoop-streaming-2.7.3.jar
export HADOOP_CMD=/home/blackrose/Downloads/hadoop-2.7.3/bin/hadoop
配置好了有时候也会出错,解决方案如下:
在Rstudio中首先运行
Sys.setenv(JAVA_HOME='/home/blackrose/Downloads/jdk1.8.0_131')
Sys.setenv(HADOOP_STREAMING='/home/blackrose/Downloads/hadoop-2.7.3/share/hadoop/tools/lib/hadoop-streaming-2.7.3.jar')
Sys.setenv(HADOOP_CMD='/home/blackrose/Downloads/hadoop-2.7.3/bin/hadoop')
然后在Rstudio里安装已经从github上下载好的rhdfs包和rmr2包,用Rstudio里的安装包解压就可以。