Mahout安装(Hadoop 1.2.1 版本)

1       安装环境

Hadoop1.2.1 分布式集群环境下安装(192.168.1.53-56

Mahout 0.9

2       安装介质

下载地址:http://archive.apache.org/dist/mahout/0.9/

文件名(二进制):mahout-distribution-0.9.tar.gz

3       安装步骤

3.1     上传安装介质:

#rz

上传目录为:/home/hadoop/

3.2     解压到相关目录

#cd   /app/hadoop/

#mkdir  mahout

#tar  -zxvf    /home/hadoop/mahout-distribution-0.9.tar.gz

重新命名解压的文件

# mv  mahout-distribution-0.9/   ./mahout

3.3     配置环境变量

1、配置

# vi /etc/profile

添加以内容:

export HADOOP_CONF_DIR=/app/hadoop/hadoop/conf

#Mathout

export MAHOUT_HOME=/app/hadoop/mahout

export MAHOUT_CONF_DIR=/app/hadoop/mahout/conf

export PATH=$PATH:$MAHOUT_HOME/conf:$MAHOUT_HOME/bin

 

//生效配置文件

#source  /etc/profile

 

2、分别将:mahout复制到(192.168.1.54-56

 

#tar  -zcvf   mahout.tar.gz   ./mahout

 

#scp  mahout.tar.gz    [email protected]:/app/hadoop/

分别在(54-56执行解压)

#tar  -zxvf  mahout.tar.gz

3、分别在192.168.1.5456(重复第1步环境变量配置)

(注:#source /etc/profile

3.4     启动Hadoop

#./start-all.sh

#jps

3.5     验证是否安装成功

#mahout –help

4       测试验证

4.1     下载测试数据

#wget  http://archive.ics.uci.edu/ml /databases/synthetic_control /synthetic_control.data

4.2     将文件存储到HDFS

#hadoop fs  -mdkir  testdata

#hadoop fs  -put   /home/hadoop/synthetic_control.data   testdata

#hadoop fs  -ls     testdata

 

4.3     运行mahout

#mahout org.apache.mahout.clustering.syntheticcontrol.kmeans.Job

4.4     查看结果

#hadoop  fs  -ls  ouput

 


 

你可能感兴趣的:(hadoop)