1、下载文件
2、tar -xvz -f mahout-distribution-0.7.tar.gz -C . 其中-C之后的参数即.的位置是解压的目标文件夹
3、配置环境变量 /etc/profile或者./.bashrc文件都可以
export HADOOP_HOME=/home/myname/hadoop-1.0.4
export HADOOP_CONF_DIR= $HADOOP_HOME/conf
export MAHOUT_HOME=/home/myname/mahout-0.7
第三条本人在一开始配置的时候没有加,也没出什么问题
4、安装完成后测试环节:
(1)、下载文件http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data放在$MAHOUT_HOME目录下。
(2)、启动Hadoop:$HADOOP_HOME/bin/start-all.sh
(3)、在$MAHOUT_HOME目录下创建测试目录testdata,并把数据导入到这个tastdata目录中(这里的目录的名字只能是testdata)
$HADOOP_HOME/bin/hadoop fs -mkdir testdata
$HADOOP_HOME/bin/hadoop fs -put $MAHOUT_HOME/synthetic_control.data $MAHOUT_HOME/testdata
(4)、使用kmeans算法(这会运行1分钟左右)
$HADOOP_HOME/bin/hadoop jar $MAHOUT_HOME/mahout-examples-0.5-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
(5)、查看结果
$HADOOP_HOME/bin/hadoop fs -lsr output
$HADOOP_HOME/bin/hadoop fs -get output $MAHOUT_HOME/examples
$cd $MAHOUT_HOME/examples/output
$ ls
如果看到以下结果那么算法运行成功,你的安装也就成功了.
clusteredPoints clusters-0 clusters-1 clusters-10 clusters-2 clusters-3 clusters-4
clusters-5 clusters-6 clusters-7 clusters-8 clusters-9 data