1:java版本选择
选择1.6版本,ide选择eclipse
2:安装maven
选择二进制包,解压后添加M2_HOME和M2环境变量,参见maven的官网,在/etc/profile的PATH添加maven的bin路径,我的是如下设置的PATH=$PATH:/opt/apache-maven-3.0.3/bin
3:安装mahout
解压
mvn install
如果jdk使用的是1.7,会有两个bug编译不过去:
第一个需要打一个补丁,地址参见:https://issues.apache.org/jira/browse/MAHOUT-782
打补丁方法很简单,在linux下patch 源文件 补丁文件即可
第二个:vim taste-web/pom.xml,加入
<plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-war-plugin</artifactId> <version>2.1.1</version> </plugin>
4:mahout和eclipse集成
m2eclipse只能选http://m2eclipse.sonatype.org/sites/m2e的安装,否则pom.xml报错,解决起来会哭死的
eclipse版本应选择EE版本的,这个不带maven插件,选了其它版本带插件了,想卸载可能比较难,不如下个ee版本的
具体如何集成请参考https://cwiki.apache.org/confluence/display/MAHOUT/BuildingMahout
5:安装hadoop
其它安装方式都不太对,用这个博客的应该可以,中间有些地方写的不对的应该很容易解决
http://www.54chen.com/_linux_/hive-hadoop-how-to-install.html
6:运行例子
如果上面步骤都没问题,那就运行吧,我的是mahout 0.6版本的,如何例子的链接https://cwiki.apache.org/confluence/display/MAHOUT/Quickstart#FootnoteMarker1,点开一个照着做就行了,我是一遍运行成功的,有问题的别找我