mahout 决策树算法实验

mahout 决策树算法实验

http://blog.sina.com.cn/s/blog_61c463090100pbdh.html

导入到hdfs
bin/hadoop fs -put ./KDDTrain+.arff /user/root/
bin/hadoop fs -put ./KDDTest+.arff /user/root/
生成格式数据
bin/hadoop jar mahout-0.4.jar org.apache.mahout.df.tools.Describe -p "/user/root/KDDTrain+.arff" -f /user/root/KDDTrain+.info -d N 3 C 2 N C 4 N C 8 N 2 C 19 N L
训练数据
bin/hadoop jar  mahout-0.4.jar org.apache.mahout.df.mapreduce.BuildForest  -oob -d /user/root/KDDTrain+.arff -ds /user/root/KDDTrain+.info -sl 5 -p -t 5 -o forest_result
测试数据
bin/hadoop jar  mahout-0.4.jar org.apache.mahout.df.mapreduce.TestForest -i  /user/root/KDDTrain+.arff  -ds  /user/root/KDDTrain+.info -m forest_result -a -o predictions


你可能感兴趣的:(mahout 决策树算法实验)