Java调用Weka API分类实例

  1. 转自:http://chenwq.iteye.com/blog/1308834


  2. package cn.edu.xmu.bdm.wekainjava.test;  
  3.   
  4. /** 
  5.  * desc:试试Weka的决策树类 
  6.  * J48Test 
  7.  * @version 1.0 2011/12/13 
  8.  * @author chenwq 
  9.  * 
  10.  */  
  11. import java.io.File;  
  12. import java.io.IOException;  
  13.   
  14. import weka.classifiers.Classifier;  
  15. import weka.classifiers.trees.J48;  
  16. import weka.core.Instances;  
  17. import weka.core.converters.ArffLoader;  
  18.   
  19. public class J48Test {  
  20.   
  21.     /** 
  22.      * @param args 
  23.      * @throws Exception  
  24.      */  
  25.     public static void main(String[] args) throws Exception {  
  26.          Classifier m_classifier = new J48();  
  27.             File inputFile = new File("C:\\Program Files\\Weka-3-6\\data\\cpu.with.vendor.arff");//训练语料文件  
  28.             ArffLoader atf = new ArffLoader();   
  29.             atf.setFile(inputFile);  
  30.             Instances instancesTrain = atf.getDataSet(); // 读入训练文件      
  31.             inputFile = new File("C:\\Program Files\\Weka-3-6\\data\\cpu.with.vendor.arff");//测试语料文件  
  32.             atf.setFile(inputFile);            
  33.             Instances instancesTest = atf.getDataSet(); // 读入测试文件  
  34.             instancesTest.setClassIndex(0); //设置分类属性所在行号(第一行为0号),instancesTest.numAttributes()可以取得属性总数  
  35.             double sum = instancesTest.numInstances(),//测试语料实例数  
  36.             right = 0.0f;  
  37.             instancesTrain.setClassIndex(0);  
  38.              m_classifier.buildClassifier(instancesTrain); //训练             
  39.             for(int  i = 0;i//测试分类结果  
  40.             {  
  41.                 if(m_classifier.classifyInstance(instancesTest.instance(i))==instancesTest.instance(i).classValue())//如果预测值和答案值相等(测试语料中的分类列提供的须为正确答案,结果才有意义)  
  42.                 {  
  43.                   right++;//正确值加1  
  44.                 }  
  45.             }  
  46.             System.out.println("J48 classification precision:"+(right/sum));  
  47.   
  48.   
  49.     }  
  50.   
  51. }  

你可能感兴趣的:(数据挖掘)