要使用程序方式使用weka,步骤如下:
一、在eclipse里新建一个java project:
1. 建立工程:单击菜单中file->new->java project,在弹出对话框的project name中起任意一个名字,此处假设是wekaTest。单击Finish按钮(在对话框底部)。
2. 建立package:在package Explorer中找到刚才新建的工程,在其上右键->New->package。在Name文本框里面输入名称,此处假设为Test。单击 Finish按钮。
3. 建立程序文件:在刚才新建的package上面右键->New->class,选中public static void main(String[] args)多选框,单击Finish。
二、在该工程中添加weka的引用:
1. package Explorer中工程名上右键,选择弹出菜单最后一项properties->在左面选中java Build Path->在右面的Library页面->单击Add External JARs…->浏览weka所在目录,将weka.jar添加进来,然后单击ok。
2. 在package Explorer中在双击Test文件,然后在package wekaTest;一句下面添加四句代码:
import java.io.File;
import weka.classifiers.Classifier;
import weka.classifiers.trees.J48;
import weka.core.Instances;
import weka.core.converters.ArffLoader;
三、在程序中添加weka调用代码:
将以下代码添加到Main函数中(在// TODO Auto-generated method stub下面):
Classifier m_classifier = new J48();
File inputFile = new File("D:\\Program Files\\Weka-3-6\\data\\cpu.with.vendor.arff");//训练语料文件
ArffLoader atf = new ArffLoader();
atf.setFile(inputFile);
Instances instancesTrain = atf.getDataSet(); // 读入训练文件
inputFile = new File("D:\\Program Files\\Weka-3-6\\data\\cpu.with.vendor.arff");//测试语料文件
atf.setFile(inputFile);
Instances instancesTest = atf.getDataSet(); // 读入测试文件
instancesTest.setClassIndex(0); //设置分类属性所在行号(第一行为0号),instancesTest.numAttributes()可以取得属性总数
double sum = instancesTest.numInstances(),//测试语料实例数
right = 0.0f;
instancesTrain.setClassIndex(0);
m_classifier.buildClassifier(instancesTrain); //训练
for(int i = 0;i<sum;i++)//测试分类结果
{
if(m_classifier.classifyInstance(instancesTest.instance(i))==instancesTest.instance(i).classValue())// 如果预测值和答案值相等(测试语料中的分类列提供的须为正确答案,结果才有意义)
{
right++;//正确值加1
}
}
System.out.println("J48 classification precision:"+(right/sum));
四、运行一下试试。
来自:http://www.360doc.com/content/10/0428/01/79028_25213173.shtml #
先配置好java 环境,设置好路径,安装MyEclipse. (我使用的是jdk_1.6,MyEclipse 7.1)
在WEKA 的官方网页上下载WEKAhttp://www.cs.waikato.ac.nz/ml/weka/ 的安装程序
安装后,在安装目录下有个weka-src.jar包(源代码)和weka.jar包(可执行文件),用winzip或winrar可以将其解压。
在MyEclipse中新建一个java工程weka(工程名随便命名),将\weka-src\src\main\java\weka文件夹拖入到waka工程的src
目录下.
要在eclipse 中运行weka, 请打开weka.gui 包,找到类GUIChooser或Main,以“java application“的方式运行。
注:
本人在运行类GUIChooser或Main时,出现了”no main class found“的错误
原因是将weka源文件拖入到工程中时,MyEclipse并没有编译这个工程,因此没有编译生成class文件。
解决方法:将weka.jar文件解压后,将\weka\weka文件夹拷贝到weka工程磁盘目录下的bin文件夹下,
重新运行类类GUIChooser或Main即可。
weka官方网址:http://www.cs.waikato.ac.nz/ml/weka/
weka中文学习网址:www.wekacn.org