Weka 分类 注意点

注意点:
1、格式最好是weka默认的arff格式。不过weka也可以打开csv格式的文件(csv格式可以用空格、tab或者逗号隔开都行,但是一定要统一才可以。),然后可以点save,保存成为arff格式。
2、若是打开csv格式文件的话,第一行要一定要定义如图命名每一列的属性名称(随便命名比如图中的1 2 3 4 5 6 7 8 9或者a b c d e f g之类的,但列之间不能重复)。
Weka <wbr>分类 <wbr>注意点


归一化方法如下:可以同时选中所需要归一化的列,然后在choose  filter unsupervised 方法里选Normalize
然后点击apply Weka <wbr>分类 <wbr>注意点
Weka <wbr>分类 <wbr>注意点

归一化完成后,可以 save成 arff格式大概会如下,会带一些@名称:

Weka <wbr>分类 <wbr>注意点


再次强调一下想要分类的话最后一列标签千万不要用数值型,即使你是想要二分类,用0或1表示都不行,不然首先你会发现一些基本的分类器都是灰的选不了,还有一些例如随机森林这样的东西跑出来一些莫名其妙的结果,其实是帮你回归了。。。

你可能感兴趣的:(数据挖掘)