Weka加载数据易出现的问题

weka直接支持的是Arff文件格式,同时也可以支持CSC、XSL等,但最后也需转换为Arff格式。

但是,在训练集、测试集加载过程中出现了一系列的错误,究其原因,都是没有遵循某种规范,且让我们好好看下这些错误吧:

问题1.

错误:not recognized as an 'CSV data files' file. Reasons: nominal value not declared in header, read Token[A], line 1

错误解释:没有识别为CSV文件

原因:CSV文件第一行应该为名称

解决:手动添加,用Excel可以用函数SUM,(A1+1),然后一拖就可以得到每一列的名称

 

问题2.

错误:Cannot handle numeric class
    原因:最有可能您的类的定义是一个数字numeric型,而不是名义
    解决1:使用NumericToNominal过滤器,个人测试是失败的,可以参看解决2

解决2:手动更改Arff文件,将numeric类型改为所有类别集合,如{yes,no}

 

问题3.

错误:a nominal attibute cannot have duplicate labels

原因:说什么不能有重复的类标,看不懂
    解决:手动更改Arff文件,将numeric类型改为所有类别集合,如{yes,no}

 

 

转载自:http://blog.sina.com.cn/s/blog_6f7265cf0101obno.html

你可能感兴趣的:(数据)