编码问题导致weka不识别ARFF文件

想用weka处理一个文件,文件格式已经转为ARFF,可总是报错,如下图所示。


编码问题导致weka不识别ARFF文件_第1张图片
 警告框说not recognised as an 'Arff data files' file.

原因 Unable to determine structure as arff (keyword @relation expected)

 

可是,文件明明是ARFF格式的,文件第一行确实是@relation

 

苦思不得其解……

 

将文件中内容复制重存一份,发现弹出如下对话框。


编码问题导致weka不识别ARFF文件_第2张图片

 

该文件含有Unicode格式的字符,当文件保存为ANSI编码的文本文件时,该字符将丢失。

当时,我选择了取消,并将文件保存成Unicode编码的格式。

于是,weka就不识别ARFF文件了。

 

同时,测试了另外几种编码方式:Unicode、Unicode big endian、utf-8,均不能被weka识别。

 

你可能感兴趣的:(编码)