libsvm中svm-scale的使用时的一个小问题

使用libsvm中svm-scale的时候,遇到如下的小问题:

 

原始数据文件test的内容:
1 1:-1 2:-1 3:-1 4:1 5:-1 6:1 7:-1 8:1 9:-1
2 1:1 2:1 3:-1 4:1 5:-1 6:-1 7:1 8:1 9:-1   
3 1:1 2:1 3:1 4:-1 5:1 6:-1 7:-1 8:-1 9:1

执行 svm-scale.exe test > test.scale 后:
3 1:-1 2:-1 3:-1 4:1 5:-1 6:1 7:-1 8:1 9:-1
2 1:1 2:1 3:-1 4:1 5:-1 6:-1 7:1 8:1 9:-1
3 1:1 2:1 3:1 4:-1 5:1 6:-1 7:-1 8:-1 9:1

为什么label变成3,2,3了?这个把类别都修改了,认为原始数据中的1,3是同一类数据吗?

 

问题原因:

文件要以asni格式存储。
用utf8就会出现上述问题,最后一个和第一个label永远是一样的。


参考

http://www.baisi.net/thread-2476407-1-1.html

 

 

 

你可能感兴趣的:(搜索,文本分类,聚类相关)