WEKA中文乱码解决方法

测试环境:win7  32位  weka3.8

乱码原因:weka默认的字符集编码是Cp1252,如果导入的数据中有中文字符,就会显示为乱码。

解决办法:

1、打开weka安装目录下的RunWeka.ini文件,找到【fileEncoding=】这一行,将Cp1252编码改为需要的字符集编码,比如utf-8,cp936(简体中文),cp950(繁体中文)。

# The file encoding; use "utf-8" instead of "Cp1252" to display UTF-8 characters in the 
# GUI, e.g., the Explorer
fileEncoding=utf-8 

2、**重新打开**weka软件。(★这一步很重要)

然后就可以正常显示中文了。

你可能感兴趣的:(文本挖掘,WEKA)