想必大家都看了上节入门里面使用的文件,weather.nominal.arff,文件格式为.arff
arff全称是Attribute-Relation File Format,翻译来应该是属性关联文件格式。
可以记住里面只有@代表元数据描述,用来描述关系和属性
剩下的就可以是记录数据,例如:
@relation weather.symbolic @attribute outlook {sunny, overcast, rainy} @attribute temperature {hot, mild, cool} @attribute humidity {high, normal} @attribute windy {TRUE, FALSE} @attribute play {yes, no} @data sunny,hot,high,FALSE,no sunny,hot,high,TRUE,no overcast,hot,high,FALSE,yes rainy,mild,high,FALSE,yes rainy,cool,normal,FALSE,yes rainy,cool,normal,TRUE,no overcast,cool,normal,TRUE,yes sunny,mild,high,FALSE,no sunny,cool,normal,FALSE,yes rainy,mild,normal,FALSE,yes sunny,mild,normal,TRUE,yes overcast,mild,high,TRUE,yes overcast,hot,normal,FALSE,yes rainy,mild,high,TRUE,no可以这样理解,第一部分为关系名,第二部分为属性名,有几行属性,下面数据就有几列,第三部分为数据,每一行数据 可以理解为:今天下雨,温度高,湿度大,不刮风,不出去玩。
参考链接:
1,http://www.cnblogs.com/finallyliuyu/archive/2010/08/23/1806414.html
2,http://www.cs.waikato.ac.nz/~ml/weka/arff.html
3,http://blog.csdn.net/tangl_99/article/details/610483