weka-简介

官网:https://www.cs.waikato.ac.nz/ml/weka/
Weka,是一款免费、非商业化、基于Java的开源的机器学习与数据挖掘软件,并提供了maven依赖,拥有丰富的Java API

数据格式
Weka处理的数据集是一个二维的表格:
1.一个横向成为一个实例(Instance),相当于统计学中的一个样本,或者数据库中的一条记录
2.一个竖行称为一个属性(Attribute),相当于统计学中的一个变量,或者数据库中的一个字段
3.一个表格或数据集,在weka看来,呈现了属性之间的一种关系(Relation)

Weka存储数据的格式是ARFF(Attribute-Relation File Format),是一种ASCII文本文件
其中,%开头为注释,@relation为该关系的名称,@attribute为属性的名称及其类型(主要有numeric、nominal、string、date四种类型)

%.arff example
@relation aqi

@attribute I_stationId {2001,2002}
@attribute T_time {2016-12-01}
@attribute Q_pm25 numeric

@data
2002,2016-12-01,88
2002,2016-12-01,?
2002,2016-12-01,99
2002,2016-12-01,95
2003,2016-12-01,?
2003,2016-12-01,91
2003,2016-12-01,93
2003,2016-12-01,100

你可能感兴趣的:(Weka)