常用的UCI数据集

1.Hill_Valley(分辨地形中的“隆起”或“凹陷”)

数据集信息:
每条记录表示二维图形上的 100 个点。当按顺序(从 1 到 100)绘制为 Y 坐标时,这些点将创建一个山丘(地形中的"凸起")或一个山谷(地形中的"倾斜")。
可供下载的有六个文件,如下所示:
1.前两个数据集(无噪声)是一个训练/测试集对,其中丘陵或山谷具有平滑过渡。
(a) Hill_Valley_without_noise_Training.data
(b) Hill_Valley_without_noise_Testing.data
2.接下来的两个数据集(带噪声)是一个训练/测试集对,其中地形不平坦,仔细观察山丘或山谷不那么明显。
(c) Hill_Valley_with_noise_Training.data
(d) Hill_Valley_with_noise_Testing.data
3.示例 ARFF 文件对于设置实验很有用,但不是必需的。
(e) Hill_Valley_sample_arff.text
4.此图形文件显示了数据中的两个示例实例。
(f) Hill_Valley_visual_examples.jpg

属性信息:
1-100:标记为"X##"。浮点值(数字)
101:标记为"类"。二进制 {0, 1} 表示 {山谷, 山丘}

下载Hill_Valley

2.wine(利用化学分析确定葡萄酒的原产地)

数据集信息:
这些数据是对意大利同一地区种植但来自三个不同品种的葡萄酒进行化学分析的结果。该分析确定了在三种葡萄酒中的每一种中发现的13种成分的数量。

属性包含
1.酒精
2.苹果酸
3.灰分
4.灰分的碱度
5.镁
6.总酚
7.类黄酮
8.非黄酮酚类
9.原花青素
10.颜色强度
11.色调
12.稀释葡萄酒的 OD280/OD315
13.脯氨酸

属性信息:
第一个属性是类标识符(1-3)

下载wine

3.ionosphere(电离层雷达回波分类)

数据集信息:
目标是电离层中的自由电子。“良好”的雷达回波是那些显示电离层中某种结构的证据。“坏”回报是那些没有的回报。

属性信息:
第 35 个属性是“好”或“坏”。是一个二元分类任务。

下载ionosphere

4.Glass(玻璃分类)

属性信息:
1.编号:1 到 214
2.RI:折射率
3.Na:钠(单位测量:相应氧化物中的重量百分比,属性 4-10 也是如此)
4.Mg:镁
5.Al:铝
6.Si:硅
7.K:钾
8.Ca:钙
9.Ba:钡
10.Fe:铁
11.玻璃类型:(类属性)
1)building_windows_float_processed
2)building_windows_non_float_processed
3)vehicle_windows_float_processed
4)vehicle_windows_non_float_processed (none in this database)
5)containers
6)tableware
7)headlamps

下载Glass

5.sonar(区分从金属圆柱体反弹的声纳信号和从圆柱形岩石反弹的声纳信号)

数据集信息:
文件“sonar.mines”包含 111 种模式,这些模式是通过在各种角度和各种条件下从金属圆柱体上反射声纳信号而获得的。文件“sonar.rocks”包含在类似条件下从岩石中获得的 97 种模式。。该数据集包含从各种不同角度获得的信号,圆柱体跨越 90 度,岩石跨越 180 度。

属性信息:
如果对象是岩石,则与每条记录关联的标签类别为“R”,如果是金属圆柱体,则类别为“M”。标签中的数字按角度的递增顺序排列,但它们不直接编码角度。

下载sonar

6.Vowel(元音识别)

下载vowel

7.WDBC(诊断威斯康星乳腺癌数据库)

属性信息:
ID 号
诊断(M = 恶性,B = 良性)
为每个细胞核计算十个特征:
a) 半径(从中心到周边点的距离的平均值)
b) 纹理(灰度值的标准偏差)
c) 周长
d) 面积
e) 平滑度(半径长度的局部变化)
f) 紧凑性(周长^2 / 面积 - 1.0)
g) 凹度(轮廓凹入部分的严重程度)
h ) 凹点(轮廓的凹入部分的数量)
i) 对称性
j) 分形维数

下载wdbc

你可能感兴趣的:(数据分析,分类)