数据的离散化

离散化是将连续属性的范围划分为区间。
有效的规约数据应用在例如 基于判定树的分类挖掘。
1) 离散化
通过将属性域划分为区间,减少给定连续属性值的个数。区间的标号可以代替实际的数据值。
2) 概念分层
通过使用高层的概念(比如:青年、中年、老年)来替代底层的属性值(比如:实际的年龄数据值)来规约数据



你可能感兴趣的:(数据的离散化)