5.数据挖掘建模

经过数据探索和数据预处理之后,得到了可以直接建模的数据。根据挖掘目标与数据形式可以建立分类与预测、聚类分析、关联规则、时序模式和离群点检测等模型。

1 分类与预测

分类与预测是预测问题的两种主要类型。分类主要是预测分类标号(离散属性),而预测主要是建立连续值函数模型,预测给定自变量对应的因变量的值。
1.1 实现过程
(1)分类
分类是构造一个分类模型,输入样本的属性值,输出对应的类别,将每个样本映射到预先定义好的类别。
分类模型是建立在已有类标记的数据集上
(2)预测
(3)实现过程
1.2 常见的分类与预测算法
1.3 回归分析
研究自变量与因变量之间关系形式的分析方法,它主要是通过建立因变量 y y y与影响他的自变量 x i x_i xi之间的回归模型,来预测因变量 y y y的发展趋势。
1.3.1

2 聚类分析

3 关联规则

4 时序模式

5 离群点检测

你可能感兴趣的:(数据挖掘,机器学习)