数据挖掘过程

数据挖掘的过程主要有:
1、定义目标

2、获取数据(直接获取或者爬虫)

3、数据探索(初步研究,无特别严格的流程)

4、数据预处理(数据清洗【去掉脏数据】、数据集成【集中】、数据变换【规范化】、数据规约【精简】)
脏数据:无效、异常、空
数据集成:不同来源的数据放在一起

5、挖掘建模(分类、聚类、关联、预测)

6、模型评价与发布

你可能感兴趣的:(数据挖掘过程)