python数据挖掘与分析实战_Python数据分析与挖掘实战 第1章——数据挖掘基础

1.1 某知名连锁餐饮企业的困惑

1.2 从餐饮服务到数据挖掘

这种从数据中“淘金”,从大量数据中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程,就是数据挖掘;它是利用各种分析工具在大量数据中找其规律和发现模型与数据之间关系的过程,是统计学、数据库、和人工智能技术的综合。这种方法可避免“人治”的随意性,避免企业管理仅依赖个人领导力的风险和不确定性,实现精细化营销与经营管理。

1.3 数据挖掘的基本任务

数据挖掘的基本任务包括利用分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐等方法,帮助企业提取数据中蕴含的商业价值,提高企业的竞争力。

1.4 数据挖掘建模过程

1.4.1 定义挖掘目标 ——针对具体的数据挖掘应用要求,首先要明确本次的挖掘目标是什么?系统完成后能达到什么样的效果?因此,必须分析应用领域,了解领域,熟悉背景知识,弄清用户需求,要想充分发挥数据挖掘的价值,必须对目标有一个清晰明确的定义,即决定到底想干什么。

python数据挖掘与分析实战_Python数据分析与挖掘实战 第1章——数据挖掘基础_第1张图片

1.4.2 数据取样——明确了需要进行数据挖掘的目标后,接下来就需要从业务系统中抽取一个与挖掘目标相关的样本子集。

抽取样本子集的标准:相关性、可靠性、有效性,数据抽取一定要严把质量关。

1.4.3 数据探索——数据探索主要包括:异常值分析、缺失值分析、相关分析和周期性分析。

1.4.4 数据预处理——数据预处理主要包括:数据筛选、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据规约等。

1.4.5 挖掘建模 这一步是数据挖掘工作的核心环节。

1.4.6 模型评价 对于分类与预测模型和聚类分析模型的评价方法是不同的。

1.5 主要数据挖掘工具——spss modeler python

你可能感兴趣的:(python数据挖掘与分析实战)