【重磅】一个完整的机器学习项目

Table of Contents

一、 项目概述

(一) 项目概览

(二) 规划问题

(三) 核实假设

二、 数据获取

(一) 下载数据

(二) 查看数据结构

(三) 数据分割(训练集、测试集)

三、 数据可视化、数据规律

(一) 地理数据可视化

(二) 查找关联(x与y)

(三) 属性组合试验(特征组合)

四、 为机器学习算法准备数据

(一) 数据清洗

(二) 处理文本和类别属性

(三) 自定义转换器

(四) 特征缩放

(五) 转换流水线

五、 模型选择、训练

(一) 基于训练集建模、评估

(二) 使用交叉验证做更加的评估

六、 模型调整

(一) 网格搜索

(二) 随机搜索

(三) 集成方法

(四) 分析最佳模型和它们的误差

(五) 用测试集评估系统

七、 给出解决方案

八、 部署、监控、系统维护


 

先给出完整的一个项目流程,后续添加个案例。

占个位置哈哈哈哈哈

一、 项目概述

(一) 项目概览

(二) 规划问题

(三) 核实假设

二、 数据获取

(一) 下载数据

(二) 查看数据结构

(三) 数据分割(训练集、测试集)

三、 数据可视化、数据规律

(一) 地理数据可视化

(二) 查找关联(x与y)

(三) 属性组合试验(特征组合)

四、 为机器学习算法准备数据

(一) 数据清洗

(二) 处理文本和类别属性

(三) 自定义转换器

(四) 特征缩放

(五) 转换流水线

五、 模型选择、训练

(一) 基于训练集建模、评估

(二) 使用交叉验证做更加的评估

六、 模型调整

(一) 网格搜索

(二) 随机搜索

(三) 集成方法

(四) 分析最佳模型和它们的误差

(五) 用测试集评估系统

七、 给出解决方案

八、 部署、监控、系统维护

 

 

参考

《Hands-on Machine Learning with Scikit-Learn & TensorFlow》

 

你可能感兴趣的:(模型算法相关,数据分析)