机器学习实战步骤（qbit）

前言

本文是黄佳《零基础实战机器学习》的学习笔记

什么是机器学习？

传统程序是程序员来定义函数，而在机器学习中是机器训练出函数。
机器学习的厉害之处就在于，它能利用计算机的运算能力，从大量的数据中发现一个“函数”或“模型”，并通过它来模拟现实世界事物间的关系，从而实现预测、判断等目的。

实战步骤

机器学习实战有五大步:

1 定义问题

第一步是定义问题

在定义问题这个环节中，我们要剖析业务场景，设定清晰的目标，
同时还要明确当前问题属于哪一种机器学习类型。

机器学习分为四大类

监督学习 supervised learning: 训练数据集全部有标签
无监督学习 unsupervised learning: 训练数据集没有标签
半监督学习 semi-supervised learning: 部分数据有标签
强化学习 强化学习和监督学习的差异在于：
     监督学习是从数据中学习，而强化学习是从环境给它的奖惩中学习。
     强化学习对数学基础的要求是较高的，不太适合入门。

深度学习是一种使用深层神经网络算法的机器学习模型，也就是一种算法。这个算法可以应用在监督学习、半监督学习和无监督学习里，也可以应用在强化学习中。

监督学习能解决的两类问题：回归和分类。

回归问题的标签是连续数值。
分类问题的标签是离散性数值。

2 数据收集和预处理

第二步是数据的收集和预处理

六小步

收集数据；
数据可视化；
数据清洗；
特征工程（BMI 体质指数，降维，去除冗余特征）
构建特征集和标签集；
拆分训练集、验证集和测试集。

3 选择算法并建立模型

第三步是选择算法并建立模型

在这一步中，我们需要先根据特征和标签之间的关系，选出一个合适的算法，
并找到与之对应的合适的算法包，
然后通过调用这个算法包来建立模型。

4 训练模型

第四步是训练模型

训练模型就是用训练集中的特征变量和已知标签，根据当前样本的损失大小来逐渐拟合函数，
确定最优的内部参数，最后完成模型。
虽然看起来挺复杂，但这些步骤，我们都通过调用 fit 方法来完成。

5 模型的评估和优化

第五步是模型的评估和优化

在“模型的评估和优化”这一步中，当我们预测完测试集的浏览量后，
我们要再拿这个预测结果去和测试集已有的真值去比较，
这样才能够求出模型的性能。

本文出自 qbit snap

机器学习实战步骤（qbit）

前言

什么是机器学习？

实战步骤

1 定义问题

2 数据收集和预处理

3 选择算法并建立模型

4 训练模型

5 模型的评估和优化

你可能感兴趣的:(机器学习实战步骤（qbit）)