PyTorch学习之旅(二)——机器学习基础

前置文章传送门:PyTorch学习之旅(一)线性回归模型

深度学习是机器学习的子集,因为层数较多(深度较深),故名深度学习。
因此首先了解机器学习的基本概念也是很有帮助的

参考书为《PyTorch深度学习》,ISBN: 9787115508980,可配套食用。

一、三类机器学习问题

主要有三类:有监督学习、无监督学习和强化学习

这里的监督怎么理解呢?
监督可以理解为训练数据需要人工打标签,比如首先收集到1000张动物图片,由人来区分都是什么动物,为其打上标签。
有监督学习的目标是:利用已知标签的数据训练模型,用于预测未知数据。
而无监督学习就是在没有标签的情况下,通过可视化和压缩来理解数据。
无监督学习的例子:
聚类、降维
有监督学习的例子:
分类问题、回归问题(预测股票价格)、图像分割(如行车环境中的行人、树木、车辆等)、语音识别(Siri)、语言翻译…

强化学习在书中说是最不流行的机器学习,话虽没错,但强化学习与深度学习结合的深度强化学习在特定领域也很有前景。
强化学习的原理是:
首先通过动作Action与环境Env进行交互,动作对环境产生影响从而使智能体Agent进入新的状态State,同时智能体会收到环境给出的奖励回馈Reward。Agent和Env通过不断的循环、交互从而生成大量数据,强化学习的算法则利用这些样本数据来调整策略π,然后再与Env交互进入新状态State并生成新数据,其后利用生成的新样本对策略π再进行多次修正。 经过大量的迭代学习后,Agent最终能学到完成相应任务的最优策略。

PyTorch学习之旅(二)——机器学习基础_第1张图片

二、机器学习术语

你可能感兴趣的:(Python_AI,pytorch,学习)