迁移学习,强化学习汇总

迁移学习Transfer learning

什么是迁移学习?

所谓迁移学习或者领域适应Domain Adaptation,一般就是要将从源领域(Source Domain)学习到的东西应用到目标领域(Target Domain)上去。源领域和目标领域之间往往有gap/domain discrepancy(源领域的数据和目标领域的数据遵循不同的分布)。

简单说迁移学习可以从现有的数据中迁移知识,用来帮助将来的学习。目标是将从一个环境中学到的知识用来帮助新环境中的学习任务。把别处学得的知识,迁移到新场景的能力。有了这个,AI的进化就上道了。

迁移学习能够将适用于大数据的模型迁移到小数据上,实现个性化迁移。

迁移什么,怎么迁移,什么时候能迁移,这是迁移学习要解决的主要问题。

强化学习

强化学习是机器学习的一个分支,但与常见监督学习和无监督学习不太一样。强化学习旨在选择最优决策,它讲究在一系列的情景之下,通过多步恰当的决策来达到一个目标,是一种序列多步决策的问题。

(扫盲)从强化学习基本概念到Q学习的实现,打造自己的迷宫智能体

====== 相关资料汇总:======

比较全的资料:

迁移学习全面概述:从基本概念到相关研究

深度学习 -> 强化学习 ->迁移学习(杨强教授报告)

什么是迁移学习 (Transfer Learning)?这个领域历史发展前景如何?(知乎)

你可能感兴趣的:(迁移学习,强化学习汇总)