强化学习(Reinforcement learning)

强化学习又称增强学习。

 

强化学习要解决的问题:

一个能够感知环境的自治智能体(Agent),如何通过学习选择能够达到目标的最优动作,即强化学习Agent的任务是从环境收集的数据,并作出相应的动作,此动作的表达将收到激励或者惩罚,以改进Agent对环境的决策。

 

强化学习的特征:

1. Agent不是静止的、被动的等待,而是主动对环境做出试探;

2. 环境对试探动作反馈的信息是评价性的;

3. Agent在行动-评论的环境中获得知识,改进行动方案以适应环境,达到预期目的。

 

强化学习的特点:

1. 强化学习是一种弱的学习方式,体现为:Agent通过与环境不断地试错交互来进行学习;强化信号可能是稀疏且合理延迟的;不要求(或要求较少)先验知识;

2. 强化学习是一种增量式学习,并可以在线使用;

3. 强化学习可以应用于不确定性环境;

4. 强化学习可以与监督学习、智能探索和结构控制等结合使用。

 

强化学习的基本要素:

1. 策略

2. 值函数

3. 回报函数

4.环境模型(非必需)

 

你可能感兴趣的:(总结,深度学习)