Pensieve Multi_agent代码详解以及A3C强化学习代码详解

Pensieve中最主要的函数及其调用关系,及函数内容详解
下图的env是fixed_env,但是实际上是env,除了trace_index和delay,应该没有太大差别,不影响代码的理解
Pensieve Multi_agent代码详解以及A3C强化学习代码详解_第1张图片
A3C的代码结构如下图所示
Pensieve Multi_agent代码详解以及A3C强化学习代码详解_第2张图片

你可能感兴趣的:(码率控制算法,视频编解码)