tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)

tf.random_normal_initializer

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第1张图片

 

tf的GraphKeys用法

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第2张图片

 

 

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第3张图片

 

 

 

tf.reduce_mean

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第4张图片

 

 tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第5张图片

 

 

 tf.squared_difference

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第6张图片

 

 

非tf中的zip,python的zip用法

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第7张图片

 

 

非tf中的hstack,numpy的hstack用法

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第8张图片

 

 

非tf中的newaxis,numpy的newaxis用法

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第9张图片

 

 

非tf中的arange,numpy的arange用法

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第10张图片

 

 

tf.nn.relu6

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第11张图片

 

 

tf.nn.tanh

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第12张图片

 

 

tf.distributions.Normal

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第13张图片

 

 tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第14张图片

 

 

log_prob---tf.distributions.Normal

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第15张图片

 

 

熵的定义

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第16张图片

 

 

tf.clip_by_value

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第17张图片

 

 

tf.gradients

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第18张图片

 

 

二维及以上矩阵取值运算

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第19张图片

 

 

tf的softmax策略迭代与对应求导

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第20张图片

 

 

非tf中的random.choice,numpy的random.choice用法

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第21张图片

 

 

策略梯度的梯度上升问题

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第22张图片

 

 

策略表示中的softmax

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第23张图片

 

 

计算交叉熵

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第24张图片

 

 

tf.truncated normal与tf.random normal

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第25张图片

 

 

numpy的shape

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第26张图片

 

 

numpy的ravel、flatten、squeeze数据拉平

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第27张图片

 

numpy的zeros_like

tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np)_第28张图片

你可能感兴趣的:(tensorflow零起点快速入门(5) --强化学习摘录截图(tf与np))