Torch.Distributions.Normal正态分布函数sample出来的为什么有负数

Torch.Distributions.Normal正态分布函数sample出来的为什么有负数?

在跑SAC网络的时候发现选择动作时用到的Normal函数在sample时出现负数就感觉很奇怪。

1、首先查找函数实现方法:
找了很久找到一个良心博客,大家可以看一下:
函数实现原理

torch.normal(self.loc.expand(shape), self.scale.expand(shape))

2、查找torch.normal函数:

最后自己恍然大悟,这个sample不是sample正态分布的函数值,正态分布的函数值表示的是什么?是概率!取概率干什么,我们要的是常数值,就是按照正态分布的概率在坐标轴上取值,均值处被取的概率大一些,其他地方离均值越远取的值被取到的概率越小。

真的是傻傻分不清啊!

你可能感兴趣的:(python,深度学习,python,人工智能)