今天在sigmoid
函数中使用 numpy.exp
的时候,遇到了 RuntimeWarning: overflow encountered in exp
,看到其他人的博客里面的解决方法。
# https://www.cnblogs.com/zhhy236400/p/9873322.html
def sigmoid(inx):
if inx>=0: #对sigmoid函数的优化,避免了出现极大的数据溢出
return 1.0/(1+exp(-inx))
else:
return exp(inx)/(1+exp(inx))
作者其实说清楚了,但是我自己看得时候,总觉得不太直观,差那么一点意思。于是就自己写一下。
f ( x ) = e x f(x) = e^x f(x)=ex 的函数如下图:
x > = 0 x >= 0 x>=0 时, e x e^x ex 随 x x x 增长比较快,就很容易上溢。
对于 sigmoid 函数,
s i g m o i d = 1 1 + e − x sigmoid = \frac{1}{1 + e^{-x}} sigmoid=1+e−x1
如果在使用过程中 x < 0 x < 0 x<0 , e − x e^{-x} e−x 就非常容易上溢。
RuntimeWarning: overflow encountered in exp
和 sigmoid
本身没有关系,只和 e − x e^{-x} e−x 有关。
而
1 1 + e − x = e x e x + 1 \frac{1}{1 + e^{-x}} = \frac{e^x}{e^{x} + 1} 1+e−x1=ex+1ex
那么就可以根据 x x x 是否大于零,来选择两个公式。
但是 x < 0 x < 0 x<0 时, e x e^x ex 同样有下溢的风险。
只是 numpy
报了 warning
,而 python 没有报而已,两者并没有任何差别。
参考:
https://www.cnblogs.com/zhhy236400/p/9873322.html