sigmoid和tanh激活函数与其导数的绘图详解

        激活函数(Activation Function)主要针对学习复杂的和非线性的函数,有着十分重要的作用,尤其是在多层神经网络中,应用非常广泛,对于线性函数,我们在前面说到的线性回归和Softmax回归,有兴趣的可以先熟悉下,便于后期更加理解非线性函数的实际意义。线性回归(Linear Regression)模型的构建和实现https://blog.csdn.net/weixin_41896770/article/details/124192672

Softmax回归模型的构建和实现(Fashion-MNIST图像分类)https://blog.csdn.net/weixin_41896770/article/details/124377665

        这两个模型都属于线性的,对于深度学习的多层叠加,如果是线性模型,不管叠加多少层,输出还是线性的,这对于学习复杂的非线性的函数来说,就显得没辙。所以这个时候我们引入了激活函数,使得神经网络可以逼近任何的非线性函数。
        常见的激活函数有(ReLU、Sigmoid、tanh[双曲正切]),这里主要讲解sigmoid和tanh以及它们的求导过程,本人将步骤画出来了,通过图片让大家看得更直观。

sigmoid和tanh激活函数与其导数的绘图详解_第1张图片

        上面是数学公式的求导过程,现在我们分别来绘制出激活函数与对应的导数的图(MXNet已包含了这些函数的绘制,可以方便调用),大家也可以不通过MXNet框架提供的函数,自己绘图来检验上面的求导是否正确,想了解更多如何绘制图形可以参看:

Python画图(直方图、多张子图、二维图形、三维图形以及图中图)https://blog.csdn.net/weixin_41896770/article/details/119798960

import d2lzh as d2l
from mxnet import autograd,nd

#定义一个绘图函数
def xyplot(x,y,n):
    d2l.set_figsize(figsize=(5,2.5))
    d2l.plt.plot(x.asnumpy(),y.asnumpy())
    d2l.plt.xlabel('x')
    d2l.plt.ylabel(n+'(x)')
#sigmoid函数
x=nd.arange(-10,10,0.1)
y=x.sigmoid()
xyplot(x,y,'sigmoid')

sigmoid和tanh激活函数与其导数的绘图详解_第2张图片

#sigmoid导数
x=nd.arange(-10,10,0.1)
x.attach_grad()
with autograd.record():
    y=x.sigmoid()
y.backward()
xyplot(x,x.grad,'grad of sigmoid')

sigmoid和tanh激活函数与其导数的绘图详解_第3张图片

#tanh函数
x=nd.arange(-10,10,0.1)
y=x.tanh()
xyplot(x,y,'tanh')

sigmoid和tanh激活函数与其导数的绘图详解_第4张图片

tanh函数看起来和sigmoid长的特别像,区别在于tanh函数是关于原点对称

#tanh导数
x=nd.arange(-10,10,0.1)
x.attach_grad()
with autograd.record():
    y=x.tanh()
y.backward()
xyplot(x,x.grad,'grad of tanh')

sigmoid和tanh激活函数与其导数的绘图详解_第5张图片

你可能感兴趣的:(深度学习框架(MXNet),sigmoid与求导,tanh与求导,激活函数)