TensorFlow的自动求导原理分析

原理:

TensorFlow使用的求导方法称为自动微分(Automatic Differentiation),它既不是符号求导也不是数值求导,而类似于将两者结合的产物。

最基本的原理就是链式法则,关键思想是在基本操作(op)的水平上应用符号求导,并保持中间结果(grad)

基本操作的符号求导定义在\tensorflow\python\ops\math_grad.py文件中,这个文件中的所有函数都用RegisterGradient装饰器包装了起来,这些函数都接受两个参数op和grad,参数op是操作,第二个参数是grad是之前的梯度。

链式求导代码:

TensorFlow的自动求导原理分析_第1张图片

举个例子:

TensorFlow的自动求导原理分析_第2张图片

TensorFlow的自动求导原理分析_第3张图片

TensorFlow的自动求导原理分析_第4张图片

TensorFlow的自动求导原理分析_第5张图片

TensorFlow的自动求导原理分析_第6张图片

TensorFlow的自动求导原理分析_第7张图片

TensorFlow的自动求导原理分析_第8张图片

TensorFlow的自动求导原理分析_第9张图片

TensorFlow的自动求导原理分析_第10张图片

TensorFlow的自动求导原理分析_第11张图片

TensorFlow的自动求导原理分析_第12张图片

TensorFlow的自动求导原理分析_第13张图片

TensorFlow的自动求导原理分析_第14张图片

补充:聊聊Tensorflow自动求导机制

自动求导机制

在即时执行模式下,Tensorflow引入tf.GradientTape()这个“求导记录器”来实现自动求导。

计算函数y(x)=x^2在x = 3时的导数:

import tensorflow as tf
#定义变量
x = tf.Variable(initial_value = 3.)

#在tf.GradientTape()的上下文内,所有计算步骤都会被记录以用于求导
with tf.GradientTape() as tape:
    #y = x^2
    y = tf.square(x)
#计算y关于x的导数(斜率,梯度)
y_grad = tape.gradient(y,x)
print([y,y_grad])

输出:

[, ]

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

你可能感兴趣的:(TensorFlow的自动求导原理分析)