edward_zcl

灵活使用Tensorflow执行梯度下降算法

之前写过有关tensorflow中各种梯度的意义了，这里结合一下梯度下降算法，讲一下如何使用tensorflow进行相关梯度下降算法的实验。

还是再啰嗦一遍吧。。嫌不够仔细的可以参见：
https://blog.csdn.net/edward_zcl/article/details/90345318

声明：

参考官方文档
参考tensorflow学习笔记（三十）
关于神经网络中的梯度计算，推荐吴恩达的deeplearning公开课

tf.gradients()

在tensorflow中，tf.gradients()的参数如下：

tf.gradients(ys, xs, 
             grad_ys=None, 
             name='gradients',
             colocate_gradients_with_ops=False,
             gate_gradients=False,
             aggregation_method=None,
             stop_gradients=None)

先不给出参数的意义~

对求导函数而言，其主要功能即求导公式：∂y∂x都是tensor。

更进一步，tf.gradients()接受求导值ys和xs不仅可以是tensor，还可以是list，形如[tensor1, tensor2, …, tensorn]。当ys和xs都是list时，它们的求导关系为：

gradients() adds ops to the graph to output the derivatives of ys with respect to xs. It returns a list of Tensor of length len(xs) where each tensor is the sum(dy/dx) for y in ys.

意思是：

tf.gradients()实现ys对xs求导
求导返回值是一个list，list的长度等于len(xs)
假设返回值是[grad1, grad2, grad3]，ys=[y1, y2]，xs=[x1, x2, x3]。则，真实的计算过程为:

基础实践

以线性回归为例，实践tf.gradients()的基础功能。线性回归：y=3×x+2

import numpy as np
import tensorflow as tf


sess = tf.Session()

x_input = tf.placeholder(tf.float32, name='x_input')
y_input = tf.placeholder(tf.float32, name='y_input')
w = tf.Variable(2.0, name='weight')
b = tf.Variable(1.0, name='biases')
y = tf.add(tf.multiply(x_input, w), b)
loss_op = tf.reduce_sum(tf.pow(y_input - y, 2)) / (2 * 32)
train_op = tf.train.GradientDescentOptimizer(0.01).minimize(loss_op)

'''tensorboard'''
# gradients_node = tf.gradients(loss_op, w)
# print(gradients_node)
# tf.summary.scalar('norm_grads', gradients_node)
# tf.summary.histogram('norm_grads', gradients_node)
# merged = tf.summary.merge_all()
# writer = tf.summary.FileWriter('log')

init = tf.global_variables_initializer()
sess.run(init)

'''构造数据集'''
x_pure = np.random.randint(-10, 100, 32)
x_train = x_pure + np.random.randn(32) / 10  # 为x加噪声
y_train = 3 * x_pure + 2 + np.random.randn(32) / 10  # 为y加噪声

for i in range(20):
    _, gradients, loss = sess.run([train_op, gradients_node, loss_op],
                                  feed_dict={x_input: x_train[i], y_input: y_train[i]})
    print("epoch: {} \t loss: {} \t gradients: {}".format(i, loss, gradients))

sess.close()

输出：

epoch: 0     loss: 94.6083221436     gradients: [-187.66052]
epoch: 1     loss: 1.52120530605     gradients: [3.0984864]
epoch: 2     loss: 101.41834259      gradients: [241.91911]
...
epoch: 18    loss: 0.0215022582561   gradients: [-0.44370675]
epoch: 19    loss: 0.0189439821988   gradients: [-0.31349587]

可以看到梯度逐渐减小，说明模型逐渐收敛。同时也可以看到参数更新的方向主要是梯度下降的方向（尽管伴随着震荡）。

其他参数

其他参数都不太常用(其实是比较难用)。

grad_ys

grad_ys也是一个list，其长度等于len(ys)。这个参数的意义在于对xs中的每个元素的求导加权种。

假设grad_ys=[grad_ys1, grad_ys2, grad_ys3]，xs=[x1, x2, x3]，则list中每个元素，如grad_ys1的shape与xs的shape相同。

举个简单的例子：

import tensorflow as tf

w1 = tf.get_variable('w1', shape=[3])
w2 = tf.get_variable('w2', shape=[3])

w3 = tf.get_variable('w3', shape=[3])
w4 = tf.get_variable('w4', shape=[3])

z1 = 3 * w1 + 2 * w2+ w3
z2 = -1 * w3 + w4

grads = tf.gradients([z1, z2], [w1, w2, w3, w4], grad_ys=[[-2.0, -3.0, -4.0], [-2.0, -3.0, -4.0]])

with tf.Session() as sess:
    tf.global_variables_initializer().run()
    print(sess.run(grads))

如果不考虑参数grad_ys，输出应该是:

[array([ 3.,  3.,  3.], dtype=float32), 
array([ 2.,  2.,  2.], dtype=float32), 
array([ 0.,  0.,  0.], dtype=float32), 
array([ 1.,  1.,  1.], dtype=float32)]

现在在权重参数grad_ys = [[-2.0, -3.0, -4.0], [-2.0, -3.0, -4.0]]的加权下，输出实际为：

[array([ -6.,  -9., -12.], dtype=float32),
array([-4., -6., -8.], dtype=float32), 
array([0., 0., 0.], dtype=float32), 
array([-2., -3., -4.], dtype=float32)]

stop_gradients

stop_gradients也是一个list，list中的元素是tensorflow graph中的op，一旦进入这个list，将不会被计算梯度，更重要的是，在该op之后的BP计算都不会运行。

例如：

a = tf.constant(0.)
b = 2 * a
c = a + b
g = tf.gradients(c, [a, b])

计算得g = [3.0, 1.0]。因为∂c∂a=∂a∂a+∂b∂a=3.0

但如果冻结operator a和b的梯度计算：

a = tf.constant(0.)
b = 2 * a
g = tf.gradients(a + b, [a, b], stop_gradients=[a, b])

计算得g=[1.0, 1.0]。

上面的代码也等效于：

a = tf.stop_gradient(tf.constant(0.))
b = tf.stop_gradient(2 * a)
g = tf.gradients(a + b, [a, b])

接下来借助tensorflow来介绍一下梯度下降算法，这是目前深度学习的核心算法。
参考：
https://blog.csdn.net/flyfish1986/article/details/79128424

嗯。。说白了就是设定一个损失函数，对所有系数(变量)求解梯度，借助于tensorflow强大的计算图，大量使用链式法则，全导数，以及各种矩阵对矩阵的求导等等，然后再借助SGD及其其变体最小化算法，去利用得到的梯度修改那些系数(变量)，使得损失函数最小化。。

这里着重介绍一下另外一种更灵活的用法。实现手动或者自动梯度下降算法。
参考：
https://blog.csdn.net/huqinweI987/article/details/82899910

tensorflow中提供了自动训练机制（见tensorflow optimizer minimize 自动训练和var_list训练限制），本文主要展现不同的自动梯度下降并附加手动实现。

learning rate、step、计算公式如下：

在预测中，x是关于y的变量，但是在train中，w是L的变量，x是不可能变化的。所以，知道为什么weights叫Variable了吧（强行瞎解释一发）

下面用tensorflow手动实现梯度下降:

为了方便写公式，下边的代码改了变量的命名，采用loss、prediction、gradient、weight、y、x等首字母表示，η表示学习率,w0、w1、w2等表示第几次迭代时w的值，不是多个变量。

loss=(y-p)^2=(y-w*x)^2=(y^2-2*y*w*x+w^2*x^2)

dl/dw = 2*w*x^2-2*y*x

代入梯度下降公式w1=w0-η*dL/dw|w=w0

w1 = w0-η*dL/dw|w=w0

w2 = w1 - η*dL/dw|w=w1

w3 = w2 - η*dL/dw|w=w2

初始：y=3,x=1,w=2,l=1,dl/dw=-2,η=1

更新：w=4

更新：w=2

更新：w=4

所以，本例x=1,y=3，dl/dw巧合的等于2w-2y，也就是二倍的prediction和label的差距。learning rate=1会导致w围绕正确的值来回徘徊，完全不收敛，这样写主要是方便演示计算。改小learning rate 并增加循环次数就能收敛了。

学习率大的话，大概就是这个效果

手动实现梯度下降Gradient Descent：


   
   
   
   
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #demo4:manual gradient descent in tensorflow
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #y label
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       y = tf.constant(
       
       
       
       3,dtype = tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       x = tf.placeholder(dtype = tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       w = tf.Variable(
       
       
       
       2,dtype=tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #prediction
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       p = w*x
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #define losses
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       l = tf.square(p - y)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       g = tf.gradients(l, w)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       learning_rate = tf.constant(
       
       
       
       1,dtype=tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #learning_rate = tf.constant(0.11,dtype=tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       init = tf.global_variables_initializer()
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #update
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       update = tf.assign(w, w - learning_rate * g[
       
       
       
       0])
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       with tf.Session() 
       
       
       
       as sess:
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
           sess.run(init)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
           print(sess.run([g,p,w], {x: 
       
       
       
       1}))
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
          
       
       
       
       for _ 
       
       
       
       in range(
       
       
       
       5):
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               w_,g_,l_ = sess.run([w,g,l],feed_dict={x:
       
       
       
       1})
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               print(
       
       
       
       'variable is w:',w_, 
       
       
       
       ' g is ',g_,
       
       
       
       '  and the loss is ',l_)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               _ = sess.run(update,feed_dict={x:
       
       
       
       1})

结果：

learning rate=1


   
   
   
   
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       [[
       
       
       
       -2.0], 
       
       
       
       2.0, 
       
       
       
       2.0]
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.0  g 
       
       
       
       is  [
       
       
       
       -2.0]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.0
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       4.0  g 
       
       
       
       is  [
       
       
       
       2.0]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.0
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.0  g 
       
       
       
       is  [
       
       
       
       -2.0]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.0
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       4.0  g 
       
       
       
       is  [
       
       
       
       2.0]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.0
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.0  g 
       
       
       
       is  [
       
       
       
       -2.0]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.0

缩小learning rate


   
   
   
   
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9964619  g 
       
       
       
       is  [
       
       
       
       -0.007575512]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.4347095e-05
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.996695  g 
       
       
       
       is  [
       
       
       
       -0.0070762634]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.2518376e-05
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.996913  g 
       
       
       
       is  [
       
       
       
       -0.0066099167]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.0922749e-05
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9971166  g 
       
       
       
       is  [
       
       
       
       -0.0061740875]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       9.529839e-06
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9973066  g 
       
       
       
       is  [
       
       
       
       -0.0057668686]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       8.314193e-06
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9974842  g 
       
       
       
       is  [
       
       
       
       -0.0053868294]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       7.2544826e-06
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9976501  g 
       
       
       
       is  [
       
       
       
       -0.0050315857]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       6.3292136e-06
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.997805  g 
       
       
       
       is  [
       
       
       
       -0.004699707]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       5.5218115e-06
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9979498  g 
       
       
       
       is  [
       
       
       
       -0.004389763]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       4.8175043e-06
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.998085  g 
       
       
       
       is  [
       
       
       
       -0.0041003227]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       4.2031616e-06
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9982114  g 
       
       
       
       is  [
       
       
       
       -0.003829956]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       3.6671408e-06
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9983294  g 
       
       
       
       is  [
       
       
       
       -0.0035772324]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       3.1991478e-06

SGD：

注意，tensorflow中没有SGD（Stochastic Gradient Descent）这种梯度下降算法接口，SGD更像是一个喂数据的策略，而不是具体训练方法，按吴恩达教程，严格的说，SGD甚至一次只能训练一个样本，实际常见的更多是多个样本的mini-batch，只要喂数据的时候随机化就算是SGD（mini-batch）了。

Momentum梯度下降：

链接：Gradient Descent、Momentum、Nesterov的实现及直觉对比


   
   
   
   
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #demo5.2 tensorflow momentum
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       y = tf.constant(
       
       
       
       3,dtype = tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       x = tf.placeholder(dtype = tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       w = tf.Variable(
       
       
       
       2,dtype=tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #prediction
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       p = w*x
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #define losses
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       l = tf.square(p - y)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       g = tf.gradients(l, w)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       Mu = 
       
       
       
       0.8
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       LR = tf.constant(
       
       
       
       0.01,dtype=tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       init = tf.group(tf.global_variables_initializer(),tf.local_variables_initializer())
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #update w
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       update = tf.train.MomentumOptimizer(LR, Mu).minimize(l)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       with tf.Session() 
       
       
       
       as sess:
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
           sess.run(init)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
           sess.run(tf.global_variables_initializer())
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
           sess.run(tf.local_variables_initializer())
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
           print(sess.run([g,p,w], {x: 
       
       
       
       1}))
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
          
       
       
       
       for _ 
       
       
       
       in range(
       
       
       
       10):
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               w_,g_,l_ = sess.run([w,g,l],feed_dict={x:
       
       
       
       1})
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               print(
       
       
       
       'variable is w:',w_, 
       
       
       
       ' g is ',g_, 
       
       
       
       '  and the loss is ',l_)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               sess.run([update],feed_dict={x:
       
       
       
       1})

这是前几次迭代的数据，注意看，和下边的手动实现做对比


   
   
   
   
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.0  g 
       
       
       
       is  [
       
       
       
       -2.0]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.0
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.02  g 
       
       
       
       is  [
       
       
       
       -1.96]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.96040004
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.0556  g 
       
       
       
       is  [
       
       
       
       -1.8888001]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.8918915
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.102968  g 
       
       
       
       is  [
       
       
       
       -1.794064]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.80466646
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.158803  g 
       
       
       
       is  [
       
       
       
       -1.682394]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.7076124
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.220295  g 
       
       
       
       is  [
       
       
       
       -1.5594101]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.60793996
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.2850826  g 
       
       
       
       is  [
       
       
       
       -1.4298348]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.5111069
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.351211  g 
       
       
       
       is  [
       
       
       
       -1.2975779]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.42092708
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.4170897  g 
       
       
       
       is  [
       
       
       
       -1.1658206]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.3397844
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.4814508  g 
       
       
       
       is  [
       
       
       
       -1.0370984]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.26889327

下边是手动实现的，这里边有个速度v，是根据每一步的梯度累加的（注意，两步update必须分开执行，不能用tf.group）


   
   
   
   
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #demo5.2:manual momentum in tensorflow
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       y = tf.constant(
       
       
       
       3,dtype = tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       x = tf.placeholder(dtype = tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       w = tf.Variable(
       
       
       
       2,dtype=tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #prediction
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       p = w*x
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #define losses
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       l = tf.square(p - y)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       g = tf.gradients(l, w)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       Mu = 
       
       
       
       0.8
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       LR = tf.constant(
       
       
       
       0.01,dtype=tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #v = tf.Variable(0,tf.float32)#error?secend param is not dtype?
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       v = tf.Variable(
       
       
       
       0,dtype = tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       init = tf.global_variables_initializer()
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #update w
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       update1 = tf.assign(v, Mu * v + g[
       
       
       
       0] * LR )
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       update2 = tf.assign(w, w - v)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #update = tf.group(update1,update2)#wrong sequence!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       with tf.Session() 
       
       
       
       as sess:
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
           sess.run(init)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
           print(sess.run([g,p,w], {x: 
       
       
       
       1}))
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
          
       
       
       
       for _ 
       
       
       
       in range(
       
       
       
       10):
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               w_,g_,l_,v_ = sess.run([w,g,l,v],feed_dict={x:
       
       
       
       1})
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               print(
       
       
       
       'variable is w:',w_, 
       
       
       
       ' g is ',g_, 
       
       
       
       ' v is ',v_,
       
       
       
       '  and the loss is ',l_)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               _ = sess.run([update1],feed_dict={x:
       
       
       
       1})
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               _ = sess.run([update2],feed_dict={x:
       
       
       
       1})

注意看前边这组数据，和tf自动实现的是一样的。


   
   
   
   
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.0  g 
       
       
       
       is  [
       
       
       
       -2.0]  v 
       
       
       
       is  
       
       
       
       0.0   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.0
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.0  g 
       
       
       
       is  [
       
       
       
       -2.0]  v 
       
       
       
       is  
       
       
       
       -0.02   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.0
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.02  g 
       
       
       
       is  [
       
       
       
       -1.96]  v 
       
       
       
       is  
       
       
       
       -0.0356   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.96040004
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.0556  g 
       
       
       
       is  [
       
       
       
       -1.8888001]  v 
       
       
       
       is  
       
       
       
       -0.047367997   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.8918915
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.102968  g 
       
       
       
       is  [
       
       
       
       -1.794064]  v 
       
       
       
       is  
       
       
       
       -0.05583504   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.80466646
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.158803  g 
       
       
       
       is  [
       
       
       
       -1.682394]  v 
       
       
       
       is  
       
       
       
       -0.06149197   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.7076124
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.220295  g 
       
       
       
       is  [
       
       
       
       -1.5594101]  v 
       
       
       
       is  
       
       
       
       -0.06478768   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.60793996
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.2850826  g 
       
       
       
       is  [
       
       
       
       -1.4298348]  v 
       
       
       
       is  
       
       
       
       -0.06612849   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.5111069
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.351211  g 
       
       
       
       is  [
       
       
       
       -1.2975779]  v 
       
       
       
       is  
       
       
       
       -0.06587857   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.42092708
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.4170897  g 
       
       
       
       is  [
       
       
       
       -1.1658206]  v 
       
       
       
       is  
       
       
       
       -0.06436106   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.3397844


   
   
   
   
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999995  g 
       
       
       
       is  [
       
       
       
       -9.536743e-07]  v 
       
       
       
       is  
       
       
       
       -4.7683734e-08   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       2.2737368e-13
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999995  g 
       
       
       
       is  [
       
       
       
       -9.536743e-07]  v 
       
       
       
       is  
       
       
       
       -4.7683734e-08   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       2.2737368e-13
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999995  g 
       
       
       
       is  [
       
       
       
       -9.536743e-07]  v 
       
       
       
       is  
       
       
       
       -4.7683734e-08   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       2.2737368e-13
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999995  g 
       
       
       
       is  [
       
       
       
       -9.536743e-07]  v 
       
       
       
       is  
       
       
       
       -4.7683734e-08   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       2.2737368e-13
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999995  g 
       
       
       
       is  [
       
       
       
       -9.536743e-07]  v 
       
       
       
       is  
       
       
       
       -4.7683734e-08   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       2.2737368e-13

接下来是adagrad的例子：

adagrad有点使用Hessian矩阵的意思，不过用的是近似二次导数，因为真求出二次导数，在深度学习中代价还是很大的。


   
   
   
   
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #demo6:adagrad optimizer in tensorflow
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       y = tf.constant(
       
       
       
       3,dtype = tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       x = tf.placeholder(dtype = tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       w = tf.Variable(
       
       
       
       2,dtype=tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #prediction
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       p = w*x
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #define losses
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       l = tf.square(p - y)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       g = tf.gradients(l, w)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       LR = tf.constant(
       
       
       
       0.6,dtype=tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       optimizer = tf.train.AdagradOptimizer(LR)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       update = optimizer.minimize(l)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       init = tf.global_variables_initializer()
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       with tf.Session() 
       
       
       
       as sess:
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
           sess.run(init)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
          
       
       
       
       #print(sess.run([g,p,w], {x: 1}))
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
          
       
       
       
       for _ 
       
       
       
       in range(
       
       
       
       20):
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               w_,l_,g_ = sess.run([w,l,g],feed_dict={x:
       
       
       
       1})
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               print(
       
       
       
       'variable is w:',w_, 
       
       
       
       'g:',g_ ,
       
       
       
       '  and the loss is ',l_)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               _ = sess.run(update,feed_dict={x:
       
       
       
       1})

手动实现adagrad的例子（注意，两步update必须分开执行，不能用tf.group）

可以用依赖关系。


   
   
   
   
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #demo6.2:manual adagrad
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #with tf.name_scope('initial'):
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       y = tf.constant(
       
       
       
       3,dtype = tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       x = tf.placeholder(dtype=tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       w = tf.Variable(
       
       
       
       2,dtype=tf.float32,expected_shape=[
       
       
       
       1])
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       second_derivative = tf.Variable(
       
       
       
       0,dtype=tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       LR = tf.constant(
       
       
       
       0.6,dtype=tf.float32)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       Regular = 
       
       
       
       1e-8
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #prediction
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       p = w*x
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #loss
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       l = tf.square(p - y)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #gradients
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       g = tf.gradients(l, w)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #print(g)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #print(tf.square(g))
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #update
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       update1 = tf.assign_add(second_derivative,tf.square(g[
       
       
       
       0]))
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       g_final = LR * g[
       
       
       
       0] / (tf.sqrt(second_derivative) + Regular)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       update2 = tf.assign(w, w - g_final)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       #update = tf.assign(w, w - LR * g[0])
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       init = tf.global_variables_initializer()
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       with tf.Session() 
       
       
       
       as sess:
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
           sess.run(init)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
           print(sess.run([g,p,w], {x: 
       
       
       
       1}))
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
          
       
       
       
       for _ 
       
       
       
       in range(
       
       
       
       20):
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               _ = sess.run(update1,feed_dict={x:
       
       
       
       1.0})
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               w_,g_,l_,g_sec_ = sess.run([w,g,l,second_derivative],feed_dict={x:
       
       
       
       1.0})
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               print(
       
       
       
       'variable is w:',w_, 
       
       
       
       ' g is ',g_,
       
       
       
       ' g_sec_ is ',g_sec_,
       
       
       
       '  and the loss is ',l_)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
              
       
       
       
       #sess.run(g_final)
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
               _ = sess.run(update2,feed_dict={x:
       
       
       
       1.0})

结果接近，可惜不完全一样，我也不知道optimizer中的参数都是多少，有没有正则化，太不透明了。


   
   
   
   
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       [[
       
       
       
       -2.0], 
       
       
       
       2.0, 
       
       
       
       2.0]
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.0  g 
       
       
       
       is  [
       
       
       
       -2.0]  g_sec_ 
       
       
       
       is  
       
       
       
       0.0   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.0
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.6  g 
       
       
       
       is  [
       
       
       
       -0.8000002]  g_sec_ 
       
       
       
       is  
       
       
       
       4.0   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.16000007
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.8228343  g 
       
       
       
       is  [
       
       
       
       -0.3543315]  g_sec_ 
       
       
       
       is  
       
       
       
       4.6400003   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.0313877
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.920222  g 
       
       
       
       is  [
       
       
       
       -0.15955591]  g_sec_ 
       
       
       
       is  
       
       
       
       4.765551   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.006364522
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9639592  g 
       
       
       
       is  [
       
       
       
       -0.072081566]  g_sec_ 
       
       
       
       is  
       
       
       
       4.791009   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.0012989381
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9837074  g 
       
       
       
       is  [
       
       
       
       -0.032585144]  g_sec_ 
       
       
       
       is  
       
       
       
       4.7962046   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.0002654479
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9926338  g 
       
       
       
       is  [
       
       
       
       -0.014732361]  g_sec_ 
       
       
       
       is  
       
       
       
       4.7972665   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       5.4260614e-05
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9966695  g 
       
       
       
       is  [
       
       
       
       -0.0066609383]  g_sec_ 
       
       
       
       is  
       
       
       
       4.7974834   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.1092025e-05
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9984941  g 
       
       
       
       is  [
       
       
       
       -0.0030117035]  g_sec_ 
       
       
       
       is  
       
       
       
       4.797528   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       2.2675895e-06
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.999319  g 
       
       
       
       is  [
       
       
       
       -0.0013618469]  g_sec_ 
       
       
       
       is  
       
       
       
       4.797537   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       4.6365676e-07
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9996922  g 
       
       
       
       is  [
       
       
       
       -0.0006155968]  g_sec_ 
       
       
       
       is  
       
       
       
       4.7975388   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       9.4739846e-08
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9998608  g 
       
       
       
       is  [
       
       
       
       -0.0002784729]  g_sec_ 
       
       
       
       is  
       
       
       
       4.797539   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.9386789e-08
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.999937  g 
       
       
       
       is  [
       
       
       
       -0.00012588501]  g_sec_ 
       
       
       
       is  
       
       
       
       4.797539   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       3.961759e-09
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999716  g 
       
       
       
       is  [
       
       
       
       -5.6743622e-05]  g_sec_ 
       
       
       
       is  
       
       
       
       4.797539   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       8.0495965e-10
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999871  g 
       
       
       
       is  [
       
       
       
       -2.5749207e-05]  g_sec_ 
       
       
       
       is  
       
       
       
       4.797539   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.6575541e-10
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999943  g 
       
       
       
       is  [
       
       
       
       -1.1444092e-05]  g_sec_ 
       
       
       
       is  
       
       
       
       4.797539   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       3.274181e-11
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999974  g 
       
       
       
       is  [
       
       
       
       -5.2452087e-06]  g_sec_ 
       
       
       
       is  
       
       
       
       4.797539   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       6.8780537e-12
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999988  g 
       
       
       
       is  [
       
       
       
       -2.3841858e-06]  g_sec_ 
       
       
       
       is  
       
       
       
       4.797539   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.4210855e-12
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999995  g 
       
       
       
       is  [
       
       
       
       -9.536743e-07]  g_sec_ 
       
       
       
       is  
       
       
       
       4.797539   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       2.2737368e-13
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999998  g 
       
       
       
       is  [
       
       
       
       -4.7683716e-07]  g_sec_ 
       
       
       
       is  
       
       
       
       4.797539   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       5.684342e-14
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
       
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.0 g: [
       
       
       
       -2.0]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.0
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.5926378 g: [
       
       
       
       -0.81472445]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.16594398
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.816606 g: [
       
       
       
       -0.3667879]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.033633344
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9160419 g: [
       
       
       
       -0.1679163]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.0070489706
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9614334 g: [
       
       
       
       -0.07713318]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.0014873818
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9822717 g: [
       
       
       
       -0.035456657]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       0.00031429363
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9918494 g: [
       
       
       
       -0.016301155]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       6.6431916e-05
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9962525 g: [
       
       
       
       -0.0074949265]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.404348e-05
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.998277 g: [
       
       
       
       -0.0034461021]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       2.968905e-06
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9992077 g: [
       
       
       
       -0.0015845299]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       6.2768373e-07
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9996357 g: [
       
       
       
       -0.0007286072]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.327171e-07
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9998324 g: [
       
       
       
       -0.00033521652]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       2.809253e-08
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.999923 g: [
       
       
       
       -0.0001540184]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       5.930417e-09
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999645 g: [
       
       
       
       -7.104874e-05]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.2619807e-09
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999835 g: [
       
       
       
       -3.2901764e-05]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       2.7063152e-10
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999924 g: [
       
       
       
       -1.5258789e-05]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       5.820766e-11
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999964 g: [
       
       
       
       -7.1525574e-06]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       1.2789769e-11
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999983 g: [
       
       
       
       -3.33786e-06]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       2.7853275e-12
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999993 g: [
       
       
       
       -1.4305115e-06]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       5.1159077e-13
      
      
      
      
     
     
     
     
    
    
    
    
     
     
     
     
      
      
      
      
     
     
     
     
     
     
     
     
      
      
      
      
       
       
       
       variable 
       
       
       
       is w: 
       
       
       
       2.9999998 g: [
       
       
       
       -4.7683716e-07]   
       
       
       
       and the loss 
       
       
       
       is  
       
       
       
       5.684342e-14

这个例子只供演示，真正体现Adagrad优势的，还得是多参数情形，单参数用Adagrad不能显现很大优势，Adagrad的一大优点，是能协调不同参数的学习速率，每个参数都被自己的“二次微分”约束，最后就公平了。

源码

进行梯度下降之后，其实对于计算机而言，可能还会有一些问题，比如数值计算问题，数值精度问题，无穷大无穷小以及loss的NaN问题等等。

除此之外，以防万一自己写错，或者调试监测方便的目的，一般会设置梯度检查，生成tensorboard或者log日志，打印相关信息等。

参考：机器学习算法的调试 —— 梯度检验（Gradient Checking）
https://blog.csdn.net/lanchunhui/article/details/51279293

你可能感兴趣的:(人工智能-神经网络)

千万年薪招揽AI大牛！罗福莉加盟小米，将如何改变其大模型战略？前端
近年来，人工智能(AI)领域发展迅速，其中大模型技术的突破更是引领着新一轮科技浪潮。AI代码生成器作为AI技术的重要应用，也正逐渐改变着软件开发的模式。1月18日，一则重磅消息震惊业界：DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米，并可能领导小米大模型团队，年薪高达千万级别。这一举动不仅体现了小米对AI大模型技术的重视，也预示着小米在大模型领域的战略布局将迎来新
Python数据分析与可视化研究阿尔法星球 python python 数据分析开发语言
Python数据分析与可视化研究摘要随着大数据和人工智能技术的飞速发展，Python数据分析与可视化技术已成为现代科学研究、企业决策等领域不可或缺的工具。本研究全面梳理了Python在数据分析与可视化领域的基本理论框架和关键技术，系统分析了Pandas、NumPy等核心数据分析库以及Matplotlib、Seaborn等可视化库的应用优势与特点。通过实际案例，本研究深入探讨了Python在数据清洗
【AIGC半月报】AIGC大模型启元：2024.07（上） LeeZhao@ AIGC 人工智能 AI Agent
AIGC大模型启元：2024.07（上）(1)AIGVBench-T2V（文生视频基准测评）(2)Gen-3Alpha（Runway）(3)Step-2、Step-1.5V、Step-1X（阶跃星辰开源大模型）(4)InternVL2.0“书生·万象”（上海人工智能实验室）(5)CodeGeeX4-ALL-9B（智谱AI）(6)TTT（全新LLM架构）(1)AIGVBench-T2V（文生视频基准
认知的形式化：数学是建立在明确的公设定理体系之上的高级语言形态 AI架构设计之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
认知形式化，数学语言，公设理体系，高级语言，人工智能，逻辑推理，算法设计1.背景介绍在当今数据爆炸和人工智能飞速发展的时代，如何有效地理解和处理信息成为了一个至关重要的课题。认知科学、人工智能和计算机科学等领域都在积极探索如何将人类的认知能力形式化，并将其转化为可计算的模型。数学作为一种高度抽象和形式化的语言，在认知科学和人工智能领域扮演着至关重要的角色。它为我们提供了描述和推理世界的逻辑框架，并
【cs.AI】25.1.11 arxiv更新速递 hinmer arxiv cs.AI每日更新 chatgpt gpt 人工智能自然语言处理自动驾驶深度学习 aigc
25.1.1012:00-25.1.1112:00共更新75篇—第1篇----=====MultilingualPerformanceofaMultimodalArtificialIntelligenceSystemonMultisubjectPhysicsConceptInventories关键词:多语言,多模态,人工智能,GPT-4,物理教育,物理概念清单链接1摘要:我们研究了一种基于大型语言
【LLM】25.1.11 Arxiv LLM论文速递 hinmer arxiv LLM每日更新 chatgpt gpt 人工智能自然语言处理 ai aigc 深度学习
25.1.1012:00-25.1.1112:00共更新36篇—第1篇----=====Supervisionpoliciescanshapelong-termriskmanagementingeneral-purposeAImodels关键词:通用型人工智能，风险管理，监督政策，模拟框架PDF链接摘要:通用型人工智能（GPAI）模型，包括大型语言模型（LLM）的快速普及和部署，给AI监管实体带来
AI需要的基础数学知识大囚长机器学习大模型人工智能
AI（人工智能）涉及多个数学领域，以下是主要的基础数学知识：1.线性代数矩阵与向量：用于表示数据和模型参数。矩阵乘法：用于神经网络的前向传播。特征值与特征向量：用于降维和主成分分析（PCA）。奇异值分解（SVD）：用于数据压缩和降维。2.微积分导数与偏导数：用于优化算法（如梯度下降）。链式法则：用于反向传播算法。积分：在概率和统计中有应用。3.概率与统计概率分布：如高斯分布、伯努利分布等。贝叶斯定
云游戏一二事大囚长运维人生游戏世界游戏
云游戏让CDN边缘计算加速发展，边缘计算节点越来越类似于神经网络的终端节点，AI人类大脑正在加速形成。云游戏就是元宇宙的前站和先锋。云游戏解决了哪些痛点：1.终端成本高玩家购买高端主机设备来适应游戏不断提升的硬件要求，极大程度地加重了玩家成本2.游戏包越来越大，下载安装成本高游戏画面越来越精细的同时也带来了不断膨胀的游戏包体，给游戏存储与推广都带来了更大的压力和成本3.游戏无法在多种终端间自由切换
【包邮送书】你好！Python Mindtechnist 粉丝福利 python 网络开发语言机器学习
欢迎关注博主Mindtechnist或加入【智能科技社区】一起学习和分享Linux、C、C++、Python、Matlab，机器人运动控制、多机器人协作，智能优化算法，滤波估计、多传感器信息融合，机器学习，人工智能等相关领域的知识和技术。关注公粽号《机器和智能》回复关键词“python项目实战”即可获取美哆商城视频资源！博主介绍：CSDN博客专家，CSDN优质创作者，CSDN实力新星，CSDN内容
人工智能与人工计算的发展——孙凝晖院士一位安分的码农大语言模型人工智能
人工智能领域近年来正在迎来一场由生成式人工智能大模型引领的爆发式发展。2022年11月30日，OpenAI公司推出一款人工智能对话聊天机器人ChatGPT，其出色的自然语言生成能力引起了全世界范围的广泛关注，2个月突破1亿用户，国内外随即掀起了一场大模型浪潮，Gemini、文心一言、Copilot、LLaMA、SAM、SORA等各种大模型如雨后春笋般涌现，2022年也被誉为大模型元年。当前信息时代
AI时代，需要怎样的架构师？腾讯云架构师峰会来了！架构
引言架构设计对应用有关键性的影响，不仅决定应用的整体品质，还直接影响开发、维护和扩展的难易度。卓越的架构设计不仅能够确保系统的稳定性、高效性和可扩展性，还能大幅提升研发效能，同时显著降低维护成本。在快速变化的技术环境中，架构师们面临业务需求快速迭代、数据量急剧膨胀以及系统复杂性不断提升等挑战。随着云计算、大数据、人工智能等前沿技术的蓬勃发展，一系列创新解决方案如微服务架构、AI大模型、自动化运维工
算法中的时间复杂度和空间复杂度 CM莫问人工智能算法常见概念算法人工智能 python 时间复杂度空间复杂度
一、背景随着人工智能的纵深发展，我们会发现现在做算法很多时候都是通过掉包来解决问题了。Torch或者Tensorflow之类的深度学习库大大减少了算法工程师的工作量，而且在张量运算、反向传播等环节，这些深度学习库的模块设计也尽最大可能地降低了计算的时间和空间复杂度，从而不需要我们额外进行过多的干预。如果不是科班读计算机相关专业的，相信不少朋友第一次听说时间复杂度和空间复杂度的概念是在找工作刷lee
Anthropic 正计划为其聊天机器人 Claude 推出“双向语音模式”和一个新的记忆功能新加坡内哥谈技术人工智能深度学习机器人科技
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/Anthropic正计划为其聊天机器人Claude推出“双向语音模式”和一个新的记忆功能
DeepMind的新突破：GenCast 新加坡内哥谈技术人工智能大数据语言模型
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/如今，人工智能（AI）在天气预报领域的表现已经可以与传统计算方法媲美。然而，AI模型的训
AI跟踪报道第62期-本周AI新闻: 微软推出Copilot的AI Agent和Computer Control 新加坡内哥谈技术人工智能 copilot 大数据
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/油管视频:https://youtu.be/_Egli1MlVWk?si=DIjVm2l
使用神经网络做二分类预测 weixin_33816300 人工智能 python matlab
不想整理代码了。先给个结果图：train0loss:1838.0616train100loss:1441.5283train200loss:1299.4546train300loss:934.36536train400loss:506.06702train500loss:322.9782train600loss:271.5825train700loss:360.091train800loss:23
360智算中心万卡GPU集群架构分析科技互联人生科技数码人工智能硬件架构系统架构人工智能
360智算中心：万卡GPU集群落地实践 360智算中心是一个融合了人工智能、异构计算、大数据、高性能网络、AI平台等多种技术的综合计算设施，旨在为各类复杂的AI计算任务提供高效、智能化的算力支持。360智算中心不仅具备强大的计算和数据处理能力，还结合了AI开发平台，使得计算资源的使用更加高效和智能化。360内部对于智算中心的核心诉求是性能和稳定性，本文将深入探讨3
AI赋能电商：从个性化推荐到智能化运营 w(ﾟДﾟ)w吓洗宝宝了当下编程领域的分析大数据人工智能
引言随着互联网技术的飞速发展，电子商务已经成为人们日常生活的重要组成部分。然而，在激烈的市场竞争中，如何提升销售效率和用户体验成为了电商平台面临的主要挑战。近年来，人工智能（AI）技术的迅猛发展为这一挑战提供了新的解决方案。从个性化推荐到会员分类，从商品定价到供应链管理，AI技术的应用不仅提高了电商平台的运营效率，还极大地提升了用户的购物体验。本文将深入探讨AI技术在电商领域的多种应用场景，分析其
Neural Architecture Search (NAS) 原理和应用 weixin_58349913 python
NeuralArchitectureSearch(NAS)原理和应用NeuralArchitectureSearch(NAS)是一种自动化设计神经网络架构的技术。它通过搜索空间中的不同架构配置来找到最优或接近最优的神经网络结构，从而减少人工设计网络结构的工作量。NAS的目标是通过自动化的方式获得比手工设计更高效、准确的模型架构，特别适用于对网络架构要求较高的任务。1.NAS的基本原理NAS的核心思
GPT-4对话模型在客服中的应用与前景：开启智能客服新时代 Echo_Wish 前沿技术人工智能 python 人工智能 gpt
GPT-4对话模型在客服中的应用与前景：开启智能客服新时代随着人工智能技术的迅猛发展，基于深度学习的对话模型在各个领域中得到了广泛应用。其中，GPT-4对话模型在客服系统中的应用尤为引人注目。本文将探讨GPT-4在客服中的应用与未来发展前景，并结合具体代码示例进行说明。一、GPT-4对话模型概述GPT-4（GenerativePre-trainedTransformer4）是OpenAI开发的一种
用GANs生成艺术作品的创新探索：人工智能与艺术的奇妙碰撞 Echo_Wish 前沿技术人工智能人工智能 gan python
用GANs生成艺术作品的创新探索：人工智能与艺术的奇妙碰撞随着人工智能技术的飞速发展，生成对抗网络（GenerativeAdversarialNetworks，GANs）在图像生成、视频生成、音频合成等领域展现出了惊人的创造力。特别是在艺术创作方面，GANs以其独特的生成能力，为艺术家和创作者提供了新的灵感和工具。本文将探讨GANs在艺术作品生成中的应用与创新，并通过具体代码示例展示其实现过程。一
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶网罗开发 AI 大模型人工智能机器学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Copilot 概述计算机萍萍学姐 copilot copilot 人工智能机器学习
Copilot是什么？它有什么用途？Copilot是由人工智能公司和GitHub合作开发的一个基于人工智能的代码提示工具，它可以利用机器学习技术和大量训练数据生成高质量的代码。Copilot的目标是在保持代码质量和可读性的前提下，提高开发者的编码效率，使得编码工作更为高效和便捷。Copilot的出现是解决编程过程中可能遇到的一些难点和瓶颈问题，特别是在快速迭代的敏捷开发场景中，提高编码效率和减少编
模型压缩与优化技术——神经架构搜索（Neural Architecture Search, NAS） DuHz 轻量化模型机器学习计算机视觉人工智能神经网络深度学习数据挖掘语音识别
模型压缩与优化技术中的神经架构搜索（NeuralArchitectureSearch,NAS）技术1.引言在深度学习领域，神经网络的架构设计对模型的性能至关重要。传统的手动设计网络架构的过程费时费力，且通常依赖于经验和直觉。为了提升效率与效果，神经架构搜索（NeuralArchitectureSearch,NAS）作为一种自动化的方法，能够通过算法寻找和优化最佳的神经网络架构。NAS可以在图像识别
大模型密度定律：AI代码生成器将迎来爆发式增长？前端
近年来，人工智能（AI）技术飞速发展，尤其是在代码生成领域，涌现出许多强大的AI代码生成器。清华大学刘知远团队近期提出的“大模型密度定律”，为我们理解AI技术的发展速度提供了新的视角，也预示着AI代码生成技术的未来发展趋势。该定律指出，模型能力密度每3.3个月翻倍，这将如何改变我们对AI发展的认知，并对AI代码生成器产生怎样的影响呢？让我们深入探讨。大模型密度定律：能力密度与指数级增长“大模型密度
【揭秘】图像算法工程师岗位如何进入？认识祂人工智能算法图像算法工程师
“图像算法工程师，主要专注于开发图像处理和计算机视觉算法，广泛应用于各行业。本文，我们来揭秘一下他们的日常工作，以及如何成为这一领域的专业人才。”01图像算法工程师的日常工作算法设计与开发图像算法工程师的核心任务是设计和开发算法，以解决特定的图像处理或计算机视觉问题。常见的任务包括：图像分类：使用卷积神经网络（CNN）对图像进行分类，常见算法如ResNet、VGG。目标检测：在图像中定位并标注物体
面向 Data+AI 的统一数据目录探索 | Data Infra NO.22 回顾（含资料发布）数据库
随着生成式人工智能（GenerativeAI）的崛起，从图像生成、自然语言处理到个性化推荐系统，生成式AI技术正迅速改变着各行各业的面貌。而在这场变革背后，数据的管理和治理显得尤为重要。对于企业来说，数据不仅是基础资源，更是构建AI应用和增强业务能力的关键。ApacheGravitino（incubating）与Databend作为数据领域两个知名的开源项目，正通过各自的创新技术和实践，为数据管理
大模型密度定律：AI代码生成器将迎来爆发式增长？前端
近年来，人工智能（AI）技术飞速发展，尤其是在代码生成领域，涌现出许多强大的AI代码生成器。清华大学刘知远团队近期提出的“大模型密度定律”，为我们理解AI技术的发展速度提供了新的视角，也预示着AI代码生成技术的未来发展趋势。该定律指出，模型能力密度每3.3个月翻倍，这将如何改变我们对AI发展的认知，并对AI代码生成器产生怎样的影响呢？让我们深入探讨。大模型密度定律：能力密度与指数级增长“大模型密度
Python语法总结彧侠脚本处理 Python
Python作为一种解释型的脚本语言，无论从自动化运维、大数据处理还是人工智能都得到了广泛的应用，而且它好理解、易学习、上手快的特点也使它成为了当下最火热的开发语言之一。下面就对Python语言中的各种语法做一个总结，以备后用数据类型一、整数二、浮点数三、字符串四、布尔值五、空值print语句注释什么是变量比如：定义字符串raw字符串与多行字符串Unicode字符串字符串还有一个编码问题。整数和浮
python+ollama本地大模型批量识别PDF，总结摘要以及关键词并输出EXCEL。月野难浔丶 python pdf 开发语言
现在市场上有很多PDF文件的识别，转化，等等。有些业务可能需要总结摘要和关键词等等一系列的操作。然而随着AI的兴起，本地大模型的部署，这些成为一种很方便的方法，接下来我将为各位介绍我所使用的方法。本篇文章旨在自动化处理PDF文档，提取并清理文本数据，然后使用一种大型模型生成摘要和关键词。最后，处理结果会被整理并输出到Excel文件中，便于后续分析和查看。人工智能（AI）是一种模拟人类智能的科技，它
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C