小黄人的黄

（二、1NN_QI）Tensorflow实例简介——前馈神经网络FNN

第一章：神经网络理论知识

（一，1NN-QI）神经网络与深度学习
（一、2NN-QI）改善深层神经网络
（一、3NN-QI）结构化机器学习项目
（一、4NN-QI）卷积神经网络
（一、5NN-QI）序列模型，循环神经网络

【第二章】TensorFlow

一，全连接神经网络

从本篇内容开始作为从<神经网路基础到量化投资应用>系列笔记的第二部分，主要用于神经网络的实现，由于自己不是计算机专业，所以许多语言的知识就不再细说，写博客的目的就是最终可以写完一个完整的模型，可以使用，并且知道为什么这么写。本篇内容主要想写4部分，第一节全连接神经神经网络，第二节卷积神经网络（CNN），第三节循环神经网络（RNN），第四节为一些扩展和问题。在学习的过程中看了好多Tensorflow的文章，都是在讲其中的结构，而本篇博客将直接从代码出发，直接粘贴复制就可以使用。我的重点不是写TensorFlow的内部架构，而是讲写代码的逻辑。每一篇博客将直接是上代码，解释，上代码，解释，，，这样的结构。

Tensorflow的配置和安装计算模型储存模型数据模型等相关知识这里一概不再讲解，直接上代码。

一，一个.py完成正向传播和反向传播

这个例子是TensorFlow书上的一个经典例子，即MNIST_DATA分类，是学习TF所必须经过的数据集，它包含了60000张图片作为训练数据，10000张图片作为测试数据。在MNIST数据集中的每一张图片都代表了手写体的0-9中的一个数字。我们就是要设计一个模型可以对其进行分类。

直接上码：

代码1可以直接下载运行。文章末尾有代码资源，下面是一个只有一个隐藏层的神经网络，是我自己对代码的一个解剖。

代码1

第一部分、导入相关的模块

import tensorflow as tf
# 导入tensorflow框架
from tensorflow.examples.tutorials.mnist import input_data
# 导入MNIST_DATA数据

第二部分、参数设置

# MNIST数据集相关的常数
INPUT_NODE = 784 # 输入层的节点数。对于MNIST数据集，这个就等于图片的像素
# 在MNIST_Data数据集中每一张图片的长和宽都是28像素的，所以一张图片共有28x28=784个像素点。
OUTPUT_NODE = 10
# 输入层的节点数。这个等于类别的数目。因为在MNIST数据集中，
#需要区分的是0-9这10个数字，所以这里输出层的节点数为10

# 配置神经网络的参数
LAYER1_NODE = 500  
#隐藏层节点数。这是使用只有一个隐藏层的网络结构作为样例。

BATCH_SIZE = 100
 #一个训练batch中的训练数据个数，数字越小，训练过程越接近随机梯度下降：
 # 数字越大，训练越接近梯度下降。
# 相当于我们把60000张图片分批进行计算，每一批为100张，

LEARNING_RATE_BASE = 0.8 #基础的学习率

参数更新过程：
$w:=w-\alpha dw \\ b:=b-\alpha db \\ 基础学习率即为这里的 \alpha$

LEARNING_RATE_DECAY = 0.99 # 学习率衰减速度。

在神经网络的学习过程中，如果学习率设置的太大，那么模型将在最优点的位置
徘徊，不能到达最优点，如果学习率设置的太小，那么模型将收敛速度将会大幅降低，
所以，设置学习率的指数衰减，即学习率随着迭代次数的增加而变小（衰减），从而
即不浪费计算资料也可使得模型可以很好的收敛到最优点附近。

指数衰减公式：
$\alpha' = \alpha * decay_{rate}^{\frac{global_{step}}{decay_{steps}}} \\ {}\\ \alpha: 为学习率（{LEARNING\_RATE\_BASE}）\\ {}\\ decay_{rate}:为衰减速率，即为这里的LEARNING\_RATE\_DECAY\\ {}\\ global_{step}:为当前的迭代轮数\\ {}\\ decay_{step}：通常为\frac{examples_{num}}{BATCH\_SIZE},即训练完所有数据需要的迭代次数$
在该公式中decay_steps为一个常数，decay_rate是一个小于1的数，所以随着迭代次数（global_step）的增加，学习率将会指数级的进行衰减。

REGULARIZATION_RATE = 0.001 # 描述模型复杂度的正则化项在损失函数中的系数。

正则化
模型的过拟合现象就是由于模型在训练集上的损失函数过于小而导致泛化能力大幅减弱，
如果我们用R(w)来表示模型的复杂度，那么如果模型发生过拟合，就说明R(w)会变得过大。解决方法就是不要使得R(w)过大，做法就是将R(w)和损失函数J(θ)放在一起训练，它俩是一对矛盾，其中一个减小另外一个一定增大。所以,损失函数用J(θ)+λR(w)来代替，λ表示复杂度项在整体损失的权重。
常见的R(w)有：
$R(w)=||w||_1=\sum_i|w_i|\\ R(w)=||w||_2^2 = \sum_i|w_i^2|\\ R(w)=\sum_i \alpha|w_i|+(1-\alpha)w_i^2\\ J(\theta)+\lambda R(w)$
这里的REGULARIZATION_RATE即为上式中的λ。

TRAINING_STEPS = 30000 # 训练论数
MOVING_AVERAGE_DECAY = 0.99 # 滑动平均衰减率

滑动平均衰减

滑动平均区别去动量梯度下降法，滑动平均是对训练过程中的参数进行移动平均计算，动量梯度下降法是改进了梯度下降的方法，所以这是两个频道的事情。
滑动平均是对参数进平均，而对参数进行移动平均的时候，并不是直接改变参数，而是在参数的基础上设置一个影子变量来记录参数的移动平均值。影子变量的更新过程：
$shadow\_variable = decay \times shadow\_variable + (1-decay) \times variable$
为了在训练的前期可以更新得更快：设置衰减率
$min\{decay,\frac{1+global\_step}{10+global\_step}\}$
MOVING_AVERAGE_DECAY 即为上式中的decay，衰减率通常设置为接近1的数。(0.9,0.99…)

第三部分，前向传播

# 一个辅助函数，给定神经网络的输入和所有参数，计算神经网络的前向传播结果。在这里定义了一个使用ReLU激活函数的三层全链接神经网络。通过
# 加入隐藏层实现多层网络结构，通过ReLU的就哦函数实现了去线性化。在这个函数中也支持传入用于计算参数平均值的类，这样方便在测试使用滑动平均模型

def inference(input_tensor,avg_class,weights1,biases1,weights2,biases2):
    # 当没有提供滑动平均类时，直接使用参数当前的取值。
    if avg_class is None:
        # 计算隐藏层的前向传播结果，这里使用了ReLU激活函数。
        layer1 = tf.nn.relu(tf.matmul(input_tensor,weights1)+biases1)

$a^{[1]}=g(a^{[0]}*w_1+b_1) \\ {}\\ g为ReLU激活函数$


        # 计算输出层的前向传播结果。因为在计算损失函数时会一并计算softmax函数，所以这里不需要加入激活函数。
        # 而且不加入softmax不会影响预测结果。因为预测时使用的是不同类别对应节点输出值的相对大小，有没有softmax层对最后分类结果的计算没有影响。
        # 于是在计算整个神经网络的前向传播时可以不加入最后的softmax层。
        return tf.matmul(layer1,weights2) + biases2

如果不进行滑动平均，则单一隐藏层模型的前向传播结果为：
$a^{[2]}=a^{[1]}*w_2 + b_2$

    else:
        # 首先使用avg_class.average 函数来计算得出变量的滑动平均值
        # 然后再计算相应的神经网络前向传播结果。
        layer1 = tf.nn.relu(
            tf.matmul(input_tensor,avg_class.average(weights1))+avg_class.average(biases1)
        )
        return tf.matmul(layer1,avg_class.average(weights2))+avg_class.average(biases2)

第四部分、反向传播，训练过程。

# 训练模型的过程。
def train(mnist):
    x = tf.placeholder(tf.float32,[None,INPUT_NODE],name='x_input')
    y_ = tf.placeholder(tf.float32,[None,OUTPUT_NODE],name='y-input')

定义x和预测值 $\hat{y}$ ，tf.placeholder 占位符函数。

    # 生成隐藏层的参数
    weights1 = tf.Variable(
        tf.truncated_normal([INPUT_NODE,LAYER1_NODE],stddev=0.1)
    )
    biases1 = tf.Variable(tf.constant(0.1,shape=[LAYER1_NODE]))
    # 生成输出层的参数
    weights2 = tf.Variable(
        tf.truncated_normal([LAYER1_NODE, OUTPUT_NODE], stddev=0.1)
    )
    biases2 = tf.Variable(tf.constant(0.1, shape=[OUTPUT_NODE]))

第一层（隐藏层）： $a^{[0]}$ 也就是输入数据X是None行，INPUT_NODE列的矩阵， $w_1$ 为INPUT_NODE行，LAYER1_NODEl列的， $b_1$ 是一个常数，通过python的广播机制进行相加，所以 $a^{[1]}=g(a^{[0]}*w_1+b_1)$ ,所以根据矩阵的乘法 $a^{[1]}$ 为None行，LAYER1_NODE列。

第二层（输出层）： $a^{[2]}$ 也就是output即 $\hat{y}$ 。 $a^{[2]}=a^{[1]}*w_2+b_2$ 有矩阵的乘法和python的广播机制， $a^{[1]}$ 为None行，LAYER1_NODE列， $w_2$ 为LAYER1_NODE 行，OUTPUT_NODE列， $b_1$ 为常数，所以 $a^{[2]}$ 也就是output也就是 $\hat{y}$ 为None行，OUTPUT_NODE列。

代码中的y_和 $\hat{y}$ 并不是同一个意思，代码中y_表示的真实的labels；而 $\hat{y}$ 表示的预测值，在代码中为y(没有滑动平均)或者是average_y(带有滑动平均)。

    # 计算当前参数下神经网络前向传播的结果，这里给出的用于计算滑动平均的类为None，所以函数不会使用参数的滑动平均值
    y = inference(x,None,weights1,biases1,weights2,biases2)

不进行滑动平均的前向传播结果。

    # 定义存储训练轮数的变量。这个变量不需要计算活动平均值，所以这里指定这个变量为不可训练的变量
    #（trainable=Fasle）.再使用TensorFlow训练神经网络时，一般会将代表训练轮数的变量指定为不可训练的参数。
    global_step = tf.Variable(0,trainable=False)

    # 给定滑动平均衰减率和训练轮数的变量，初始化滑动平均类。在上一部分中介绍过给定训练轮数的变量可以加快
    # 训练早期变量的更新速度。
    variable_averages = tf.train.ExponentialMovingAverage(
        MOVING_AVERAGE_DECAY,global_step
    )

    # 在所有待变神经网络参数的变量上使用滑动平均。其他辅助变量（比如global_step）就不需要了。
    # tf.trainbale_variables 返回的就是图上的集合GraphKeys.TRAINABLE_VARIABLES中的元素。
    # 这个集合的元素就是所有没有指定trainable=False的参数。
    Variable_averages_op = variable_averages.apply(
        tf.trainable_variables()
    )

上述代码为对所有可以训练的参数进行滑动平均。


    # 计算使用了滑动平均之后的前向传播结果。在上一部分中介绍过滑动平均不会改变变量本身的取值，而是会维护一个影子
    # 变量来记录器滑动平均值。所以当需要使用这个滑动平均值时，需要明确调用average函数
    average_y = inference(
        x,variable_averages,weights1,biases1,weights2,biases2
    )

滑动平均之后的前向传播结果。


    # 计算交叉熵，作为刻画预测值和真实值之间差距的损失函数。这里使用了Tensorflow中提供的sparse_softmax_cross_entropy_with_logists
    # 函数来计算交叉熵。当分类问题只有一个正确答案时，可以使用这个函数来进行交叉熵的计算。MNIST问题的图片中
    # 只包含了0-9中的一个数字，所以可以使用这个函数来计算交叉熵损失。这个函数的第一个参数是神经网络不包括
    # softmax层的前向传播结果，第二个是训练数据的正确答案。因为标准答案是一个长度为10的一维数组，而该函数需要提供的是一个正确答案的数字。
    # 所以需要使用tf.argmax 函数来得到正确大难对应的类别编号。
    cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(
        logits=y,labels=tf.argmax(y_,1)
    )
    # 计算当前batch中所有样例的交叉平均值。
    cross_entropy_mean = tf.reduce_mean(cross_entropy)

softmax 激活函数：
$t=e^{z^{[l]}}$
$a^{[l]}=\frac{e^{z^{[l]}}}{\sum_i t_i}$

tf.nn.sparse_softmax_cross_entropy_with_logits()该函数用于每个数据只有一个正确答案的情况，首先对y进行softmax层计算，然后再进行交叉熵的计算。所以之前的前向传播并没有进行softmax计算。

    # 计算L2正则化损失函数。
    regularizer = tf.contrib.layers.l2_regularizer(REGULARIZATION_RATE)
    # 计算模型的正则化损失。一般只计算神经网络边上却终的正则化损失，而不适用偏置项。
    regularization = regularizer(weights1) + regularizer(weights2)
    # 总损失等于交叉熵损失和正则化损失的和。
    loss = cross_entropy_mean + regularization

上述代码为损失函数的设置，损失函数为交叉熵和正则项的和。

    # 设置指数衰减的学习率
    learning_rate = tf.train.exponential_decay(
        LEARNING_RATE_BASE, # 基础的学习率，随着迭代的进行，更新变量时使用的学习率在这个基础上递减
        global_step,        # 当前迭代的轮数
        mnist.train.num_examples / BATCH_SIZE, # 过完所有的训练数据需要的迭代次数
        LEARNING_RATE_DECAY # 学习衰减速度。
    )

上述代码为学习率的衰减

    # 使用tf.train.GradientDescentOptimizer 优化算法来优化损失函数。注意这里损失函数包含了交叉熵损失和LL2正则化损失。
    train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss, global_step=global_step)
    # 在训练神经网络模型时，每过一遍数据即需要通过反向传播来更新神经网络中的参数，又要更新每一个参数的
    # 滑动平均值。为了一次完成多个操作，Tensorflow提供tf.control_dependencies和tf.group两种机制，下面两行程序和
    # train_op = tf.group(train_step,variables_averages_op)是等价的
    with tf.control_dependencies([train_step,Variable_averages_op]):
        train_op = tf.no_op(name='train')

上述代码为梯度下降法的执行

    # 检验使用了滑动平均模型的神经网络前向传播结果是否正确。tf.argmax(average_y,1)计算每一个样例
    # 的预测答案。其中average_y是一个batch_size*10的二维数组，每一行表示一个样例的前向传播结果。tf.agmax
    # 的第二个参数“1”表示选取最大值的操作仅在第一个维度进行，也就是说，只在每一行选取最值对应的下标。于是得到
    # 的结果是一个长度为batch的一维数组，这个一维数组中的值就表示了每一个样例对应的数组识别结果。
    # tf.equal判断两个张脸的每一个维是否相等。如果相等返回True，否则返回False。
    correct_prediction = tf.equal(tf.argmax(average_y,1),tf.argmax(y_,1))
    #这个运算搜先将一个布尔型的数值装欢为实数型，然后计算平均值。这个平均值就是模型在这一组数据熵的正确率。
    accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

上述代码为正确率的计算。

    # 初始化会话并开始训练过程。
    with tf.Session() as sess:
        sess.run(tf.global_variables_initializer())
        # 准便验证数组。一般在神经网络的训练过程中会通过验证数据来大致判断停止的条件和评判训练的效果。
        validate_feed = {x:mnist.validation.images, y_ :mnist.validation.labels}

        # 准便测试数据。在真实的应用中，这部分数据在训练是是不可见的，这个数据只是作为模型优劣的最后评价标准。
        test_feed = {x:mnist.test.images,y_:mnist.test.labels}

        # 迭代地训练神经网络
        for i in range(TRAINING_STEPS):
            # 每1000轮输出一次在验证数据集上的测试结果。
            if i % 1000 == 0:
            # 计算滑动平均模型在验证数据上的结果。因为MNIST数据集比较小，所以一次可以处理所有的验证数据。
            # 为了计算方便，本样例程序没有将验证数据划分为更小的batch。当神经网络模比较复杂或者验证数据比较
            # 大时，太大的batch会导致计算时间过长升值发生内存溢出的错误。
                validate_acc = sess.run(accuracy, feed_dict = validate_feed)
                print("After %d training step(s),validation accuracy"
                      "using average model is %g"% (i,validate_acc))
            # 产生这一轮使用的一个batch训练数据，并运行训练过程。
            xs,ys = mnist.train.next_batch(BATCH_SIZE)
            sess.run(train_op,feed_dict={x:xs,y_:ys})

        # 在训练结束之后，这测试数据上检验神经网络模型的最终正确率。
        test_acc = sess.run(accuracy,feed_dict=test_feed)
        print("After %d training step(s),test accuracy using average"
                  "model is %g" % (TRAINING_STEPS,test_acc))

进行迭代训练

# 主程序入口。
def main(argv=None):
    #声明处理MNIST数据集的类，这个类在初始化会自动下载数据。
    mnist = input_data.read_data_sets("MNIST_data",one_hot=True)
    train(mnist)

# Tensorflow 提供的一个主程序入口，tf.app.run会调用上面定义的main函数。
if __name__ == '__main__':
    tf.app.run()

主程序入口

二，重构MNIST问题

上述代码为一个py, 为了代码的可读性的便捷性，现在将这个例子拆分为3个程序，第一个是mnist_inference.py,它定义了前向传播的过程以及神经网络的参数。第二个是mnist_train.py它定义了神经网络的训练过程。第三个为mnist_eval.py,它定义了测试过程。

1、 mnist_inference.py

第一部分，导入模块

# -*- coding:utf-8 -*-
import tensorflow as tf

第二部分，设置参数
这些参数在第一节的时候已经进行解释，不再赘述。

#定义神经网络结构相关的参数
INPUT_NODE = 784
OUTPUT_NODE = 10
LAYERA1_NODE = 500

第三部分，参数管理

在第一节的时候，由于模型只有一个隐藏层和一个输出层，所以之后w_1和w_2两个参数，参数较少，正则化可以直接对其进行操作。如果参数过多，设置一个参数生成函数，便于正则化计算，如果需要正则化，则可以直接将正则项添加到集合当中。

'''
通过tf.get_variable函数来获取变量。在训练神经网络时会创建这些变量:则测试时会通过
保存的模型加载这些变量的取值。而且更加方便的是因为可以在变量加载时将滑动平均变量
重命名，所以可以直接通过同样的名字在训练时使用变量自身，而在测试时使用变量的滑动平均值。
在这个函数中也会将变量的正则化损失加入损失集合。
'''
def get_weight_variable(shape,regularizer):
    weights = tf.get_variable(
        "weights",shape,
        initializer=tf.truncated_normal_initializer(stddev=0.1)
    )
    '''
     当给出了正则化生成函数时，将当前变量的正则化损失加入名字为名字为lossses的集合。在这里使用了
     add_to_collection 函数将一个张量加入一个集合，而这个集合的名称为losses。这是自定义的集合，不在
     Tensorflow自动管理的集合列表中。
    '''
    if regularizer is not None:
        tf.add_to_collection('losses',regularizer(weights))
    return weights

第四部分，前向传播过程

# 定义神经网络的前向传播过程。
def inference(input_tensor,regularizer):
    # 声明第一层神经网络的变量并完成前向传播过程。

定义一个命名空间layer1，专门管理第一层中的参数。

    with tf.variable_scope('layer1'):
        '''
        这里通过tf.get_variable 或tf.Variable 没有本质区别，因为在训练或是测试中
        没有在同一个程序中多次调用这个函数。如果在同一个程序中多次调用，在第一次调用
        之后需要将reuse参数设置为True
        '''
        weights = get_weight_variable(
            [INPUT_NODE,LAYERA1_NODE],regularizer
        )
        biases = tf.get_variable(
            "biases",[LAYERA1_NODE],
            initializer=tf.constant_initializer(0.0)
        )
        layer1 = tf.nn.relu(tf.matmul(input_tensor,weights)+biases)

定义命名空间layer2,专门管理第二层的参数。

    # 类似的声明第二层神经网络的变量并完成前向传播过程。
    with tf.variable_scope("layer2"):
        weights = get_weight_variable(
            [LAYERA1_NODE,OUTPUT_NODE],regularizer
        )
        biases = tf.get_variable(
            "biases",[OUTPUT_NODE],
            initializer=tf.constant_initializer(0.0)
        )
        layer2 = tf.matmul(layer1,weights)+biases
    # 返回最后前向传播结果
    return layer2

2.mnist_train.py

第一部分，导入模块

#-*- coding:utf-8 -*-
import os
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
# 加载mnist_inference.py中的定义的常量和前向传播的函数。
import mnist_inference

第二部分，设置参数

这些参数以及做过解释，多了两个路径，用来保存模型。在mnist_train.py运行过程中会把训练好的数据保存下来，然后再运行mnist_eval.py从中调取模型中文件。

# 配置神经网络的参数
BATCH_SIZE = 100
LEARNING_RATE_BASE = 0.8
LEARNING_RATE_DECAY = 0.99
REGULARAZTION_RATE = 0.0001
TRAINING_STEPS = 30000
MOVING_AEVERAGE_DECAY = 0.99

# 模型保存的路径和文件名
MODEL_SAVE_PATH = "model/"
MODEL_NAME = "model.ckpy"

反向传播训练过程

def train(mnist):
    # 定义输入输出placeholder
    x = tf.placeholder(
        tf.float32, [None, mnist_inference.INPUT_NODE],name ="x-input"
    )
    y_ = tf.placeholder(
        tf.float32,[None, mnist_inference.OUTPUT_NODE],name='y-input'
    )
    regularizer = tf.contrib.layers.l2_regularizer(REGULARAZTION_RATE)
    #直接使用mnist_inference.py中定义的前向传播过程。
    y = mnist_inference.inference(x, regularizer)
    global_step = tf.Variable(0,trainable=False)

    # 和5.2.1节样例中类似地定义损失函数、学习率、滑动平均操作以及训练过程。
    variable_averages = tf.train.ExponentialMovingAverage(
        MOVING_AEVERAGE_DECAY,global_step
    )
    variable_averages_op = variable_averages.apply(
        tf.trainable_variables()
    )
    cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(
        logits=y,labels= tf.argmax(y_,1)
    )
    cross_entropy_mean = tf.reduce_mean(cross_entropy)
    loss = cross_entropy_mean + tf.add_n(tf.get_collection('losses'))

学习率衰减

    learning_rate = tf.train.exponential_decay(
        LEARNING_RATE_BASE,
        global_step,
        mnist.train.num_examples/BATCH_SIZE,
        LEARNING_RATE_DECAY
    )

梯度下降

    train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss,global_step=global_step)
    with tf.control_dependencies([train_step,variable_averages_op]):
        train_op = tf.no_op(name='train')

保存文件

    # 初始化Tensorflow持久化类。
    saver = tf.train.Saver()
    with tf.Session() as sess:
        tf.global_variables_initializer().run()

        # 在训练过程中不再测试模型在验证数据上的表现，验证和测试的过程将会有一个独立的程序来完成。
        for i in range(TRAINING_STEPS):
            xs,ys = mnist.train.next_batch(BATCH_SIZE)
            _, loss_value,step=sess.run([train_op,loss,global_step],feed_dict={x:xs,y_:ys})

            # 每1000轮保存一次模型。
            if i%1000 == 0:
                '''
                输出当前的训练情况。这里只输出了模型在当前训练batch上的损失函数大小。通过损失函数的大小可以
                大概链接训练的情况。在验证数据集上的正确率信息会有一个单独的程序来生成。
                '''
                print("After %d training step(s),loss on training"
                      "batch is %g."%(step,loss_value))
                '''
                保存当前的模型。这一这里给吃了global_step参数，这样可以让每一被保存模型的文件名末尾
                加上训练的论数，比如“model.ckpy-1000”表示训练1000轮之后得到的模型
                '''
                saver.save(
                    sess,os.path.join(MODEL_SAVE_PATH,MODEL_NAME),
                    global_step = global_step
                )
def main(argv=None):
    mnist = input_data.read_data_sets("MNIST_data",one_hot=True)
    train(mnist)

if __name__ == '__main__':
    tf.app.run()

3.mnist_eval.py

# -*- coding:utf-8 -*-
import time
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

# 加载mnist_inference.py 和mnist_train.py中定义的常量和函数
import mnist_inference
import mnist_train

#每10秒加载一次最新的模型，并在测试数据上测试最新模型的正确率
EVAL_INTERVAL_SECS = 10

def evaluate(mnist):
    with tf.Graph().as_default() as g:
        # 定义输入输出的格式
        x = tf.placeholder(tf.float32, [None, mnist_inference.INPUT_NODE], name='x-input')
        y_ = tf.placeholder(tf.float32, [None, mnist_inference.OUTPUT_NODE], name='y-input')
        validate_feed = {x:mnist.validation.images,
                         y_:mnist.validation.labels}
        '''
        直接通过调用封装好的函数来计算前向传播的结果。因为测试时
        不关注正则化损失的值，所以这里用于计算正则化损失函数被
        设置为None
        '''
        y = mnist_inference.inference(x, None)

        '''
        使用前向传播的结果计算正确率。如果需要对未知的样例进行分类，
        那么使用tf.argmax(y,1)就可以得到输入样例的预测类别了。
        '''
        correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(y_,1))
        accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

        '''
        通过变量重命名的方式来加载模型，这样在前向创博的过程中就不需要
        调用求滑动平均的函数来获取平均值了。这样就可以完全公用mnist_inference.py
        中定义的前向传播过程。
        '''
        variable_averages = tf.train.ExponentialMovingAverage(
            mnist_train.MOVING_AEVERAGE_DECAY
        )
        variable_to_restore = variable_averages.variables_to_restore()
        saver = tf.train.Saver(variable_to_restore)

        '''
        每隔EVAL_INTERVAL_SECS秒调用一次计算正确率的过程以检验训练过程中正确率的变化。
        '''
        while True:
            with tf.Session() as sess:
                # tf.train.get_checkpoint_state函数会通过checkpoint文件自动找到
                # 目录中最新模型的文件名。
                ckpt = tf.train.get_checkpoint_state(
                    mnist_train.MODEL_SAVE_PATH
                )
                if ckpt and ckpt.model_checkpoint_path:
                    # 加载模型。
                    saver.restore(sess,ckpt.model_checkpoint_path)
                    # 通过文件名得到模型保存时迭代的轮数。
                    global_step = ckpt.model_checkpoint_path.split('/')[-1].split('-')[-1]
                    accuracy_score = sess.run(accuracy,feed_dict=validate_feed)
                    print("After %s training step(s),validation"
                          "accuracy = %g"% (global_step,accuracy_score))
                else:
                    print('No checkpoint file found')
                    return
            time.sleep(EVAL_INTERVAL_SECS)

def main(argv=None):
    mnist=input_data.read_data_sets("MNIST_data",one_hot=True)
    evaluate(mnist)

if __name__ == '__main__':
    tf.app.run()

三，番外篇

1.变量管理

在上一部分当中神经网络的前向传播过程抽象成了一个函数。

def inference(input_tensor,avg_class,weights1,biases1,weight2,biases2)

从定义种可以看出这个函数当中包含了前向传播的所有参数，但是如果网络比较大，参数特别多，显然这种方法是不可取的，所以我们通过上下文管理器来生成一个命名空间，从而实现对参数的统一管理。
其中涉及到函数tf.get_variable()，函数tf.get_variable()即可以创建参数也可以获取创建好的参数
代码举例

# 在名字为foo的命名空间内创建名字为v的变量
with tf.variable_scope("foo"):
	v = tf.get_variable("v",[1],initializer = tf.constant_initializer(1.0))

# 因为在命名空间foo中已经存在名字为v的变量，所以以下代码将会报错：
# variabel foo/v already exists, disallowed.Did you mean to set reuse = True in VarScope?
with tf.variable_scope("foo"):
	v = tf.get_variable("v",[1])

#  在生成上下文管理器时，将参数reuse设置为True。这样tf.get_variable函数将直接获取已经声明的变量。
with tf.variable_scope("foo"):
	v1 = tf.get_variable("v",[1])
	print(v==v1) # 输出为True,代表v,v1代表的时相同的TensorFlow中变量。
# 将参数reuse设置为True时，tf.variable_scope将只能获取已经创建过的变量。

命名空间也可以实现嵌套结构，在命名空间中的变量名称前缀会加上命名空间的名称。

v1 = tf.get_variable("v",[1])
print(v1.name) # 输出v：0."v"为变量的名称，":0"表示这个变量生成变量这个运算的第一个结果。

with tf.variable_scope("foo"):
	v2 = tf.get_variable("v",[1])
	print(v2.name) #输出foo/v:0。在tf.variable_scope中创建的变量，名称前面会加入空间的名称，并通过/来分割

with tf.variable_scope("foo")
	with tf.variable_scope("bar"):
		v3 = tf.get_variable("v",[1])
		print(v3.name) # 输出foo/bar/v:0

	v4 = tf.get_variable("v1",[1])
	print(v4.name) #输出foo/v1:0

# 创建一个名称为空的命名空间，并设置reuse=True。
with tf.variable_scope("",reuse=True):
	v5 = tf.get_variable("foo/bar/v",[1])

	print(v5==v3) # 输出True
	v6 = tf.get_variable("foo/v1",[1])
	print(v6==v4) # 输出True

2.模型的持久化

2.1模型的保存

import tensorflow as tf

# 声明两个变量并计算它门的和。
v1 = tf.Variable(tf.constant(1.0,shape=[1]),name="v1")
v2 = tf.Variable(tf.constant(2.0,shape=[1]),name="v2")
return = v1+v2

init_op = tf.global_variables_initializer()
# 声明tf.train.Saver类用于保存模型。
saver = tf.train.Saver()

with tf.Session() as sess:
	sess.run(init_op)
	# 将模型保存到model/model.ckpt文件。
	saver.save(sess,"model/model.ckpt")

2.2加载模型

import tensorflow as tf
# 直接加载持久化的图。
saver = tf.train.import_meta_graph("model/model.ckpt.meta")
with tf.Session() as sess:
	saver.restore(sess,"model/./")
	# 通过张量的名称来获取张量。
	print sess.run("add:0")
	# 输出[3.]

上述代码为import_meta_graph即计算图中全部的参数，但是在实际中我们不一定需要导入全部的参数，有可能只需要导入部分的参数，例如在迁移学习当中。那么我们可以通过列表[]来选择我们想要导入的参数。

saver = tf.train.Saver([v1])

2.3重命名
从模型导入参数，我们可以通过重命名来实现对参数的导入，

v1 = tf.Variable(tf.constant(1.0,shape=[1]),name="other-v1")
v2 = tf.Varibale(tf.constant(2.0,shape=[1]),name="other-v2")

saver=tf.train.Saver({"v1":v1,"v2":v2})

将v1重命名了other-v1，v2重命名为other-v2。

滑动平均模型的应用
滑动平均模型是通过影子参数实现对模型的健化。
所以我们可以直接通过影子参数的重命名从而实现对模型参数的导入。

保存滑动平均模型

import tensorflow as tf

v = tf.Variable(0,dtype=tf.floar32,name="v")
# 在没有声明滑动平均模型时只有一个变量v，所以以下语句指挥输出“v:0”。
for variables in tf.gobal_variable():
	print(variables.name)

ema = tf.train.ExponentialMovingAverage(0.99)
maintain_average_op = ema.apply(tf.global_varibales())

# 在声明滑动平均模型之后，Tensorflow会自动生成一个影子变量
# 于是下列语句会输出：“v:0”和"v/ExpoenentialMovingAverage:0".
for variables in tf.global_variables():
	print(variables.name)

Saver = tf.train.Saver()
with tf.Session() as sess:
	init_op = tf.global_varibales_initializer()
	sess.run(init_op)
	
	sess.run(tf.assign(v,10))
	sess.run(maintain_average_op)
	# 保存时，TensorFlow会将v:0和v/ExpontialMoving Average:0两个变量都保存下来。
	saver.save(sess,"model/model.ckpt")
	print(sess.run([v,ema.average(v)])) #输出[10.0,0.099999905]

读取变量的滑动平均值

通过这个方法，就可以使用完全一样的代码来计算滑动平均模型的前向传播结果。

v = tf.variable(0，dtype=tf.float32,name="v")

saver = tf.train.Saver({"v/ExponentialMovingAverage":v})
with tf.Session() as sess:
	saver.restore(sess,"model/model.ckpt")
	print sess.run(v) #输出0.099999905

为了方便加载时重名命滑动平均变量，tf.train.ExponentialMovingAverage类提供了variables_to_restore函数生成tf.train.Saver类所想要的变量重命名字典。以下代码给出了variables_to_restore函数使用样例。

import tensorflow as tf 
v = tf.Variable(0,dtype=tf.floar32,name="v")
ema = tf.train.ExponentialMovingAverage(0.99)

# 通过使用varibales_to_restore函数可以直接生成上面代码中提供的字典{"v/ExponentialMovingMovingAverage":v}
# 以下代码会输出：{"v/ExponentialMovingAverage":}其中后面的variable类就代表了变量v。
print(ema.variables_to_restore())

saver = tf.train.Saver(ema.variables_to_restore())
with tf.Session() as sess:
	saver.restore(sess,"model.ckpt")
	print(sess.run(v)) # 输出0.99999905.

2.4迁移学习的准备
使用tf.train.Saver会保存运行TensorFlow程序所需要的全部信息，然而有时并不需要某些信息。比如在测试或者离线预测时，只需要知道如何从从神经网络的输入层经过前向传播计算得到输出层即可，而不需要类似于变量初始化、模型保存等辅助节点的信息。于是Tensorflow提供了convert_variables_to_constants函数，通过这个函数可以将计算图中的变量及其取值通过常量的方式保存，这样整个Tensor flow计算图可以统一存放在一个文件中。以下为一个案例。

import tensorflow as tf
trom tensorflow.python.framework import graph_util

v1 = tf.Variable(tf.constant(1.0,shape=[1]),name="v1")
v2 = tf.varialbe(tf.constant(2.0,shape=[1]),name="v2")
result = v1+v2

init_op = tf.global_variables_initializer()
with tf.Session() as sess:
	sess.run(init_op)
	# 导出当前计算图的GraphDef部分，只需要这一部分就可完成从输入层到输出层的计算过程。
	graph_def = tf.get_default_graph().as_graph_def()

	#将图中的变量及其取值转化为常量，同时将图中不必要的节点去掉。在下面一行代码中，最后一个参数['add']给出了需要保存的节点名称。add节点既是上面定义的加法
	output_graph_def = graph_util.convert_variables_to_constants(sess,graph_def,[add])
	# 将导出的模型存入文件。
	with tf.gf.ile.GFile("model/combined_model.pd","wb") as f:
		f.write(output_graph_def.SerializeToString())

加载模型
直接计算定义的加法运算的结果。

import tensorflow as tf
from tensorflow.python.platfrom import gfile

with tf.Session() as sess:
	model_filename="model/combined_model.pd"
	# 读取保存的模型文件，并将文件解析成对应的GraphDef protocol Buffer
	with gfile.FastGFile(model_filename,'rb') as f:
		graph_def = tf.GraphDef()
		graph_def.ParseFromString(f.read())

	# 将graph_def中保存的图加载到当前的图中，return_elements=["add:0"]给出了返回的张量的名称。哎保存的时候给出的时计算节点的名称，所以为"add"。在加载的时候给出的时张量的名称，所以是add:0
	result = tf.import_graph_def(graph_def,return_elements=["add:0"]) 
	print(sess.run(result)) # 输出[3.0]

你可能感兴趣的:(深度学习,tensorflow,机器学习,神经网络,前馈神经网络)

机器学习5——非参数估计平和男人杨争争山东大学机器学习期末复习机器学习概率论算法
非参数估计在参数估计中我们已经提到，想要估计后验概率P(ωi∣x)=p(x∣ωi)p(ωi)p(x)P\left(\omega_i\midx\right)=\frac{p\left(x\mid\omega_i\right)p\left(\omega_i\right)}{p(x)}P(ωi∣x)=p(x)p(x∣ωi)p(ωi)，就需要估计类条件概率p(x∣ωi)p\left(x\mid\omega
机器学习4——参数估计之贝叶斯估计平和男人杨争争山东大学机器学习期末复习机器学习人工智能
贝叶斯估计问题建模：后验概率公式：P(ωi∣x,D)=P(x∣ωi,Di)P(ωi)∑j=1cP(x∣ωj,Dj)P(ωj)P\left(\omega_i\mid\mathbf{x},\mathcal{D}\right)=\frac{P\left(\mathbf{x}\mid\omega_i,\mathcal{D}_i\right)P\left(\omega_i\right)}{\sum_{j=1
工厂模式中使用Map管理策略实例时，为何仍需要Context？
看这篇文章前，可以先了解一下：策略模式与工厂模式的黄金组合：从设计到实战一、核心矛盾：创建职责与调用职责的分离问题当使用Map管理策略实例时（如MapstrategyMap），工厂确实能高效获取策略实例，但这仅解决了**“策略从哪里来"的问题。而策略的"如何使用”**仍面临以下挑战：上下文逻辑碎片化：策略调用前后的公共逻辑（如参数校验、结果处理）会散落在客户端代码中调用流程不一致：不同客户端可能以
用Tensorflow进行线性回归和逻辑回归（十） lishaoan77 tensorflow 线性回归 tensorboard 可视化
用TensorBoard可视化线性回归模型TensorBoard是一种可视化工具，用于了解、调试和优化模型训练过程。它使用在执行程序时编写的摘要事件。上面定义的模型使用tf.summary.FileWriter来写日志到日志目录/tmp/lr-train.我们可以用命令调用日志目录的TensorBoard，见Example3-13(TensorBoard已黙认安装与TensorFlow一起).Ex
强化学习 16G实践以下是基于CQL（Conservative Q-Learning）与QLoRA（Quantized Low-Rank Adaptation）结合的方案相关开源项目及资源，【ai技】行云流水AI笔记开源人工智能
根据你提供的CUDA版本（11.5）和NVIDIA驱动错误信息，以下是PyTorch、TensorFlow的兼容版本建议及环境修复方案：1.版本兼容性表框架兼容CUDA版本推荐安装命令（CUDA11.5）PyTorch11.3/11.6pipinstalltorchtorchvisiontorchaudio--extra-index-urlhttps://download.pytorch.org/
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
【赵渝强老师】OceanBase OBServer节点的目录结构
OceanBaseOBServer节点工作目录下通常有audit、bin、etc、etc2、etc3、log、run、store等目录，但这些目录并非都是安装必须的。在启动OBServer节点前需要保证etc、log、run、store这4的目录存在，同时store下应该有clog、slog、sstable这3个目录。etc2、etc3是备份配置文件用的，由OBServer节点创建。audit下存
机器学习3——参数估计之极大似然估计平和男人杨争争山东大学机器学习期末复习机器学习人工智能算法
参数估计问题背景：P(ωi∣x)=p(x∣ωi)P(ωi)p(x)p(x)=∑j=1cp(x∣ωj)P(ωj)\begin{aligned}&P\left(\omega_i\mid\mathbf{x}\right)=\frac{p\left(\mathbf{x}\mid\omega_i\right)P\left(\omega_i\right)}{p(\mathbf{x})}\\&p(\mathbf
大模型RLHF强化学习笔记（一）：强化学习基础梳理Part1 Gravity! 大模型笔记大模型 LLM 算法机器学习强化学习人工智能
【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】一、强化学习基础1.1Intro定义：强化学习是一种机器学习方法，需要智能体通过与环境交互学习最优策略基本要素：状态（State）：智能体在决策过程中需要考虑的所有相关信息（环境描述）动作（Action）：在环境中可以采取的行为策略（Policy）：定义了在给定状态下智能体应该选择哪个动作，目标是最大化智能体的长期累积奖
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
iPhone越狱基本流程王景程 github iphone xcode macos
目录一、什么是越狱（Jailbreak）？二、越狱前的准备工作三、越狱方式总览（按iOS版本划分）越狱类型：主流越狱工具一览：四、以Checkra1n为例讲解越狱流程（适合iPhoneX及更早）✅支持设备（iOS12–14）：步骤：五、越狱后的操作（以Cydia为例）⚠️六、越狱风险与注意事项总结流程图：一、iPhone16+iOS26：是否可以越狱？当前情况（截至2025年中）：二、为何新设备（
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
1.2 Python 的特点与优势 Utopia Reverie python python 开发语言
1.语法简洁易读Python以简洁的语法著称，代码可读性强，减少了不必要的符号和冗余代码。例如，使用缩进来表示代码块，而非传统的大括号。这使得代码更易于理解和维护，尤其适合初学者。示例：python运行【#计算斐波那契数列的前10项n=10a,b=0,1for_inrange(n);print(a,end='')a,b=b,a+b#输出:0112358132134】2.开源与社区支持Python是
FastJSON 解析错误分析与解决方案小屁孩大帅-杨一凡服务器 linux 前端运维
常见原因及解决方案1.数据为空或非JSON格式原因：输入数据可能为空字符串、null或其他非JSON格式内容。解决方案：在解析前检查数据是否有效。if(jsonStr!=null&&!jsonStr.trim().isEmpty()){//检查是否以JSON对象或数组的符号开头if(jsonStr.trim().startsWith("{")||jsonStr.trim().startsWith(
深入详解：决策树算法的概念、原理、实现与应用场景猿享天开算法决策树机器学习
深入详解：决策树算法的概念、原理、实现与应用场景决策树（DecisionTree）是机器学习中一种直观且广泛应用的监督学习算法，适用于分类和回归任务。其树形结构易于理解，特别适合初学者。本文将从概念、原理、实现到应用场景，全面讲解决策树，并通过流程图和可视化示例增强理解，通俗易懂，帮助小白快速掌握决策树算法相关知识。1.决策树的概念1.1什么是决策树？决策树通过一系列条件判断（决策节点）将输入数据
HarmonyOS从入门到精通：WebView开发逻极 harmonyos 华为鸿蒙 webview UI 前端实战
引言WebView是现代移动应用中不可或缺的组件，它使应用能够显示Web内容，实现混合开发。本文将详细介绍鸿蒙系统中WebView的开发技术，包括基本使用、性能优化和最佳实践。WebView基础知识1.WebView类型鸿蒙系统支持多种WebView实现：系统WebView自定义WebViewWeb组件2.WebView权限配置在开发WebView应用前，需要在配置文件中添加相关权限：{"modu
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
AWS Lambda与RDS连接优化之旅 t0_54manong 编程问题解决手册 aws 云计算个人开发
在云计算的时代，AWSLambda与RDS的结合为开发者提供了高效且灵活的解决方案。然而，在实际应用中，我们常常会遇到一些性能瓶颈。本文将通过一个真实案例，探讨如何优化AWSLambda与RDS之间的连接，以提高API的响应速度。背景介绍最近，我们在AWS上部署了一个使用Dotnet6开发的API，它通过APIGateway暴露给外部，并连接到同VPC内的MySQLAuroraRDS数据库。部署前
4.链表入门 ArtoriasSZ 算法链表数据结构 go 后端算法
单双链表及其反转-堆栈诠释值引用：函数调用得到原值的拷贝，函数实际使用的变量与原变量解耦。引用传递：函数调用拷贝原指针得到一个新指针，该指针和原指针指向同一个内存区域。反转单链表题干：给你单链表的头节点head，请你反转链表，并返回反转后的链表。使用双指针法，使用head进行遍历，pre指向head前一个节点，next指向head后一个节点。在每轮，首先得到head的下一个节点（为了在断掉这个节点
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
uniapp处理后端返回的html字符串萌新咦～ uni-app
前言：采用v-html方法处理1.处理前↵↵document.forms[0].submit();2.处理后↵↵document.forms[0].submit();3.跳转页面方法//传参uni.setStorageSync("ICBC_GW_V3_HTML",res.result.payUrl)//跳转uni.navigateTo({url:"/subpages/cashier/webView
网站策划书通用模板程序员小郑1024 项目策划专区 java 编程语言大数据
网站策划书通用模板一个网站的成功与否与建站前的网站策划有着极为重要的关系。在建立网站前应明确建设网站的目的，确定网站的功能，确定网站规模、投入费用，进行必要的市场分析等。只有详细的策划，才能避免在网站建设中出现的很多问题，使网站建设能顺利进行。网站策划是指在网站建设前对市场进行分析、确定网站的目的和功能，并根据需要对网站建设中的技术、内容、费用、测试、维护等做出策划。网站策划对网站建设起到计划和指
基于机器学习的智能文本分类技术研究与应用
在当今数字化时代，文本数据的爆炸式增长给信息管理和知识发现带来了巨大的挑战。从新闻文章、社交媒体帖子到企业文档和学术论文，海量的文本数据需要高效地分类和管理，以便用户能够快速找到所需信息。传统的文本分类方法主要依赖于人工规则和关键词匹配，这些方法不仅效率低下，而且难以应对复杂多变的文本内容。近年来，机器学习技术的快速发展为文本分类提供了一种高效、自动化的解决方案。一、机器学习在文本分类中的应用概述
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，