半度微凉1993

基于Tensorflow+MNIST的前向传播神经网络

import tensorflow as tf
from tensorflow.example.tutorials.mnist import imput_data

#MNIST数据集相关的常数
INPUT_NODE = 784        #输入层的节点数，这里等于图片的像素
OUTPUT_NODE = 10        #输出层节点数，这里为0~9共10个数子

#配置神经网络的参数

LAYER1_NODE = 500       #隐藏层节点数，这里使用只有一个隐藏层的网络结构作为样例
BATCH_SIZE = 100        #一个训练batch中的训练数据个数．
                        #数字越小时，训练过程越接近随机梯度下降;数字越大，训练越接近梯度下降
LEARNING_RATE_BASE = 0.8         #基础的学习率
LEARNING_RATE_DECAY = 0.99       #学习率的衰减率
REGULARIZATION_RATE = 0.0001     #描述模型复杂度的正则化项在损失函数中的系数
TRAINING_STEPS = 30000           #训练轮数
MOVING_AVERAGE_DECAY = 0.99      #滑动平均衰减率

"""
一个辅助函数，给定神经网络的输入和所有参数，计算神经网络的前向传播结果．在这里定义了一个使用ＲeLU 激活函数的三层全连接神经网络．通过加入隐藏层实现了多层网络结构，通过ＲeLU激活函数实现了去线性化．在这个函数中也支持传入用于计算参数平均值的类，方便在测试时使用滑动平均模型．
"""
def inference(input_tensor, avg_class, weights1, biases1, weights2, biases2):
    #当没有提供滑动平均类时，直接使用参数当前的取值
    if avg_class == None:
        #计算隐藏层的前向传播结果，这里使用了ReLU激活函数
        layer1 = tf.nn.relu(tf.matmul(input_tensor, weights1) + biases1)

        """计算输出层的前向传播结果．因为在计算损失函数时会一并计算softmax函数，所以这里不需要加入激活函数．而且不加入softmax不会影响预测结果，因为预测时使用的是不同类别对应节点输出值的相对大小，有没有softmax层对最后分类结果的计算没有影响，所以在计算整个神经网络的前向传播时可以不加入最后的softmax层"""
        return tf.matmul(layer1, weights2) + biases2

    else:
        #首先使用avg_class.average函数来计算得出变量的滑动平均值，然后再计算相应的神经网络前向传播结果
        layer1 = tf.nn.relu(tf.matmul(input_tensor, avg_class.average(weights1)) +
                            avg_class.average(biases1))
        return tf.matmul(layer1, avg_class.average(weights2)) + avg_class.average(biases2)


    #训练模型的过程
    def train(mnist):
        x = tf.placeholder(tf.float32, [None, INPUT_NODE], name='x-input')
        y_= tf.placeholder(tf.float32, [None, OUTPUT_NODE], name='y-input')

        #生成隐藏层的参数
        weights1 = tf.Variable(tf.truncated_normal([INPUT_NODE, LAYER1_NODE], stddev=0.1))
        biases1 = tf.Variable(tf.constant(0.1, shape=[LAYER1_NODE]))
        #生成输出层的参数
        weights2 = tf.Variable(tf.truncated_normal([LAYER1_NODE, OUTPUT_NODE], stddev=0.1))
        biases2 = tf.Variable(tf.constant(0.1, shape=[OUTPUT_NODE]))

        #计算在当前参数下神经网络前向传播的结果，这里给出的用于计算滑动平均的类为Ｎone,
        #所以函数不会使用参数的滑动平均值
        y = inference(x, None, weights1, biases1, weights2, biases2)

        #定义存储训练轮数的变量，这个变量不需要计算滑动平均值，所以这里指定这个变量为不可训练的变量，
        #在使用tensorflow训练神经网络时，一般会将代表训练轮数的变量指定为不可训练的参数．
        global_step = tf.Variable(0, trainable = False)

        #给定滑动平均衰减率和训练轮数的变量，初始化滑动平均类．
        #给定训练轮数的变量可加快训练早期变量的更新速度
        variable_averages = tf.train.ExponentialMovingAverage(MOVING_AVERAGE_DECAY, global_step)

        #在所有代表神经网络参数的变量上使用滑动平均．其他辅助变量如global_step就不需要了．
        #tf.trainable_variable返回的就是图上集合ＧraphKeys.TRAINABLE_VARIABLES中的元素，
        #这个集合的元素就是所有没有指定trainable= False的参数
        variables_averages_op = variable_average.apply(tf.trainable_variables())

        #计算使用了滑动平均后的前向传播结果
        average_y = inference(x, varibale_averages, weights1, biases1, weights2, biases2)

        #计算交叉熵作为刻画预测值和真实值之间差距的损失函数
        cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(y, tf.argmax(y_, 1))
        #计算在当前batch中所有样例的交叉熵平均值
        cross_entropy_mean = tf.reduce_mean(cross_entropy)

        #计算Ｌ２正则化损失函数
        regularizer = tf.contrib.layers.l2_regularizer(REGULARIZATION_RATE)
        #计算模型的正则化损失．一般只计算神经网络边上权重的正则化损失，而不使用偏置项
        regularization = regularizer(weights1) + regularizer(weights2)
        #总损失等于交叉熵损失和正则化损失的和
        loss = cross_entropy + regularization
        #设置指数衰减的学习率
        learning_rate = tf.train.exponential_decay(
            LEARNING_RATE_BASE,   #基础的学习率，随着迭代的进行，更新变量时使用的学习率在这个基础上递减
            global_step,          #当前迭代的轮数
            mnist.train.num_examples/BATCH_SIZE, #过完所有训练数据需要的迭代次数
            LEARNING_RATE_DECAY)  #学习率衰减速度

    #使用tf.train.GradientDescentOptimizer优化算法来优化损失函数，这里包含了交叉熵和l2正则化损失
    train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss,
                                                                           global_step=global_step)

    #在训练神经网络模型时，每过一遍数据即需要通过反向传播来更新神经网络中的参数，又要更新每一个参数的滑动平均值．为了一次完成多个操作，tensorflow提供了tf.control_dependencies和tf.group两种机制．下面两行程序和train_op = tf.group(train_step, variables_averages_op)是等价的．
    with tf.control_dependencies([teain_step, variables_averages_op]):
        train_op = tf.no_op(name = 'train')


    
    #检验使用了滑动平均模型的神经网络前向传播结果是否正确
    """tf.argmax(average_y, 1)计算每一个样例的预测答案．其中average_y是一个batch_size*10的二维数组，每一行表示一个样例的前向传播结果．tf.argmax的第二个参数＂１＂表示选取最大值的操作仅在第一个维度中进行，也就是说，只在每一行选取最大值对应的下标．于是得到的结果时一个长度为batch的一维数组，这个一维数组中的值就表示了每一个样例对应的数字识别结果．tf.equal判断两个张量的每一维是否相等，如果相等返回True,否则返回False."""
    correct_prediction = tf.equal(tf.argmax(average_y, 1), tf.argmax(y_, 1))
    #这个运算首先将一个布尔型的数值转换为实数型，然后计算平均值．这个平均值就是模型在这一组数据上的正确率
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

    #初始化会话并开始训练过程
    with tf.Session() as sess:
        tf.initialize_all_variables().run

        #准备验证数据，一般在神经网络的训练过程中会通过验证数据来大致判断停止的条件和评判训练的结果．
        validate_feed = {x: mnist.validation.images, y_: mnist.validation.labels}

        #准备测试数据，在真实的应用中，这部分数据在训练时是不可见的，这个数据只是作为模型优劣的最后评价标准．
        test_feed = {x:mnist.test.images, y_:mnist.test.labels}

        #迭代的训练神经网络
        for i in range(TRAINING_STEPS):
            #每１０００轮输出一次在验证数据集上的测试结果
            if i %1000 == 0:
                """计算滑动平均模型在验证数据上的结果，因为ＭＮＩＳＴ数据集较小，所以一次可以处理所有的验证数据．为了计算方便，本样例没有把验证数据划分为更小的batch．当神经网络模型比较复杂或者验证数据比较大时，太大的batcg会导致计算时间过长甚至发生内存溢出的错误．"""
                validate_acc = sess.run(accuracy, feed_dict=validate_feed)
                print("After %d training step(s), validation accuracy"
                      "using average model is %g " %(i, validate_acc))

                #产生这一轮使用的一个batch的训练数据，并运行训练过程
                xs,ys = mnist.train.next_batch(BATCH_SIZE)
                sess.run(train_op, feed_dict={x: xs, y_:ys})

            #在训练结束之后，在测试数据上检测神经网络模型的最终正确率
            test_acc = sess.run(accuracy, feed_dict=test_feed)
            print("After %d training step(s), test accuracy using average"
                  "model is %g "% (TRAINING_STEPS, test_acc))

#主程序入口
def main(argv=None):
    #声明处理ＭＮＩＳＴ数据集的类，这个类在初始化时会自动下载数据
    mnist = input_data.read_data_sets("/tmp/data", one_hot=True)
    train(mnist)

#tensorflow提供的一个主程序入口，tf.app.run会调用上面定义的main函数
if __name__ == '__main__':
    tf.app.run()

tacotron-2 安装及使用笔记 Lucas23 自然科学.IT辑（音视频开发）自然语言处理深度学习 tensorflow 机器学习神经网络
apt-getinstallmodule-init-toolskmod./NVIDIA-Linux-x86_64-440.100.run-no-x-check-no-nouveau-check-no-opengl-fileshttps://www.nvidia.cn/Download/driverResults.aspx/160186/cn安装Ｔensorflow版本及对应的CUDN.https:
Ｔensorflow使用笔记（1）： Tensorflow的模型保存和使用太阳上的日子
如何保存和使用训练好的模型参数引言最近在学习Tensorflow构建CNN，训练需要耗费时间，把训练好的各个参数保存下来是最简便的，网上有很多教程，但是跟着教程走不一定一帆风顺还是踩了一些坑，然后自己填了一下坑如何保存好训练的结果：假设会话为sess，计算图为graph网上看了很多资料，使用saver=tf.train.Saver()#不传入参数代表默认存入全部参数file_name='saved
Ｔensorflow 部分恢复模型 abc8350712 Tensorflow
Itisoftendesirabletofine-tuneapre-trainedmodelonanentirelynewdatasetorevenanewtask.Inthesesituations,onecanuseTF-Slim’shelperfunctionstoselectasubsetofvariablestorestore:#Createsomevariables.v1=slim.v
Ｔensorflow 解决 overfitting _不二_ tensorflow
Overfitting也被称为过度学习，过度拟合。它是机器学习中常见的问题举个Classification（分类）的例子。看下图图中黑色曲线是正常模型，绿色曲线就是overfitting模型。尽管绿色曲线很精确的区分了所有的训练数据，但是并没有描述数据的整体特征，对新测试数据的适应性较差看下图TensorFlow提供了强大的dropout方法来解决overfitting问题看下图例子，在这个ten
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n

基于Tensorflow+MNIST的前向传播神经网络

你可能感兴趣的:(Ｔensorflow)