码元

基于Tensorflow框架-------深度学习实战(一)LeNet模型完全解析

本文适合理论和原理都了解的学者，当然对于小白也可以共同学习，只不过无法讲的那么详细。机器学习届的"Hello World"就是MNIST数据集，因为笔者的电脑原因，配置不高，所有打算用MNIST作为模型框架的敲门砖。

首先用卷积神经网络训练MNIST数据集，我们这里直接上经典的模型LeNet结构。

这是LeNet模型的基本结构，现在进行分解：

首先导入数据，这里使用的是MNIST数据集，对数据的导入使用给定的数据导入方法以及相关的包，代码如下：

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
import time

紧接着声明输入图片的数据和类别：

注意：mnist数据集里面的图片的大小是28*28，原图模型里面的是32*32，所以我们需要根据我们实际的数据集进行写模型。

x=tf.placeholder('float',[None,784])
y_=tf.placeholder('float',[None,10])

注意：有些人可能不明白这里的784是什么意思，首先一张mnist图片是28*28的，那么784个字节代表了一张图片的所有信息，而我们这里是将784变成一行向量，则代表一行是一张图片。

这里的MNIST数据集是以[None,784]的数据格式存放的，而对于卷积神经网络来说，需要把图像的位置信息进行保存，因此这里将一维的数组重新转换为二维图像数组矩阵:

x_image=tf.reshape(x,[-1,28,28,1])

这里表示的是将一行的图片数据展开，形成28*28*1的三维矩阵。

根据LeNet的模型可以看到

第一层C1：滤波器个数为6，滤波器大小为5*5，单通道，偏执值为6个，进行卷积时步长为1且填充。实现如下：

filter1 = tf.Variable(tf.truncated_normal([5,5,1,6]))
bias1 = tf.Variable(tf.truncated_normal([6]))
conv1 = tf.nn.conv2d(x_image,filter1,strides=[1,1,1,1],padding='SAME')
h_conv1 = tf.nn.sigmoid(conv1+bias1)

这里的具体意思我就不说了，因为大家原理都清楚，我就简单的说一下，这里filter1定义的是6个5*5*1的三维随机数组，偏置值也是6个。最后通过sigmoid函数求得第一个卷积层输出结果。

第一层的运算后，其变化为：

C1
输入大小：28*28
核大小：5*5
核数目：6
输出大小：28*28*6
训练参数数目：(5*5+1)*6=156
连接数：(5*5+1)*6*(32-2-2)*(32-2-2)=122304

这里补充一下关于sigmoid激活函数的印象，看下数学公式大家应该能想起来：

第二层S2是在第一层卷积层之后的一个池化层，这里使用的是maxPooling，对于2*2大小的框进行最大特征取值。

maxPool2=tf.nn.max_pool(h_conv1,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

这是定义了一个2*2大小，步长为2，填充的池化层，经过这层运算后，图片的大小变为

S2
输入大小：28*28*6
核大小：2*2
核数目：1
输出大小：14*14*6
训练参数数目：2*6=12，2=(w,b)
连接数：(2*2+1)*1*14*14*6 = 5880

第三层C3:依旧是卷积层，滤波器大小为5*5，6个通道，个数为16，偏执值也为16，卷积时的步长为1且不填充。其后的池化层将特征进行再一次压缩，代码如下：

filter2 = tf.Variable(tf.truncated_normal([5,5,6,16]))
bias2 = tf.Variable(tf.truncated_normal([16]))
conv2 = tf.nn.conv2d(maxPool2,filter2,strides=[1,1,1,1],padding='VALID')
h_conv2 = tf.nn.sigmoid(conv2+bias2)

C3
输入大小：14*14*6
核大小：5*5
核数目：16
输出大小：10*10*16
训练参数数目：6*(3*5*5+1) + 6*(4*5*5+1) + 3*(4*5*5+1) + 1*(6*5*5+1)=1516
连接数：(6*(3*5*5+1) + 6*(4*5*5+1) + 3*(4*5*5+1) + 1*(6*5*5+1))*10*10=151600

**第四层S4:池化器大小为2*2，步长为2，填充，代码如下：**

maxPool3 = tf.nn.max_pool(h_conv2,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

S4
输入大小：10*10*16
核大小：2*2
核数目：1
输出大小：5*5*16
训练参数数目：2*16=32
连接数：(2*2+1)*1*5*5*16=2000

**第五层C5：也是卷积层，滤波器的大小为5*5，16个通道数，个数为120个，偏置值为120，运行卷积的步长为1，不填充，代码如下：**

filter3 = tf.Variable(tf.truncated_normal([5,5,16,120]))
bias3 = tf.Variable(tf.truncated_normal([120]))
conv3 = tf.nn.conv2d(maxPool3,filter3,strides=[1,1,1,1],padding='VALID')
h_conv3 = tf.nn.sigmoid(conv3+bias3)

C5
输入大小：5*5*16
核大小：5*5
核数目：120
输出大小：120*1*1
训练参数数目：(5*5*16+1)*120*1*1=48120（因为是全连接）
连接数：(5*5*16+1)*120*1*1=48120

第六层F6：全连接层，全连接层的作用在整个卷积神经网络中起到“分类器”的作用。如果说卷积层，池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话，全连接层则起到将学到的“分布式特征表达”映射到样本标记空间的作用。全连接层的滤波器大小为7*7，120个通道，个数为80。偏置值为80个。

代码如下：

#全连接层
#权值参数
W_fc1 = tf.Variable(tf.truncated_normal([1*1*120*80]))
#偏置值
b_fc1 = Varibale(tf.truncated_normal([80]))
#将卷积的输出展开
h_pool2_flat = tf.reshape(h_conv3,[-1,1*1*120])
#神经网络计算，并添加sigmoid函数
h_fc1 = tf.nn.sigmoid(tf.matmul(h_pool2_flat,W_fc1)+b_fc1)

F6
输入大小：120
输出大小：84
训练参数数目：(120+1)*84=10164
连接数：(120+1)*84=10164

最后一层输出层F7：最后一层的道理相比大家都知道，这里对全连接后的数据进行重新展开，将二维数据重新展开成一维数组之后计算每一行的元素个数。最后一个输出层在使用了softmax进行概率的计算。代码如下：

#输出层，使用softmax函数进行多分类
W_fc2 = tf.Variable(tf.truncated_normal([80,10]))
b_fc2 = tf.Variable(tf.truncated_normal([10]))
y_conv = tf.nn.softmax(tf.matmul(h_fc1,W_fc2)+b_fc2)

输入大小：84

输出大小为：10

训练参数数目：(84+1)*10=850

连接数：(84+1)*10=850

最后是交叉熵作为损失函数，使用梯度下降算法(学习率是0.001)来对模型进行训练。代码如下：

cross_entropy = -tf.reduce_sum(y_*tf.log(y_conv))
#使用GDO优化算法来调参
train_step = tf.train.GradientDescentOptimizer(0.001).minimize(cross_entropy)

以上就是完整的模型解析，下面贴出相应的完整的代码：

#-*-coding:utf-8-*-
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
import time

x=tf.placeholder('float',[None,784])
y_=tf.placeholder('float',[None,10])

x_image=tf.reshape(x,[-1,28,28,1])

#C1:第一层卷积层，初始化卷积核参数，偏执值，该卷积层5*5大小，一个通道，共有6个不同卷积核
filter1 = tf.Variable(tf.truncated_normal([5,5,1,6]))
bias1 = tf.Variable(tf.truncated_normal([6]))
conv1 = tf.nn.conv2d(x_image,filter1,strides=[1,1,1,1],padding='SAME')
h_conv1 = tf.nn.sigmoid(conv1+bias1)

#S2
maxPool2=tf.nn.max_pool(h_conv1,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

#C3:
filter2 = tf.Variable(tf.truncated_normal([5,5,6,16]))
bias2 = tf.Variable(tf.truncated_normal([16]))
conv2 = tf.nn.conv2d(maxPool2,filter2,strides=[1,1,1,1],padding='VALID')
h_conv2 = tf.nn.sigmoid(conv2+bias2)

#S4
maxPool3 = tf.nn.max_pool(h_conv2,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

#C5
filter3 = tf.Variable(tf.truncated_normal([5,5,16,120]))
bias3 = tf.Variable(tf.truncated_normal([120]))
conv3 = tf.nn.conv2d(maxPool3,filter3,strides=[1,1,1,1],padding='VALID')
h_conv3 = tf.nn.sigmoid(conv3+bias3)


#全连接层
#权值参数
W_fc1 = tf.Variable(tf.truncated_normal([1*1*120,80]))
#偏置值
b_fc1 = tf.Variable(tf.truncated_normal([80]))
#将卷积的输出展开
h_pool2_flat = tf.reshape(h_conv3,[-1,1*1*120])
#神经网络计算，并添加sigmoid函数
h_fc1 = tf.nn.sigmoid(tf.matmul(h_pool2_flat,W_fc1)+b_fc1)

#输出层，使用softmax函数进行多分类
W_fc2 = tf.Variable(tf.truncated_normal([80,10]))
b_fc2 = tf.Variable(tf.truncated_normal([10]))
y_conv = tf.nn.softmax(tf.matmul(h_fc1,W_fc2)+b_fc2)

cross_entropy = -tf.reduce_sum(y_*tf.log(y_conv))
#使用GDO优化算法来调参
train_step = tf.train.GradientDescentOptimizer(0.001).minimize(cross_entropy)
sess = tf.InteractiveSession()

#测试正确率
correct_prediction =  tf.equal(tf.argmax(y_conv,1),tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction,"float"))

#所有变量进行初始化
sess.run(tf.initialize_all_variables())

#获取mnist数据
mnist_data_set = input_data.read_data_sets('mnist_data',one_hot=True)

#进行训练
start_time = time.time()
for i in range(20000):
    #获取训练数据
    batch_xs, batch_ys = mnist_data_set.train.next_batch(200)

    #每迭代100个batch,对当前训练数据进行测试，输出当前预测准确率
    if i%2 == 0:
        train_accuray = accuracy.eval(feed_dict={x:batch_xs,y_:batch_ys})
        print("step %d,training accuracy %g"%(i,train_accuray))
        #计算间隔时间
        end_time = time.time()
        print('time:',(end_time-start_time))
        start_time = end_time
    #训练数据
    train_step.run(feed_dict={x:batch_xs,y_:batch_ys})

#关闭会话
sess.close()

经过20000次的训练后，在训练集上的准确率为0.99：

以上这是最粗鲁的代码写法，这么写的目的只是为了让大家更好的理解，接下来我们要进行程序的重构--模块化设计

首先使用ReLU激活函数代替sigmoid函数，从数学的上看，非线性的sigmoid函数对中央区的信号增益较大，对两侧区的信号增益较小，在信号的特征空间映射上，有很好的效果。但是由于sigmoid函左右两端在很大程度上接近极值，容易饱和，因此在进行计算时当传递的数值过小或者过大时会使得神经元梯度接近于0，这使得在模型计算时会多次计算接近于0的梯度，从而导致花费了学习时间却使得权重没有更新。

为了克服sigmoid函数容易产生提取梯度迟缓这一弊端，导出了一种新的激活函数ReLU函数，函数如图：

ReLU主要有以下几个优点：

收敛快：对于SGD的收敛有巨大的加速作用，可以看到对于达到阈值的数据其激活力度是随数值的加大而增大，且呈现一个线性关系。

计算简单：ReLU的算法较为简单，单纯一个值的输入输出不需要进行一系列的复杂计算，从而获得激活值。

不易过拟合：使用ReLU进行模型计算时，一部分神经元在计算时如果有一个过大的梯度经过，则次神经元的梯度会被强行设置为0，而在整个其后的训练过程中这个神经元都不会被激活，这会导致数据多样化的丢失，但是也能防止过拟合。

下面开始正式的代码优化

首先可以看到，为了模型的正常使用，在图计算过程中需要使用大量的权重值和偏置量。这些都是由Tensorflow变量所设置。而变量带来的问题就是在每次图对话计算过程中都要被反复初始化和赋予新值，因此在程序的编写过程中为了更好地反应模型的设计问题，不在Tensorflow进行初始化运算时反复进行格式化。

def weight_variable(shape):
    initial = tf.truncated_normal(shape,stddev=0.1)
    return tf.Variable(initial)

#初始化单个卷积核上的偏置值
def bias_variable(shape):
    initial = tf.constant(0.1,shape=shape)
    return tf.Variable(initial)

#输入特征x，用卷积核W进行卷积运算，strides为卷积核移动步长，
def conv2d(x,w,padding):
    return tf.nn.conv2d(x,w,strides=[1,1,1,1],padding=padding)

#对x进行最大池化操作，ksize进行池化的范围
def max_pool_2x2(x):
    return tf.nn.max_pool(x,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

这步的完整代码，我就不提供了，希望读者能自行完成，毕竟多动手才是王道。

下面补充一下关于模型保存的办法，不然训练后得到的只有数据的准确率，好不容易等出来的权值和偏置值都消失了。

# 之前是各种构建模型graph的操作(矩阵相乘，sigmoid等等....)

saver = tf.train.Saver() # 生成saver

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer()) # 先对模型初始化

    # 然后将数据丢入模型进行训练blablabla

    # 训练完以后，使用saver.save 来保存
    saver.save(sess, "save_path/file_name") #file_name如果不存在的话，会自动创建

然后就是模型的载入：

saver = tf.train.Saver()

with tf.Session() as sess:
    #参数可以进行初始化，也可不进行初始化。即使初始化了，初始化的值也会被restore的值给覆盖
    sess.run(tf.global_variables_initializer())     
    saver.restore(sess, "save_path/file_name") #会将已经保存的变量值resotre到 变量中。

简单的说就是通过saver.save来保存模型，通过saver.restore来加载模型

Transformer 模型架构 2401_89793006 热门话题 transformer 深度学习人工智能
Transformer是一种模型架构（ModelArchitecture），而不是一个软件框架（Framework）。它的定位更接近于一种设计蓝图，类似于建筑中的结构设计方案。以下是详细解释：1.架构vs框架的区别概念定义示例模型架构定义神经网络的结构设计Transformer、CNN、RNN开发框架提供实现模型的工具和库PyTorch、TensorFlow2.Transformer作为架构的核心
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用 xiao5kou4chang6kai4 深度学习遥感勘测 python 深度学习分类
专题一：深度学习发展与机器学习深度学习的历史发展过程机器学习，深度学习等任务的基本处理流程梯度下降算法讲解不同初始化，学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、卷积神经网络、卷积运算的基本原理池化操作，全连接层，以及分类器的作用BP反向传播算法的理解一个简单CNN模型代码理解特征图，卷积核可视化分析专题三TensorFlow与keras介绍与入门TensorFlow
如果MLlib 中没有所需要的模型，如何使用 Spark 进行分布式训练？是纯一呀 WSL Docker AI spark 分布式 mllib
如果MLlib中没有你所需要的模型，并且不打算结合更强大的框架（如TensorFlowOnSpark或Horovod），仍然可以使用Spark进行分布式训练，但需要手动处理训练任务的分配、数据准备、模型训练、结果合并和模型更新等过程。模型训练阶段将模型的训练任务分配到Spark集群的各个节点。数据并行：每个节点会处理数据的不同部分，并计算该部分的梯度或模型参数。自定义算法：如果使用的是自定义算法（
用 TensorFlow 搭建简单的手写数字识别模型 lozhyf 工作面试学习 tensorflow 人工智能 python
一、引言手写数字识别是机器学习领域中一个经典且基础的问题，它在很多实际场景中都有广泛的应用，比如邮政系统中的邮件分拣、银行支票金额识别等。TensorFlow是一个强大的开源机器学习框架，由Google开发并维护，它提供了丰富的工具和接口，能帮助我们快速搭建和训练深度学习模型。在这篇博客中，我们将使用TensorFlow构建一个简单的神经网络模型，用于识别手写数字。二、环境准备在开始之前，你需要安
TensorFlow LiteRT 概览姚家湾 tensorflow 人工智能 python
LiteRT（简称LiteRuntime，以前称为TensorFlowLite）是Google面向设备端AI的高性能运行时。您可以找到适用于各种机器学习/AI任务的LiteRT就绪模型，也可以使用AIEdge转换和优化工具将TensorFlow、PyTorch和JAX模型转换为TFLite格式并运行。主要特性针对设备端机器学习进行了优化：LiteRT解决了五项关键的ODML约束条件：延迟时间（无需
python中的深度学习框架TensorFlow 和 PyTorch 有什么区别？大懒猫软件 python 深度学习 tensorflow pytorch
TensorFlow和PyTorch是目前最流行的两个深度学习框架，它们在设计理念、使用方式和社区支持等方面存在一些显著的区别。以下是它们的主要区别：1.设计理念TensorFlow：静态计算图：TensorFlow使用静态计算图，即在运行模型之前需要先定义整个计算图。这使得TensorFlow在大规模分布式训练和部署时具有优势，但调试和动态修改模型时可能不够灵活。功能全面：TensorFlow提
PyTorch与TensorFlow的对比：哪个框架更适合你的项目？木觞清 pytorch tensorflow 人工智能
在机器学习和深度学习领域，PyTorch和TensorFlow是最流行的两个框架。它们各有特点，适用于不同的开发需求和场景。本文将详细对比这两个框架，帮助你根据项目需求选择最合适的工具。一、概述PyTorch和TensorFlow都是深度学习框架，它们为构建、训练和部署神经网络提供了强大的工具。尽管它们的最终目标相同，但其设计哲学和实现方式有所不同。PyTorch：由Facebook的人工智能研究
Fatal error in launcher: Unable to create process报错萧若珮笔记
完整报错是这样的：Fatalerrorinlauncher:Unabletocreateprocessusing'"c:\jenkins\workspace\deepview-python_2.5.14\python\python.exe""D:\software\eIQ\python\Scripts\pip.exe"showtensorflow':???????????查资料可以知道这种情况出现
深入理解TensorFlow中的形状处理函数 SEVEN-YEARS tensorflow 人工智能 python
摘要在深度学习模型的构建过程中，张量（Tensor）的形状管理是一项至关重要的任务。特别是在使用TensorFlow等框架时，确保张量的形状符合预期是保证模型正确运行的基础。本文将详细介绍几个常用的形状处理函数，包括get_shape_list、reshape_to_matrix、reshape_from_matrix和assert_rank，并通过具体的代码示例来展示它们的使用方法。1.引言在深
深度学习框架探秘｜TensorFlow vs PyTorch：AI 框架的巅峰对决紫雾凌寒智启前沿：AI 洞察・创未来人工智能深度学习 tensorflow pytorch ai
在深度学习框架中，TensorFlow和PyTorch无疑是两大明星框架。前面两篇文章我们分别介绍了TensorFlow（点击查看）和PyTorch（点击查看）。它们引领着AI开发的潮流，吸引着无数开发者投身其中。但这两大框架究竟谁更胜一筹？是TensorFlow的全面与稳健，还是PyTorch的灵活与便捷？让我们一同深入剖析，探寻答案。在深度学习框架中，TensorFlow和PyTorch无疑是
字节跳动实习生和校招生内推飞300 python javascript php 业界资讯算法
机器学习算法实习生-平台治理1、2026届硕士及以上学位在读，计算机等相关专业优先；2、有扎实的代码能力，熟悉深度学习/图神经网络/机器学习框架，如Pytorch、Tensorflow、DGL、Pyg、Sklearn等；3、熟悉机器学习/图学习/序列学习算法中的一项或者多项，如图建模、时序信号建模、节点/子图分类、社区挖掘、表征学习、自监督/半监督学习等，有一定深度和广度；4、熟悉相关算法在数据挖
MNIST Examples for GGML - Convolutional network Yongqiang Cheng ggml -llama.cpp -whisper.cpp GGML MNIST Examples Convolutional network
MNISTExamplesforGGML-Convolutionalnetwork1.Build2.MNISTExamplesforGGML2.1.Obtainingthedata2.2.Convolutionalnetwork2.2.1.TotrainaconvolutionalnetworkusingTensorFlow2.2.2.ToevaluatethemodelontheCPUusing
磨人小妖精-tensorflow之removed in a future version 凯旋的铁铁磨人的小妖精 python tensorflow
TensorFlow1.14版本TensorFlow使用五个不同级别的日志消息。按照上升的顺序，它们是DEBUG，INFO，WARN，ERROR和FATAL。当您在任何这些级别配置日志记录时，TensorFlow将输出与该级别相对应的所有日志消息以及所有级别的严重级别。例如，如果设置了ERROR的日志记录级别，则会收到包含ERROR和FATAL消息的日志输出，如果设置了一个DEBUG级别，则会从所
【Python深入浅出㊸】解锁Python3中的TensorFlow：开启深度学习之旅奔跑吧邓邓子 Python深入浅出 python 深度学习 tensorflow
目录一、TensorFlow简介1.1定义与背景1.2特点二、Python3与TensorFlow的关系2.1版本对应2.2为何选择Python3三、安装TensorFlow3.1安装步骤3.2验证安装四、TensorFlow基本概念与使用方法4.1计算图（Graph）4.2会话（Session）4.3张量（Tensor）4.4变量（Variable）4.5占位符（Placeholder）五、Te
keras实现TCN网络层谦虚且进步深度学习预测 keras 人工智能深度学习
keras实现TCN网络层，keras3.0可用。fromkeras.layersimportLambda,Dense,Layer,Conv1DimporttensorflowastfclassTCNCell(Layer):"""sumary_line:Chinese:让输入的时间序列[bs,seql,dim]提升kernel_size倍的感受野English:Doublethereceptive
Python深度学习代做目标检测NLP计算机视觉强化学习 matlabgoodboy 计算机视觉 python 深度学习
了解您的需求，您似乎在寻找关于Python深度学习领域的代做服务，特别是在目标检测、自然语言处理（NLP）、计算机视觉以及强化学习方面。以下是一些关于这些领域的概述以及寻找相关服务的建议。1.Python深度学习代做概述目标检测：目标检测是计算机视觉中的一个重要任务，旨在识别图像或视频中的特定对象，并确定它们的位置。Python中的深度学习框架（如TensorFlow、PyTorch）和计算机视觉
关于pip Install与conda install ClaNNEd@ Deep Learning pip conda
conda解决依赖的问题很弱，环境包多了以后经常要解决依赖几分钟到十几分钟。我个人感觉比较好的实践是conda创建虚拟环境，装torch/tensorflow等比较难装的包，基础环境配好以后，后面装包一律用pip。conda，pip，anaconda，miniconda的区别网页https://www.quora.com/What-is-the-comparison-among-conda-vs-
基于华为自研NPU Ascend 910的TensorFlow 1.x训练脚本迁移和使能混合精度记录 Tianyi Li 1997 华为云 tensorflow 华为人工智能深度学习 python
简介基于TesorFlow1.x以Sess.run形式搭建入门级——手写数字分类网络，并迁移到华为自研NPUAscend910，同时使能混合精度。硬件介绍华为自研NPUAscend910，即昇腾910AI处理器（简称NPU），根据官方介绍，是在2019年发布的人工智能（AI）专用的神经网络处理器，其算力高达256T，最新款算力高达310T，是业界主流芯片算力的2倍。当前业界大多数训练脚本基于Ten
PyTorch 与 TensorFlow 的深度解析：全面比较两大深度学习框架，助你选择最适合的工具 BuluAI 深度学习 pytorch tensorflow
在人工智能的浪潮中，深度学习框架成为了开发者们的得力助手。PyTorch和TensorFlow作为其中的佼佼者，各自拥有庞大的用户群体和强大的社区支持。但它们在设计理念、使用体验和应用场景上有着显著的差异。今天，我们就来深入探讨这两个框架的特点，帮助你在项目中做出更明智的选择。计算图的构建方式PyTorch的动态图机制是其一大特色。在PyTorch中，计算图是在程序运行时动态构建的，这使得开发者可
【深度学习入门实战】基于Keras的手写数字识别实战（附完整可视化分析）机器学习司猫白深度学习深度学习 keras 人工智能机器学习 python
本人主页：机器学习司猫白ok，话不多说，我们进入正题吧项目概述本案例使用经典的MNIST手写数字数据集，通过Keras构建全连接神经网络，实现0-9数字的分类识别。文章将包含：关键概念图解完整实现代码训练过程可视化模型效果深度分析环境准备importnumpyasnpimportmatplotlib.pyplotaspltfromtensorflowimportkerasfromtensorflo
Windows下安装CPU用的Tensorflow Coder LM Wang Python
刚在电脑上安装了Tensorflow，还是碰到了一些麻烦，记录一下：很多教程是介绍怎么在Linux平台下安装的，或者是Windows平台下GPU用的，很可惜，这些教程对我来说太麻烦了。安装步骤：1）安装Python。版本：python-3.6.4-amd64.exe。2）cmd，命令行输入：python，查看Python版本号，以验证Python是否安装成功了。3）继续在命令行输入：pipinst
conda 装tensorboardx_【工欲善其事】TensorboardX的使用 weixin_39719042 conda 装tensorboardx
“我不喜欢Tensorflow，但这并不妨碍我使用tensorboard”上一篇文章(https://zhuanlan.zhihu.com/p/39849027)，和大家简单地聊了一下关于如何在训练过程中有序地组织log问题。今天，想和大家简单地谈谈tensorboard的使用。经过社区的努力，目前PyTorch也可以使用tensorboard了。在训练过程中实时地观察loss/accuracy曲
深度学习-情感分析小赖同学啊人工智能深度学习人工智能
以下将分别使用PyTorch和TensorFlow框架实现基于深度学习的情感分析，这里以影评的情感分析为例，数据集使用IMDB影评数据集。使用PyTorch实现1.安装必要的库pipinstalltorchtorchtextspacypython-mspacydownloaden_core_web_sm2.代码实现importtorchimporttorch.nnasnnimporttorch.o
神经网络常见激活函数 9-CELU函数亲持红叶神经网络常见激活函数深度学习机器学习人工智能数学建模神经网络 python
文章目录CELU函数+导函数函数和导函数图像优缺点pytorch中的CELU函数tensorflow中的CELU函数CELU连续可微指数线性单元：CELU（ContinuouslyDifferentiableExponentialLinearUnit）,是一种连续可导的激活函数，结合了ELU和ReLU的特点，旨在解决ELU在某些情况下的梯度问题。函数+导函数CELU函数CELU(x)={xx≥0α
深度学习视频推荐小赖同学啊人工智能深度学习音视频人工智能
以下为你呈现一个基于深度学习实现视频推荐的简化代码示例。这里我们使用的是协同过滤思想结合神经网络的方式，借助TensorFlow和Keras库来构建模型。在这个示例中，假设已有用户对视频的评分数据，目标是预测用户对未评分视频的评分，进而为用户推荐可能感兴趣的视频。1.环境准备要确保你已经安装了必要的库，如numpy、pandas、tensorflow等，可以使用以下命令进行安装：pipinstal
神经网络常见激活函数 7-ELU函数亲持红叶神经网络常见激活函数深度学习机器学习人工智能数学建模神经网络
文章目录ELU函数+导函数函数和导函数图像优缺点pytorch中的ELU函数tensorflow中的ELU函数ELU指数线性单元：ELU（ExponentialLinearUnit）函数+导函数ELU函数ELU={xx>=0α(ex−1)x=0\\\alpha(e^x-1)\quad&x=0x=0αexx=0\\\alphae^x\quad&x=0x0,x,alpha*(np.exp(x)-1))
（python）如何看自己安装的包的版本 9677 Python python 开发语言
linuxpiplist|grep"numpy\|scipy\|tensorflow\|keras"windows环境下piplist|findstr"numpyscipytensorflowkeras"输出numpy1.13.1scipy0.19.1tensorflow-cpu2.4.0tensorflow-estimator2.4.0tensorflow-gpu2.4.0
【野生动物识别系统】Python+深度学习+人工智能+卷积神经网络算法+TensorFlow+ResNet+图像识别图像识别深度学习
一、介绍动物识别系统，使用Python作为主要开发语言，基于深度学习TensorFlow框架，搭建卷积神经网络算法。并通过对18种动物数据集进行训练，最后得到一个识别精度较高的模型。并基于Django框架，开发网页端操作平台，实现用户上传一张动物图片识别其名称。目前可识别的动物有：'乌龟','云豹','变色龙','壁虎','狞猫','狮子','猎豹','美洲狮','美洲虎','老虎','蜥蜴','
【蔬菜识别】Python+深度学习+CNN卷积神经网络算法+TensorFlow+人工智能+模型训练图像识别深度学习人工智能
一、介绍蔬菜识别系统，本系统使用Python作为主要编程语言，通过收集了8种常见的蔬菜图像数据集（'土豆','大白菜','大葱','莲藕','菠菜','西红柿','韭菜','黄瓜'），然后基于TensorFlow搭建卷积神经网络算法模型，通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面，实现用户上传一张蔬菜图片识别其名称。二、系统效果图片展示三、演示视
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
一、介绍蘑菇识别系统，本系统使用Python作为主要开发语言，基于TensorFlow搭建卷积神经网络算法，并收集了9种常见的蘑菇种类数据集【"香菇（Agaricus）","毒鹅膏菌（Amanita）","牛肝菌（Boletus）","网状菌（Cortinarius）","毒镰孢（Entoloma）","湿孢菌（Hygrocybe）","乳菇（Lactarius）","红菇（Russula）","
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出