街上人

Tensorflow笔记—5—神经网络优化—MSE损失函数，子定义损失函数和交叉熵损失函数

一. 定义

1.1激活函数

激活函数：引入非线性激活因素，提高模型的表达能力
常用的激活函数有relu、sigmoid、tanh等
(1)激活函数relu：在Tensorflow中，用tf.nn.relu()表示
(2)激活函数sigmoid：在Tensorflow中，用tf.nn.sigmoid()表示
(3)激活函数tanh：在Tensorflow中，用tf.nn.tanh()表示

1.2神经元

神经元模型：用数学公式比表示为：f(Σi xi*wi + b), f为激活函数
神经网络是以神经元为基本单位构成的
神经网络的复杂度：可用神经网络的的层数和神经网络中待优化参数个数表示
神经网络的层数：一般不计入输入层，层数 = n个隐藏层 + 1个输出层
神经网络待优化的参数：神经网络中所有参数w的个数 + 所有参数b的个数
在该神经网络中，包含1个输入层，1个隐藏层和1个输出层，该神经网络的参数为2层
在该神经网络中，参数的个数是所有参数w的个数加上所有参数b的总数，第一层参数用三行四列的二阶张量表示（即12个线上的权重w）再加上4个偏置b；第二层参数是四行二列的二阶张量（即8个线上的权重w）再加上2个偏置b
总参数 = 34+4 + 42+2 = 26

二. 损失函数

损失函数（loss）：用来表示预测（y）与已知答案（y_）的差距。在训练神经网络时，通过不断改变神经网络中所有参数，使损失函数不断减小，从而训练出更高准确率的神经网络模型
常用的损失函数有均方误差，自定义和交叉熵等

2.1 MSE均方误差

均方误差mse：n个样本的预测值（y）与（y_）的差距。在训练神经网络时，通过不断的改变神经网络中的所有参数，使损失函数不断减小，从而训练出更高准确率的神经网络模型。
在Tensorflow中用loss_mse = tf.reduce_mean(tf.square(y_-y))

具体实现：

预测酸奶日销量 y，x1 和 x2 是影响日销量的两个因素。应提前采集的数据有：一段时间内，每日的 x1 因素、x2 因素和销量 y_。采集的数据尽量多。在本例中用销量预测产量，最优的产量应该等于销量。由于目前没有数据集，所以拟造了一套数
据集。利用 Tensorflow 中函数随机生成 x1、 x2，制造标准答案 y_ = = x1 + x2，为了更真实，求和后还加了正负 0.05 的随机噪声。我们把这套自制的数据集喂入神经网络，构建一个一层的神经网络，拟合预测酸奶日销量的函数。

代码实现：

#预测酸奶日销量 y，x1 和 x2 是影响日销量的两个因素。
#应提前采集的数据有：一段时间内，每日的 x1 因素、x2 因素和销量 y_。采集的数据尽量多。
#在本例中用销量预测产量，最优的产量应该等于销量。由于目前没有数据集，所以拟造了一套数
#据集。利用 函数随机生成 x1、 x2，制造标准答案 y_ = = x1 + x2，为了更真实，求和后
#还加了正负 0.05 的随机噪声。
#我们把这套自制的数据集喂入神经网络，构建一个一层的神经网络，拟合预测酸奶日销量的函数
import tensorflow as tf
import numpy as np
BATCH_SIZE = 8
SEED = 23455

#基于seed产生随机数
rdm = np.random.RandomState(SEED)
#随机数返回32行2列的矩阵  表示32组   体积和重量   作为输入数据集
X = rdm.rand(32, 2)
#作为输入数据集的标签（正确答案）
Y_ = [[x1+x2+(rdm.rand()/10.0-0.05)] for(x1, x2) in X]

#定义神经网络的输入、参数和输出，定义前向传播过程
x = tf.placeholder(tf.float32, shape=(None, 2))
w1 = tf.Variable(tf.random_normal([2, 1], stddev=1, seed=1))
y_ = tf.placeholder(tf.float32, shape=(None, 1))    #正确答案，标签
y = tf.matmul(x, w1)    #N*1，预测答案

#定义损失函数以及反向传播方法
#损失函数为MSE，反向传播方法为梯度下降
loss_mse = tf.reduce_mean(tf.square(y_ - y))
train_step = tf.train.GradientDescentOptimizer(0.001).minimize(loss_mse)

#生成会话session，训练STEP轮
with tf.Session() as sess:
    #初始化参数
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    
    #训练模型，最关键步骤
    STEPS = 20000   #迭代次数
    for i in range(STEPS):
        start = (i*BATCH_SIZE) % 32
        end = start + BATCH_SIZE
        sess.run(train_step, feed_dict={x: X[start:end], y_: Y_[start:end]})     #喂数据，不断更新参数
        if i % 500 == 0:    #每迭代500次输出一次结果  损失函数loss在所有训练集上的损失值
            #total_loss = sess.run(loss, feed_dict={x: X, y_: Y_})    
            #print("After %d training step(s), loss on all data is %g" % (i, total_loss))
            print("After %d training steps, w1 is: " % i)
            print(sess.run(w1))
            print("\n")
    print("Final w1 is: ")  #打印最终参数w1
    print(sess.run(w1))
    #最终输出参数为0.98和1.02，销量预测结果为 y=0.98x1 + 1.02x2，标准答案为 y=x1 + x2
    # 销量预测结果和标准答案已非常接近，说明该神经网络预测酸奶日销量正确

实现结果（部分截取）：

#随着训练次数的增加，线上的参数不断变化
After 19000 training steps, w1 is: 
[[0.974931 ]
 [1.0206276]]


After 19500 training steps, w1 is: 
[[0.9777026]
 [1.0181949]]


Final w1 is: 
[[0.98019385]
 [1.0159807 ]]

结果分析：

有上述代码可知，本例中神经网络预测模型为y = w1x1 + w2x2，损失函数采用均方误差。通过使损失函数值（loss）不断降低，神经网络模型得到最终参数w1 = 0.98，w2 = 1.02，销量预测结果为y = 0.98x1 + 1.02x2。由于在生成数据集时，标准答案为y = x1 + x2，因此，销量预测结果和标准答案已经非常接近，说明该神经网络预测酸奶日销量正确。

2.2自定义损失函数

自定义损失函数：根据问题的实际情况，定制合理的损失函数
具体例子分析：
- 对于预测酸奶日销量问题，如果预测销量大于实际销量则会损失成本；如果预测销量小于实际销量则会损失利润。在实际生活中，往往制造一盒酸奶的成本和销售一盒酸奶的利润不是等价的。因此，需要使用符合该问题的自定义损失函数
- 自定义损失函数为：loss = Σnf(y_, y)
- 其中，损失函数成分段函数：
- Tensorflow函数表示为：loss = tf.reduce_sum(tf.where(tf.greater(y, y_), COST(y-y_), PROFIT(y_-y)))
- 损失函数表示：
  - 若预测结果y小于标准答案y_，损失函数为利润乘以预测结果y与标准答案之差
  - 若预测结果y大于标准答案y_，损失函数为成本乘以预测结果y与标准答案之差

具体例子分析：

（1）第1种情况：若酸奶成本COST为1元，酸奶销售利润PROFIT为9元，则制造成本小于酸奶利润。COST数值比PROFIT小，预测多的情况下比预测少的情况下，损失值更小。定义损失函数使得预测多的损失小，于是模型应该偏向多的方向预测。

实现代码：

#对于预测酸奶日销量问题，如果预测销量大于实际销量则会损失成本cost；如果预测销量小于实际销量则会损失利润profit
#若预测结果 y 小于标准答案 y_，损失函数为利润profit乘以预测结果 y 与标准答案 y_之差；
#若预测结果 y 大于标准答案 y_，损失函数为成本cost乘以预测结果 y 与标准答案 y_之差
import tensorflow as tf
import numpy as np
BATCH_SIZE = 8
SEED = 23455
COST = 1    #成本
PROFIT = 9  #利润

#基于seed产生随机数
rdm = np.random.RandomState(SEED)
#随机数返回32行2列的矩阵  表示32组   体积和重量   作为输入数据集
X = rdm.rand(32, 2)
#作为输入数据集的标签（正确答案）
Y_ = [[x1+x2+(rdm.rand()/10.0-0.05)] for(x1, x2) in X]

#定义神经网络的输入、参数和输出，定义前向传播过程
x = tf.placeholder(tf.float32, shape=(None, 2))
w1 = tf.Variable(tf.random_normal([2, 1], stddev=1, seed=1))
y_ = tf.placeholder(tf.float32, shape=(None, 1))    #正确答案，标签
y = tf.matmul(x, w1)    #N*1，预测答案

#定义损失函数（自定义）以及反向传播方法
#COST数值比PROFIT小，预测多的情况下比预测少的情况下，损失值更小
#定义损失函数使得预测多的损失小，于是模型应该偏向多的方向预测
loss = tf.reduce_sum(tf.where(tf.greater(y, y_), (y - y_)*COST, (y_ - y)*PROFIT))
train_step = tf.train.GradientDescentOptimizer(0.001).minimize(loss)

#生成会话session，训练STEP轮
with tf.Session() as sess:
    #初始化参数
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    
    #训练模型，最关键步骤
    STEPS = 3000   #迭代次数
    for i in range(STEPS):
        start = (i*BATCH_SIZE) % 32
        end = start + BATCH_SIZE
        sess.run(train_step, feed_dict={x: X[start:end], y_: Y_[start:end]})     #喂数据，不断更新参数
        if i % 500 == 0:    #每迭代500次输出一次结果  损失函数loss在所有训练集上的损失值
            #total_loss = sess.run(loss, feed_dict={x: X, y_: Y_})    
            #print("After %d training step(s), loss on all data is %g" % (i, total_loss))
            print("After %d training steps, w1 is: " % i)
            print(sess.run(w1))
            print("\n")
    print("Final w1 is: ")  #打印最终参数w1
    print(sess.run(w1))
    #神经网络最终参数为 w1=1.03， w2=1.05，销量预测结果为 y =1.03*x1 + 1.05*x2
    # 由此可见，采用自定义损失函数预测的结果大于采用均方误差预测的结果，更符合实际需求

实现结果（部分截取）：

After 2000 training steps, w1 is: 
[[1.0179386]
 [1.041272 ]]


After 2500 training steps, w1 is: 
[[1.0205938]
 [1.0390443]]


Final w1 is: 
[[1.0296593]
 [1.0484141]]

结果分析：

由代码执行结果可知，神经网络最终参数为w1=1.03，w2=1.05，销量预测结果为y = 1.03x1 + 1.05x2。由此可见，采用自定义损失函数预测的结果大于采用均方误差的结果，更符合实际需求。

（2）第2种情况：若酸奶成本为9元，酸奶销售利润为1元，则制造利润小于酸奶成本，COST数值比PROFIT大，预测多的情况下比预测少的情况下，损失值更大，定义损失函数使得预测多的损失大，于是模型应该偏向少的方向预测。

实现代码：

#对于预测酸奶日销量问题，如果预测销量大于实际销量则会损失成本cost；如果预测销量小于实际销量则会损失利润profit
#若预测结果 y 小于标准答案 y_，损失函数为利润profit乘以预测结果 y 与标准答案 y_之差；
#若预测结果 y 大于标准答案 y_，损失函数为成本cost乘以预测结果 y 与标准答案 y_之差
import tensorflow as tf
import numpy as np
BATCH_SIZE = 8
SEED = 23455
COST = 9
PROFIT = 1

#基于seed产生随机数
rdm = np.random.RandomState(SEED)
#随机数返回32行2列的矩阵  表示32组   体积和重量   作为输入数据集
X = rdm.rand(32, 2)
#作为输入数据集的标签（正确答案）
Y_ = [[x1+x2+(rdm.rand()/10.0-0.05)] for(x1, x2) in X]

#定义神经网络的输入、参数和输出，定义前向传播过程
x = tf.placeholder(tf.float32, shape=(None, 2))
w1 = tf.Variable(tf.random_normal([2, 1], stddev=1, seed=1))
y_ = tf.placeholder(tf.float32, shape=(None, 1))    #正确答案，标签
y = tf.matmul(x, w1)    #N*1，预测答案

#定义损失函数（自定义）以及反向传播方法
#COST数值比PROFIT大，预测多的情况下比预测少的情况下，损失值更大
#定义损失函数使得预测多的损失大，于是模型应该偏向少的方向预测
loss = tf.reduce_sum(tf.where(tf.greater(y, y_), (y - y_)*COST, (y_ - y)*PROFIT))
train_step = tf.train.GradientDescentOptimizer(0.001).minimize(loss)

#生成会话session，训练STEP轮
with tf.Session() as sess:
    #初始化参数
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    
    #训练模型，最关键步骤
    STEPS = 3000   #迭代次数
    for i in range(STEPS):
        start = (i*BATCH_SIZE) % 32
        end = start + BATCH_SIZE
        sess.run(train_step, feed_dict={x: X[start:end], y_: Y_[start:end]})     #喂数据，不断更新参数
        if i % 500 == 0:    #每迭代500次输出一次结果  损失函数loss在所有训练集上的损失值
            #total_loss = sess.run(loss, feed_dict={x: X, y_: Y_})    
            #print("After %d training step(s), loss on all data is %g" % (i, total_loss))
            print("After %d training steps, w1 is: " % i)
            print(sess.run(w1))
            print("\n")
    print("Final w1 is: ")  #打印最终参数w1
    print(sess.run(w1))
    #经网络最终参数为 w1=0.96，w2=0.97，销量预测结果为 y =0.96*x1 + 0.97*x2
    #采用自定义损失函数预测的结果小于采用均方误差预测的结果，更符合实际需求

实现结果（部分截取）：

After 2000 training steps, w1 is: 
[[0.9602475]
 [0.9742084]]


After 2500 training steps, w1 is: 
[[0.96100295]
 [0.96993417]]


Final w1 is: 
[[0.9600407 ]
 [0.97334176]]

结果分析：

由执行结果可知，神经网络最终参数为w1 = 0.96，w2 = 0.97，销量预测结果为y = 0.96+x1 + 0.7*x2。
因此，采用自定义损失函数预测的结果小于采用均方误差预测得结果，更符合实际需求

2.3 交叉熵损失函数

交叉熵（Cross Entropy）：表示两个概率分布之间的距离，交叉熵越大，两个概率分布距离越远，两个概率分布越相异；交叉熵越小，两个概率分布距离越近，两个概率分布越相似
交叉熵计算公式：H(y_, y) = -Σy_ * log y
用 Tensorflow 函数表示

ce = -tf.reduce_mean(y_*tf.clip_by_value(y, le-12, 1.0)))
例如：
两个神经网络模型解决二分类问题中，已知标准答案为 y_ = (1, 0)，第一个神经网络模型预测结果为 y1 = (0.6, 0.4)，第二个神经网络模型预测结果为 y2 = (0.8, 0.2)，判断哪个神经网络模型预测得结果更接近标准答案
根据交叉熵的计算公式得：

H(1, 0), (0.6, 0.4) = -(1 * log0.6 + 0log0.4) ≈ -(-0.222 + 0) = 0.222
H(1, 0), (0.8, 0.2) = -(1 log0.8 + 0*log0.2) ≈ -(-0.097 + 0) = 0.097

softmax 函数

softmax 函数：将 n 分类中的 n 个输出（y1, y2...yn）变为满足以下概率分布要求的函数: ∀x = P(X = x) ∈ [0, 1]
softmax 函数表示为：
softmax 函数应用：在 n 分类中，模型会有 n 个输出，即 y1，y2 ... n, 其中yi表示第 i 中情况出现的可能性大小。将 n 个输出经过 softmax 函数，可得到符合概率分布的分类结果
在 Tensorflow 中，一般让模型的输出经过 softmax 函数，以获得输出分类的概率分布再与标准答案对比，求出交叉熵，得到损失函数，用如下函数实现：

ce = tf.nn.sparse_softmax_cross_entropy_with_logits(logits = y, labels = tf.argmax(y_, 1))
cem = tf.reduce_mean(ce)

具体代码：

#预测酸奶日销量 y，x1 和 x2 是影响日销量的两个因素。
#应提前采集的数据有：一段时间内，每日的 x1 因素、x2 因素和销量 y_。采集的数据尽量多。
#在本例中用销量预测产量，最优的产量应该等于销量。由于目前没有数据集，所以拟造了一套数
#据集。利用 函数随机生成 x1、 x2，制造标准答案 y_ = = x1 + x2，为了更真实，求和后
#还加了正负 0.05 的随机噪声。
#我们把这套自制的数据集喂入神经网络，构建一个一层的神经网络，拟合预测酸奶日销量的函数

#交叉熵(Cross Entropy)：表示两个概率分布之间的距离，交叉熵越大，两个概率分布距离越远，两概率分布越相异；
# 交叉熵越小，两个概率分布 距离 越近 ，两个概率分布越相似
import tensorflow as tf
import numpy as np
BATCH_SIZE = 8
SEED = 23455

#基于seed产生随机数
rdm = np.random.RandomState(SEED)
#随机数返回32行2列的矩阵  表示32组   体积和重量   作为输入数据集
X = rdm.rand(32, 2)
#作为输入数据集的标签（正确答案）
Y_ = [[x1+x2+(rdm.rand()/10.0-0.05)] for(x1, x2) in X]

#定义神经网络的输入、参数和输出，定义前向传播过程
x = tf.placeholder(tf.float32, shape=(None, 2))
w1 = tf.Variable(tf.random_normal([2, 1], stddev=1, seed=1))
y_ = tf.placeholder(tf.float32, shape=(None, 1))    #正确答案，标签
y = tf.matmul(x, w1)    #N*1，预测答案

#定义损失函数以及反向传播方法
#损失函数为交叉熵，反向传播方法为梯度下降
#在Tensorflow中，一般让模型的过输出经过sofemax函数，以获得输出分类的概率分布
# 再与标准答案对比，求出交叉熵，得到损失函数
ce = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y, labels=tf.argmax(y_, 1))
cem = tf.reduce_mean(ce)
train_step = tf.train.GradientDescentOptimizer(0.001).minimize(cem)

#生成会话session，训练STEP轮
with tf.Session() as sess:
    #初始化参数
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    
    #训练模型，最关键步骤
    STEPS = 20000   #迭代次数
    for i in range(STEPS):
        start = (i*BATCH_SIZE) % 32
        end = start + BATCH_SIZE
        sess.run(train_step, feed_dict={x: X[start:end], y_: Y_[start:end]})     #喂数据，不断更新参数
        if i % 500 == 0:    #每迭代500次输出一次结果  损失函数loss在所有训练集上的损失值
            print("After %d training steps, w1 is: " % i)
            print(sess.run(w1))
            print("\n")
    print("Final w1 is: ")  #打印最终参数w1
    print(sess.run(w1))

实现结果（部分截取）：

After 18500 training steps, w1 is: 
[[-0.8113182]
 [ 1.4845988]]


After 19000 training steps, w1 is: 
[[-0.8113182]
 [ 1.4845988]]


After 19500 training steps, w1 is: 
[[-0.8113182]
 [ 1.4845988]]


Final w1 is: 
[[-0.8113182]
 [ 1.4845988]]

tenorflow 小鱼儿小于儿 tensorflow
tensorflow笔记3MNIST数据集共7万张图片，都是28*28像素点的手写数字图片。6万张用于训练，1万张用于测试。importtensorflowastfmnist=tf.keras.datasets.mnist(x_train,y_train),(x_test,y_test)=mnist.load_data()#直接送数据集中读取训练集和测试机x_train,x_test=x_trai
关于CNN 御风之星
1.理解卷积神经网络中的通道channel2.手把手教你用TensorFlow实现卷积神经网络3.tensorflow笔记：多层CNN代码分析
2021-07-02 fisher-nuc tensorflow 神经网络
基于TensorFlow搭建的几种经典的卷积神经网络注：本文是本人一门课程的期末大作业，在学习曹建老师（人工智能实践：TensorFlow笔记）的课程时记录的笔记。在进行整理后写的一篇小文章，具体详解可以在B站或者MOOC上搜索相关课程。课程网站：https://www.icourse163.org/learn/PKU-1002536002?tid=1003797005#/learn/announ
（一）tensorflow笔记：Tensor数据类型阿松丶 TensorFlow详细笔记 tensorflow python 深度学习
常见的数据类型载体listnp.arraytf.tensorlist:可以存储不同数据类型，缺点不适合存储较大的数据，如图片np.array:解决同类型大数据数据的载体，方便数据运算，缺点是在深度学习之前就设计好的，不支持GPUtf.tensor:更适合深度学习，支持GPUTensor是什么scalar:1.1vector:[1.1],[1.1,2.2,……]matrix:[[1,2,3,],[4
tensorflow笔记（编程理论部分） orangehsc tensorflow python 矩阵算法
TensorFlow笔记（编程理论部分）注：该笔记是阅读TensorFlow深度学习算法原理与编程实战第三章后做的框架梳理和部分个人见解。Tensorflow之名由Tensor和Flow组成，Tensor意为张量，可以理解为数组；Flow意为流动，指张量数据沿着边在不同的节点间流动并发生转化。1.1计算图TensorFlow中的各种操作，如加权求和，激活函数等，都被编排成一个图，称为计算图。计算图
tensorflow笔记 _夏雨潇潇
#tensorflow笔记一个小例子#用numpy构造数据x_data=np.random.rand(100).astype(np.float32)y_data=x_data*0.1+0.3#tf.Variable定义了一个变量，random_uniform表示用随机的方式生成变量的初始值#1表示这个变量是一维的，变量的初始范围是-1到1Weights=tf.Variable(tf.random_
TensorFlow笔记之卷积神经网络 Mr_Stutter Python机器学习 cnn tensorflow 深度学习
文章目录前言一、卷积神经网络CNN二、Tensorflow1.x1.加载数据集2.数据处理3.定义模型4.训练模型5.结果可视化二、Tensorflow2.x1.加载数据集2.数据处理3.定义模型4.训练模型5.结果可视化总结前言记录在tf1.x与tf2.x中使用卷积神经网络完成CIFAR-10数据集识别多分类任务，并进行断点续训。一、卷积神经网络CNN1、全连接网络：参数增多，速度减慢，过拟合2
tensorflow笔记----3---ANN对mnist数据集分类骑着蜗牛逛世界 tensorflow
tensorfllow实现两层MLP对mnist分类，第一层256个神经元，第二层128个神经元，输入784，输出10分类#!/usr/bin/python#-*-coding:utf-8-*-__author__="chunming"importtensorflowastffromtensorflow.examples.tutorials.mnistimportinput_datamnist=i
Tensorflow笔记 3.3 反向传播 CCWUCMCTS
概念反向传播训练模型参数，在所有参数上使用梯度下降，使NN模型在训练数据上的损失函数最小。损失函数预测值与已知答案的差距。均方误差loss=tf.reduce_mean(tf.square(y_-y))反向传播的训练方法三种方式，见代码。学习率参数更新幅度。实战loss#coding:utf-8#0导入模块，生成模拟数据集。importtensorflowastfimportnumpyasnpBA
DL with python(16)——tensorflow实现InceptionNet(GoogLeNet) 佟湘玉滴玉 Python深度学习深度学习 python
本文涉及到的是中国大学慕课《人工智能实践：Tensorflow笔记》第五讲第14节的内容，对tensorflow环境下经典卷积神经网络的搭建进行介绍，其基础是DLwithpython(14)——tensorflow实现CNN的“八股”中的代码，将其中第三步的代码替换为本文中的代码均可直接运行，其他部分无需改变。经典的卷积神经网络有以下几种，这里介绍结构较为复杂的InceptionNet，其实现的方
[tensorflow笔记]-tensorflow实现带mask的reduce_mean 黄然大悟 Tensorflow &Keras tensorflow reduce_mean mask平均
在使用tensorflow处理一些tensor时，有时需要对一个tensor取平均，可以使用tf.reduce_mean操作，但是这个没法处理带有mask的tensor数据，本文主要就是利用tensorflow的基本操作实现带mask的平均。tf.reduce_mean比如我们的数据是3维tensor，shape=（B，N，H），B表示batch_size、N表示最大长度、H表示向量维度，这样的3
学习tensorflow笔记1、梯度计算 weixin_51298826 tensorflow学习笔记 tensorflow python 深度学习
1、梯度计算学习北京大学的mooc，记录笔记代码块：生成一个变量w初值为5，设定为可训练学习率lr大小会影响梯度下降的速度和步幅迭代次数epochimporttensorflowastfimportmatplotlib.pyplotaspltw=tf.Variable(tf.constant(5,dtype=tf.float32))lr=0.9epoch=40plt_show=[]forepoch
Tensorflow笔记——tf.layers.dense的用法 ·城府、深度学习神经网络
1.tf.layers.dense的用法dense：相当于一个全连接层函数解释如下：tf.layers.dense(inputs,units,activation=None,use_bias=True,kernel_initializer=None,bias_initializer=tf.zeros_initializer(),kernel_regularizer=None,bias_regula
TensorFlow笔记之神经网络完成多分类任务 Mr_Stutter Python机器学习 tensorflow 神经网络分类
文章目录前言一、数据集调用二、Tensorflow1.x1.单隐藏层2.模型保存与调用三、Tensorflow2.x1.全连接层类2.keras建模总结前言对TensorFlow笔记之单神经元完成多分类任务进行修改，在tf1.x与tf2.x中使用神经网络完成手写体数字识别多分类任务。一、数据集调用数据集调用与预处理和上一篇完全相同#数据集调用,在tensorflow2.x中调用数据集importt
TensorFlow2安装（超详细步骤-人工智能实践）不唐 Python 深度学习 TensorFlow tensorflow 深度学习 python
TensorFlow2安装教程1前言1.1版本记录1.2工具简介2详细步骤及安装语句2.1安装Anaconda2.2TensoFlow安装2.3验证是否成功2.4PyCharm下载与安装2.5PyCharm环境配置2.5.1不唐初尝试1前言点滴进步，加油！最近在MOOC看北京大学的曹健老师的《人工智能实践：Tensorflow笔记》课程。其中第一章的第8节提到了详细的TensorFlow安装过程。
tensorflow笔记（十九）——错误集锦 starxhong tensorflow tensorflow 深度学习错误
错误及应对方案1，问题：训练正常，预测和评估的时候报OOM：办法：减少预测和训练的batchsize，或者减少网络参数。参考：ResourceExhaustedError(seeabovefortraceback):OOMwhenallocatingtensorofshape[7744,512]#33932，问题：从dataset打印数据，报错OP_REQUIRESfailedatexample_
InceptionNet与ResNet 九思Atopos tensorflow笔记深度学习 python tensorflow
以下代码图片思路来源：北京大学Tensorflow笔记嗯,最近学了一下神经网络，并没有很难，主要是把代码背下来，然后掌握Tensorflow是怎么搭建网络的，Tensorflow是比pytorch好用的，我直接抄的代码里面，训练还要自己写循环，，而tensonflow直接调用fit函数即可和老师做了一下InceptionNet还有ResNet，ResNet主要是有一条path，由于维度不同需要使用
TensorFlow笔记之多元线性回归 Mr_Stutter Python机器学习 tensorflow 线性回归 python
文章目录前言一、数据处理二、TensorFlow1.x1.定义模型2.训练模型3.结果可视化4.模型预测5.TensorBoard可视化三、TensorFlow2.x1.定义模型2.训练模型3.结果可视化4.模型预测总结前言记录使用TensorFlow1.x和TensorFlow2.x完成多元线性回归的过程。一、数据处理在此使用波士顿房价数据集，包含506个样本，输入为12个房屋信息特征，输出为房
TensorFlow笔记之单变量线性回归 Mr_Stutter Python机器学习 tensorflow 线性回归
文章目录前言一、数据集生成二、TensorFlow1.x1.定义模型2.训练模型3.模型预测三、TensorFlow2.x1.定义模型2.训练模型3.模型预测总结前言记录使用TensorFlow1.x和TensorFlow2.x完成单变量线性回归的过程。一、数据集生成生成带标准正态分布噪声的y=2x+1数据集importnumpyasnpimportmatplotlib.pyplotasplt#数
Tensorflow笔记之【神经网络的初步搭建】不理不理不理左卫门机器学习 Tensorflow
一、基本概念基于Tensorflow的神经网络用张量表示数据，用计算图搭建神经网络，用会话执行计算图，优化线上的权重，得到模型。张量——多维数组参数——神经元线上的权重计算图——搭建神经网络的计算过程，只搭建不计算会话——执行计算图中的节点运算例：矩阵乘法importtensorflowastf#引入模块x=tf.constant([[1.0,2.0]])#定义一个2阶1x2张量等于[[1.0,2
TensorFlow笔记之单神经元完成多分类任务 Mr_Stutter Python机器学习 tensorflow 分类
文章目录前言一、逻辑回归1.二分类问题2.多分类问题二、数据集调用三、TensorFlow1.x1.定义模型2.训练模型3.结果可视化四、TensorFlow2.x1.定义模型2.训练模型3.结果可视化总结前言记录分别在TensorFlow1.x与TensorFlow2.x中使用单神经元完成MNIST手写数字识别的过程。一、逻辑回归将回归值映射为各分类的概率1.二分类问题1.sigmod函数：y=
1TensorFlow笔记——基础概念简介&Python简明教程 weixin_45165961 python tensorflow
0.1人工智能让机器看起来跟人一样，目前处于弱人工智能NarrowAI，距离强人工智能GeneralAI还有很大一段路要走。0.1.1机器学习让计算机自动学习，获得规律（模型），用新规律预测。0.1.2分类有监督学习：给带结果的数据进行训练，线性回归、逻辑回归、支持向量机、随机森林等。无监督学习：给数据，找规律进行分类，常见的无监督学习算法有自编码器、生成对抗网络等。半监督学习：给一小部分有标注数
人工智能学习第一篇（tensorflow笔记）＆ Pumbaa tensorflow
本文是在学习北大课程“人工智能实践：tensorflow笔记”的基础上，自己做的笔记，用于温故知新。张量（Tensor）:多维数组（列表）阶：张量的维数（从0开始）张量可以表示0阶到n阶数组（列表）eg1:importtensorflowastfa=tf.constant([1,5],dtype=tf.int64)print(a)print(a.dtype)print(a.shape)结果：tf.
神经网络学习笔记——鸢尾花分类 XL_0502 神经网络学习笔记神经网络 tensorflow
TensorFlow笔记——鸢尾花分类代码笔记记录实验流程和代码功能，附上关于所涉及到的tensorflow库中函数的解释实验流程数据集读入数据集乱序生成训练集和测试集(即x_train/y_train)数据类型转换配成(输入特征，标签)对，每次读入一小撮(batch)搭建网络定义神经网路中所有可训练参数参数优化嵌套循环迭代，with结构更新参数，显示当前loss测试效果计算当前参数前向传播后的准
用tensorflow搭建全连接神经网络实现mnist数据集的识别 humuhumunukunukuapua 爱好 machine learning mnist tensorflow
说明：本代码来自于北京大学曹健老师的MOOC人工智能实践：Tensorflow笔记第五讲I前向传播网络搭建在mnist_forward.py中搭建两层全连接网络，这里面就是定义层数，节点数，激活函数这些。输入节点数目就是mnist数据集的图片28*28大小，用784行的向量作为输入。第一层y1=relu（x*w1+b1）其中y1为500行的向量。那么w1里面就有784*500个变量啦～～b1是50
TensorFlow笔记_05——神经网络八股功能拓展要什么自行车儿 #TensorFlow2.0 tensorflow 神经网络深度学习
目录5.神经网络八股功能拓展5.1自制数据集，解决本领域应用5.2数据增强，扩充数据集5.3断点续训，存取模型5.3.1读取保存模型5.4参数提取，把参数存入文本5.5acc/loss可视化，查看训练效果5.6应用程序，给图实物（手写数字识别）上一篇：TensorFlow笔记_04——八股搭建神经网络下一篇：敬请期待5.神经网络八股功能拓展5.1自制数据集，解决本领域应用defgenerateds
TensorFlow笔记之：填充使用tf.sequence_mask()函数详细说明和应用场景模糊包 TensorFlow
tf.sequence_mask()函数这个函数目前我主要用于数据填充时候使用。文章目录tf.sequence_mask()函数1.函数介绍2.参数解释要点解释：3.函数举例4.注意事项和应用场景1.函数介绍这个是官方定义，耐心看完解释再看后面的例子，你会一下就懂了。#函数定义sequence_mask(lengths,maxlen=None,dtype=tf.bool,name=None)#返回
小白笔记：深度学习之Tensorflow笔记（七：神经网络优化过程） my小马 tensorflow 深度学习神经网络 tensorflow 深度学习
激活函数激活函数是用来加入非线性因素的，因为线性模型的表达能力不够。引入非线性激活函数，可使深层神经网络的表达能力更加强大。简化模型：MP模型：优秀的激活函数：•非线性：激活函数非线性时，多层神经网络可逼近所有函数•可微性：优化器大多用梯度下降更新参数•单调性：当激活函数是单调的，能保证单层网络的损失函数是凸函数•近似恒等性：f(x)≈x当参数初始化为随机小值时，神经网络更稳定激活函数输出值的范围
人工智能实践：Tensorflow笔记 Class 2：神经网络优化 By4te 机器学习 Python tensorflow 人工智能神经网络
目录2.1基础知识2.2复杂度学习率1.复杂度2.学习率2.3激活函数1.sigmoid函数2.tanh函数3.relu函数4.leaky-relu函数2.4损失函数1.均方误差2.自定义损失函数3.交叉熵损失函数4.softmax与交叉熵结合2.5缓解过拟合正则化2.6优化器1.SGD2.SGDM3.Adagrad4.RMSProp5.Adam2.1基础知识2.2复杂度学习率1.复杂度2.学习率
《人工智能实践：Tensorflow笔记》听课笔记24_7.1卷积神经网络 RENeast 人工智能人工智能
附：课程链接第七讲.卷积神经网络7.1卷积神经网络由于个人使用Win7系统，并未完全按照课程所讲，以下记录的也基本是我的结合课程做的Windows系统+PyCharm操作。且本人有python基础，故一些操作可能简略。并未完全按照网课。记住编写代码时，除注释内容外，字符均使用英文格式。一、回顾及展开前两讲中我们利用全连接网络实现了对mnist数据集的训练，我们已学会使用数据集训练模型，并让训练好的
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户

Tensorflow笔记—5—神经网络优化—MSE损失函数，子定义损失函数和交叉熵损失函数

一. 定义

1.1激活函数

1.2神经元

二. 损失函数

2.1 MSE均方误差

具体实现：

2.2自定义损失函数

具体例子分析：

2.3 交叉熵损失函数

softmax 函数

你可能感兴趣的:(Tensorflow笔记)