Ma Sizhou

Tensorflow笔记——第二讲：神经网络优化

目录

2.1 预备知识

2.1.1 tf.where()函数：

2.1.2 np.random.RandomState.rand()返回一个[0,1)之间的随机数：

2.1.3 np.vstack() 将两个数组按垂直方向叠加：

2.1.4 np.mgrid[ ] 、.ravel( ) 、np.c_[ ]三个函数结合使用，生成网格坐标点：

2.2 神经网络（NN）复杂度学习率

2.1.1 神经网络（NN）复杂度:

2.2.2 学习率

2.3 激活函数

2.3.1 Sigmoid激活函数：

2.3.2 Tanh激活函数：

2.3.3 Relu激活函数：

2.3.4 Leaky Relu激活函数，为解决Relu在负区间梯度消失：

2.4 损失函数

2.4.1 均方误差mse：

2.4.2 自定义损失函数：

2.4.3 交叉熵损失函数CE(Cross Entropy)：表征两个概率分布之间的距离：

2.4.4 softmax与交叉熵结合：

2.5 缓解过拟合

2.5.1 什么是欠拟合与过拟合：

2.5.2 欠拟合与过拟合解决方案：

2.5.3 正则化缓解过拟合：

2.6 优化器

2.6.1 神经网络参数优化器：

2.6.2 随机梯度下降：SGD（无momentum，也就是不含动量）

2.6.3 SGDM（含momentum的SGD），在SGD基础上增加一阶动量

2.6.4 Adagrad，在SGD基础上增加二阶动量

2.6.5 RMSProp，SGD基础上增加二阶动量

2.6.6 Adam, 同时结合SGDM一阶动量和RMSProp二阶动量

2.1 预备知识

2.1.1 tf.where()函数：

上面的tf.greater(a,b)函数：

功能：比较a、b两个值的大小
返回值：一个列表,元素值都是true和false。如上面应该返回tf.Tensor([ True True False False False], shape=(5,), dtype=bool)

2.1.2 np.random.RandomState.rand()返回一个[0,1)之间的随机数：

2.1.3 np.vstack() 将两个数组按垂直方向叠加：

2.1.4 np.mgrid[ ] 、.ravel( ) 、np.c_[ ]三个函数结合使用，生成网格坐标点：

下面的x为了和y维度一致，所以扩充了。

2.2 神经网络（NN）复杂度学习率

2.1.1 神经网络（NN）复杂度:

2.2.2 学习率

那设置什么样的学习率比较好呢，或者说学习率怎么设置？

使用指数衰减学习率来解决，下面公式中绿色的是超参数，其中 “学习衰减率 ” 是指学习率按这个比例减小，注意后面括号中的在这个 “学习衰减率 ”的指数上：

2.3 激活函数

激活函数的加入提升了模型的表达能力。

下面看看常用的激活函数：

2.3.1 Sigmoid激活函数：

2.3.2 Tanh激活函数：

2.3.3 Relu激活函数：

2.3.4 Leaky Relu激活函数，为解决Relu在负区间梯度消失：

2.4 损失函数

2.4.1 均方误差mse：

上面例子的代码如下：

import tensorflow as tf
import numpy as np

SEED = 23455

rdm = np.random.RandomState(seed=SEED)  # 生成[0,1)之间的随机数
x = rdm.rand(32, 2)
y_ = [[x1 + x2 + (rdm.rand() / 10.0 - 0.05)] for (x1, x2) in x]  # 生成噪声[0,1)/10=[0,0.1); [0,0.1)-0.05=[-0.05,0.05)
x = tf.cast(x, dtype=tf.float32)

w1 = tf.Variable(tf.random.normal([2, 1], stddev=1, seed=1))

epoch = 15000
lr = 0.002

for epoch in range(epoch):
    with tf.GradientTape() as tape:
        y = tf.matmul(x, w1)
        loss_mse = tf.reduce_mean(tf.square(y_ - y))

    grads = tape.gradient(loss_mse, w1)  # 计算w1的梯度
    w1.assign_sub(lr * grads)   # 更新参数w1

    if epoch % 500 == 0:
        print("After %d training steps,w1 is " % (epoch))
        print(w1.numpy(), "\n")
print("Final w1 is: ", w1.numpy())

2.4.2 自定义损失函数：

MSE损失默认损失的成本和损失的利润是一样的，但实际上是不一样的，这时就需要自定义损失函数了。

代码如下：

import tensorflow as tf
import numpy as np

SEED = 23455
COST = 1
PROFIT = 99

rdm = np.random.RandomState(SEED)
x = rdm.rand(32, 2)
y_ = [[x1 + x2 + (rdm.rand() / 10.0 - 0.05)] for (x1, x2) in x]  # 生成噪声[0,1)/10=[0,0.1); [0,0.1)-0.05=[-0.05,0.05)
x = tf.cast(x, dtype=tf.float32)

w1 = tf.Variable(tf.random.normal([2, 1], stddev=1, seed=1))

epoch = 10000
lr = 0.002

for epoch in range(epoch):
    with tf.GradientTape() as tape:
        y = tf.matmul(x, w1)
        loss = tf.reduce_sum(tf.where(tf.greater(y, y_), (y - y_) * COST, (y_ - y) * PROFIT))

    grads = tape.gradient(loss, w1)
    w1.assign_sub(lr * grads)

    if epoch % 500 == 0:
        print("After %d training steps,w1 is " % (epoch))
        print(w1.numpy(), "\n")
print("Final w1 is: ", w1.numpy())

# 自定义损失函数
# 酸奶成本1元， 酸奶利润99元
# 成本很低，利润很高，人们希望多预测些，生成模型系数大于1，往多了预测

2.4.3 交叉熵损失函数CE(Cross Entropy)：表征两个概率分布之间的距离：

tensorflow是这样写交叉熵损失函数的，看下面：

2.4.4 softmax与交叉熵结合：

2.5 缓解过拟合

2.5.1 什么是欠拟合与过拟合：

2.5.2 欠拟合与过拟合解决方案：

2.5.3 正则化缓解过拟合：

首先要知道什么是正则化，这里我把以前手写的吴恩达老师课程的笔记放在这里，加深理解：

下面看看L2正则化计算Loss w的过程：

用一个实际的例子来说明，下面的数据有两个输入特征和一个输出标签，用已知数据训练一个神经网络，来判断在未知数据上的标签是0还是1。

数据：
链接：https://pan.baidu.com/s/18U-rjPk3zi9IbdF-tuTxEA
提取码：cyc2

思路是这样的：先用神经网络拟合出标签x1、x2与标签y_c的函数关系；然后以x1、x2作为横纵坐标可视化这些点，生成网格覆盖这些点；再把这些网络的交点，也就是横纵坐标作为输入送入训练好的神经网络，神经网络会为每个坐标输出一个预测值。我们要区分输出偏向1还是0，可以把神经网络输出的预测值为0.5的线标出颜色，这条线就是0和1的区分线了。

没使用正则化的代码以及可视化结果：

# 导入所需模块
import tensorflow as tf
from matplotlib import pyplot as plt
import numpy as np
import pandas as pd

# 读入数据/标签 生成x_train y_train
df = pd.read_csv('dot.csv')
x_data = np.array(df[['x1', 'x2']])
y_data = np.array(df['y_c'])

x_train = np.vstack(x_data).reshape(-1, 2)
y_train = np.vstack(y_data).reshape(-1, 1)

Y_c = [['red' if y else 'blue'] for y in y_train]

# 转换x的数据类型，否则后面矩阵相乘时会因数据类型问题报错
x_train = tf.cast(x_train, tf.float32)
y_train = tf.cast(y_train, tf.float32)

# from_tensor_slices函数切分传入的张量的第一个维度，生成相应的数据集，使输入特征和标签值一一对应
train_db = tf.data.Dataset.from_tensor_slices((x_train, y_train)).batch(32)

# 生成神经网络的参数，输入层为2个神经元，隐藏层为11个神经元，1层隐藏层，输出层为1个神经元
# 用tf.Variable()保证参数可训练
w1 = tf.Variable(tf.random.normal([2, 11]), dtype=tf.float32)
b1 = tf.Variable(tf.constant(0.01, shape=[11]))

w2 = tf.Variable(tf.random.normal([11, 1]), dtype=tf.float32)
b2 = tf.Variable(tf.constant(0.01, shape=[1]))

lr = 0.005  # 学习率
epoch = 800  # 循环轮数

# 训练部分
for epoch in range(epoch):
    for step, (x_train, y_train) in enumerate(train_db):
        with tf.GradientTape() as tape:  # 记录梯度信息

            h1 = tf.matmul(x_train, w1) + b1  # 记录神经网络乘加运算
            h1 = tf.nn.relu(h1)
            y = tf.matmul(h1, w2) + b2

            # 采用均方误差损失函数mse = mean(sum(y-out)^2)
            loss = tf.reduce_mean(tf.square(y_train - y))

        # 计算loss对各个参数的梯度
        variables = [w1, b1, w2, b2]
        grads = tape.gradient(loss, variables)

        # 实现梯度更新
        # w1 = w1 - lr * w1_grad tape.gradient是自动求导结果与[w1, b1, w2, b2] 索引为0，1，2，3 
        w1.assign_sub(lr * grads[0])
        b1.assign_sub(lr * grads[1])
        w2.assign_sub(lr * grads[2])
        b2.assign_sub(lr * grads[3])

    # 每20个epoch，打印loss信息
    if epoch % 20 == 0:
        print('epoch:', epoch, 'loss:', float(loss))

# 预测部分
print("*******predict*******")
# xx在-3到3之间以步长为0.01，yy在-3到3之间以步长0.01,生成间隔数值点
xx, yy = np.mgrid[-3:3:.1, -3:3:.1]
# 将xx , yy拉直，并合并配对为二维张量，生成二维坐标点
grid = np.c_[xx.ravel(), yy.ravel()]
grid = tf.cast(grid, tf.float32)
# 将网格坐标点喂入神经网络，进行预测，probs为输出
probs = []
for x_test in grid:
    # 使用训练好的参数进行预测
    h1 = tf.matmul([x_test], w1) + b1
    h1 = tf.nn.relu(h1)
    y = tf.matmul(h1, w2) + b2  # y为预测结果
    probs.append(y)

# 取第0列给x1，取第1列给x2
x1 = x_data[:, 0]
x2 = x_data[:, 1]
# probs的shape调整成xx的样子
probs = np.array(probs).reshape(xx.shape)
plt.scatter(x1, x2, color=np.squeeze(Y_c))  # squeeze去掉纬度是1的纬度,相当于去掉[['red'],[''blue]],内层括号变为['red','blue']
# 把坐标xx yy和对应的值probs放入contour函数，给probs值为0.5的所有点上色  plt.show()后 显示的是红蓝点的分界线
plt.contour(xx, yy, probs, levels=[.5])
plt.show()

# 读入红蓝点，画出分割线，不包含正则化
# 不清楚的数据，建议print出来查看

可看到轮廓不够平滑，存在过拟合现象。

正则化预测代码及可视化：

# 导入所需模块
import tensorflow as tf
from matplotlib import pyplot as plt
import numpy as np
import pandas as pd

# 读入数据/标签 生成x_train y_train
df = pd.read_csv('dot.csv')
x_data = np.array(df[['x1', 'x2']])
y_data = np.array(df['y_c'])

x_train = x_data
y_train = y_data.reshape(-1, 1)

Y_c = [['red' if y else 'blue'] for y in y_train]

# 转换x的数据类型，否则后面矩阵相乘时会因数据类型问题报错
x_train = tf.cast(x_train, tf.float32)
y_train = tf.cast(y_train, tf.float32)

# from_tensor_slices函数切分传入的张量的第一个维度，生成相应的数据集，使输入特征和标签值一一对应
train_db = tf.data.Dataset.from_tensor_slices((x_train, y_train)).batch(32)

# 生成神经网络的参数，输入层为4个神经元，隐藏层为32个神经元，2层隐藏层，输出层为3个神经元
# 用tf.Variable()保证参数可训练
w1 = tf.Variable(tf.random.normal([2, 11]), dtype=tf.float32)
b1 = tf.Variable(tf.constant(0.01, shape=[11]))

w2 = tf.Variable(tf.random.normal([11, 1]), dtype=tf.float32)
b2 = tf.Variable(tf.constant(0.01, shape=[1]))

lr = 0.005  # 学习率为
epoch = 800  # 循环轮数

# 训练部分
for epoch in range(epoch):
    for step, (x_train, y_train) in enumerate(train_db):
        with tf.GradientTape() as tape:  # 记录梯度信息

            h1 = tf.matmul(x_train, w1) + b1  # 记录神经网络乘加运算
            h1 = tf.nn.relu(h1)
            y = tf.matmul(h1, w2) + b2

            # 采用均方误差损失函数mse = mean(sum(y-out)^2)
            loss_mse = tf.reduce_mean(tf.square(y_train - y))
            # 添加l2正则化
            loss_regularization = []
            # tf.nn.l2_loss(w)=sum(w ** 2) / 2
            loss_regularization.append(tf.nn.l2_loss(w1))
            loss_regularization.append(tf.nn.l2_loss(w2))
            # 求和
            # 例：x=tf.constant(([1,1,1],[1,1,1]))
            #   tf.reduce_sum(x)
            # >>>6
            loss_regularization = tf.reduce_sum(loss_regularization)
            loss = loss_mse + 0.03 * loss_regularization  # REGULARIZER = 0.03

        # 计算loss对各个参数的梯度
        variables = [w1, b1, w2, b2]
        grads = tape.gradient(loss, variables)

        # 实现梯度更新
        # w1 = w1 - lr * w1_grad
        w1.assign_sub(lr * grads[0])
        b1.assign_sub(lr * grads[1])
        w2.assign_sub(lr * grads[2])
        b2.assign_sub(lr * grads[3])

    # 每200个epoch，打印loss信息
    if epoch % 20 == 0:
        print('epoch:', epoch, 'loss:', float(loss))

# 预测部分
print("*******predict*******")
# xx在-3到3之间以步长为0.01，yy在-3到3之间以步长0.01,生成间隔数值点
xx, yy = np.mgrid[-3:3:.1, -3:3:.1]
# 将xx, yy拉直，并合并配对为二维张量，生成二维坐标点
grid = np.c_[xx.ravel(), yy.ravel()]
grid = tf.cast(grid, tf.float32)
# 将网格坐标点喂入神经网络，进行预测，probs为输出
probs = []
for x_predict in grid:
    # 使用训练好的参数进行预测
    h1 = tf.matmul([x_predict], w1) + b1
    h1 = tf.nn.relu(h1)
    y = tf.matmul(h1, w2) + b2  # y为预测结果
    probs.append(y)

# 取第0列给x1，取第1列给x2
x1 = x_data[:, 0]
x2 = x_data[:, 1]
# probs的shape调整成xx的样子
probs = np.array(probs).reshape(xx.shape)
plt.scatter(x1, x2, color=np.squeeze(Y_c))
# 把坐标xx yy和对应的值probs放入contour函数，给probs值为0.5的所有点上色  plt.show()后 显示的是红蓝点的分界线
plt.contour(xx, yy, probs, levels=[.5])
plt.show()

# 读入红蓝点，画出分割线，包含正则化
# 不清楚的数据，建议print出来查看

从图片可以看出，曲线平滑，有效缓解了过拟合现象。

2.6 优化器

优化器是引导神经网络更新参数的工具。优化算法可以分成一阶优化和二阶优化算法，其中一阶优化就是指的梯度算法及其变种，而二阶优化一般是用二阶导数（Hessian 矩阵）来计算，如牛顿法，由于需要计算Hessian阵和其逆矩阵，计算量较大，因此没有流行开来。这里主要总结一阶优化的各种梯度下降方法。

深度学习优化算法经历了SGD -> SGDM -> NAG ->AdaGrad -> AdaDelta -> Adam -> Nadam这样的发展历程。

2.6.1 神经网络参数优化器：

上述的，步骤3，4对于各算法都是一致的，主要差别体现在步骤1和2上。

2.6.2 随机梯度下降：SGD（无momentum，也就是不含动量）

tensorflow代码实现：

2.6.3 SGDM（含momentum的SGD），在SGD基础上增加一阶动量

代码实现是下面这面这样：

2.6.4 Adagrad，在SGD基础上增加二阶动量

代码实现：

2.6.5 RMSProp，SGD基础上增加二阶动量

代码实现：

2.6.6 Adam, 同时结合SGDM一阶动量和RMSProp二阶动量

代码实现：

tenorflow 小鱼儿小于儿 tensorflow
tensorflow笔记3MNIST数据集共7万张图片，都是28*28像素点的手写数字图片。6万张用于训练，1万张用于测试。importtensorflowastfmnist=tf.keras.datasets.mnist(x_train,y_train),(x_test,y_test)=mnist.load_data()#直接送数据集中读取训练集和测试机x_train,x_test=x_trai
关于CNN 御风之星
1.理解卷积神经网络中的通道channel2.手把手教你用TensorFlow实现卷积神经网络3.tensorflow笔记：多层CNN代码分析
2021-07-02 fisher-nuc tensorflow 神经网络
基于TensorFlow搭建的几种经典的卷积神经网络注：本文是本人一门课程的期末大作业，在学习曹建老师（人工智能实践：TensorFlow笔记）的课程时记录的笔记。在进行整理后写的一篇小文章，具体详解可以在B站或者MOOC上搜索相关课程。课程网站：https://www.icourse163.org/learn/PKU-1002536002?tid=1003797005#/learn/announ
（一）tensorflow笔记：Tensor数据类型阿松丶 TensorFlow详细笔记 tensorflow python 深度学习
常见的数据类型载体listnp.arraytf.tensorlist:可以存储不同数据类型，缺点不适合存储较大的数据，如图片np.array:解决同类型大数据数据的载体，方便数据运算，缺点是在深度学习之前就设计好的，不支持GPUtf.tensor:更适合深度学习，支持GPUTensor是什么scalar:1.1vector:[1.1],[1.1,2.2,……]matrix:[[1,2,3,],[4
tensorflow笔记（编程理论部分） orangehsc tensorflow python 矩阵算法
TensorFlow笔记（编程理论部分）注：该笔记是阅读TensorFlow深度学习算法原理与编程实战第三章后做的框架梳理和部分个人见解。Tensorflow之名由Tensor和Flow组成，Tensor意为张量，可以理解为数组；Flow意为流动，指张量数据沿着边在不同的节点间流动并发生转化。1.1计算图TensorFlow中的各种操作，如加权求和，激活函数等，都被编排成一个图，称为计算图。计算图
tensorflow笔记 _夏雨潇潇
#tensorflow笔记一个小例子#用numpy构造数据x_data=np.random.rand(100).astype(np.float32)y_data=x_data*0.1+0.3#tf.Variable定义了一个变量，random_uniform表示用随机的方式生成变量的初始值#1表示这个变量是一维的，变量的初始范围是-1到1Weights=tf.Variable(tf.random_
TensorFlow笔记之卷积神经网络 Mr_Stutter Python机器学习 cnn tensorflow 深度学习
文章目录前言一、卷积神经网络CNN二、Tensorflow1.x1.加载数据集2.数据处理3.定义模型4.训练模型5.结果可视化二、Tensorflow2.x1.加载数据集2.数据处理3.定义模型4.训练模型5.结果可视化总结前言记录在tf1.x与tf2.x中使用卷积神经网络完成CIFAR-10数据集识别多分类任务，并进行断点续训。一、卷积神经网络CNN1、全连接网络：参数增多，速度减慢，过拟合2
tensorflow笔记----3---ANN对mnist数据集分类骑着蜗牛逛世界 tensorflow
tensorfllow实现两层MLP对mnist分类，第一层256个神经元，第二层128个神经元，输入784，输出10分类#!/usr/bin/python#-*-coding:utf-8-*-__author__="chunming"importtensorflowastffromtensorflow.examples.tutorials.mnistimportinput_datamnist=i
Tensorflow笔记 3.3 反向传播 CCWUCMCTS
概念反向传播训练模型参数，在所有参数上使用梯度下降，使NN模型在训练数据上的损失函数最小。损失函数预测值与已知答案的差距。均方误差loss=tf.reduce_mean(tf.square(y_-y))反向传播的训练方法三种方式，见代码。学习率参数更新幅度。实战loss#coding:utf-8#0导入模块，生成模拟数据集。importtensorflowastfimportnumpyasnpBA
DL with python(16)——tensorflow实现InceptionNet(GoogLeNet) 佟湘玉滴玉 Python深度学习深度学习 python
本文涉及到的是中国大学慕课《人工智能实践：Tensorflow笔记》第五讲第14节的内容，对tensorflow环境下经典卷积神经网络的搭建进行介绍，其基础是DLwithpython(14)——tensorflow实现CNN的“八股”中的代码，将其中第三步的代码替换为本文中的代码均可直接运行，其他部分无需改变。经典的卷积神经网络有以下几种，这里介绍结构较为复杂的InceptionNet，其实现的方
[tensorflow笔记]-tensorflow实现带mask的reduce_mean 黄然大悟 Tensorflow &Keras tensorflow reduce_mean mask平均
在使用tensorflow处理一些tensor时，有时需要对一个tensor取平均，可以使用tf.reduce_mean操作，但是这个没法处理带有mask的tensor数据，本文主要就是利用tensorflow的基本操作实现带mask的平均。tf.reduce_mean比如我们的数据是3维tensor，shape=（B，N，H），B表示batch_size、N表示最大长度、H表示向量维度，这样的3
学习tensorflow笔记1、梯度计算 weixin_51298826 tensorflow学习笔记 tensorflow python 深度学习
1、梯度计算学习北京大学的mooc，记录笔记代码块：生成一个变量w初值为5，设定为可训练学习率lr大小会影响梯度下降的速度和步幅迭代次数epochimporttensorflowastfimportmatplotlib.pyplotaspltw=tf.Variable(tf.constant(5,dtype=tf.float32))lr=0.9epoch=40plt_show=[]forepoch
Tensorflow笔记——tf.layers.dense的用法 ·城府、深度学习神经网络
1.tf.layers.dense的用法dense：相当于一个全连接层函数解释如下：tf.layers.dense(inputs,units,activation=None,use_bias=True,kernel_initializer=None,bias_initializer=tf.zeros_initializer(),kernel_regularizer=None,bias_regula
TensorFlow笔记之神经网络完成多分类任务 Mr_Stutter Python机器学习 tensorflow 神经网络分类
文章目录前言一、数据集调用二、Tensorflow1.x1.单隐藏层2.模型保存与调用三、Tensorflow2.x1.全连接层类2.keras建模总结前言对TensorFlow笔记之单神经元完成多分类任务进行修改，在tf1.x与tf2.x中使用神经网络完成手写体数字识别多分类任务。一、数据集调用数据集调用与预处理和上一篇完全相同#数据集调用,在tensorflow2.x中调用数据集importt
TensorFlow2安装（超详细步骤-人工智能实践）不唐 Python 深度学习 TensorFlow tensorflow 深度学习 python
TensorFlow2安装教程1前言1.1版本记录1.2工具简介2详细步骤及安装语句2.1安装Anaconda2.2TensoFlow安装2.3验证是否成功2.4PyCharm下载与安装2.5PyCharm环境配置2.5.1不唐初尝试1前言点滴进步，加油！最近在MOOC看北京大学的曹健老师的《人工智能实践：Tensorflow笔记》课程。其中第一章的第8节提到了详细的TensorFlow安装过程。
tensorflow笔记（十九）——错误集锦 starxhong tensorflow tensorflow 深度学习错误
错误及应对方案1，问题：训练正常，预测和评估的时候报OOM：办法：减少预测和训练的batchsize，或者减少网络参数。参考：ResourceExhaustedError(seeabovefortraceback):OOMwhenallocatingtensorofshape[7744,512]#33932，问题：从dataset打印数据，报错OP_REQUIRESfailedatexample_
InceptionNet与ResNet 九思Atopos tensorflow笔记深度学习 python tensorflow
以下代码图片思路来源：北京大学Tensorflow笔记嗯,最近学了一下神经网络，并没有很难，主要是把代码背下来，然后掌握Tensorflow是怎么搭建网络的，Tensorflow是比pytorch好用的，我直接抄的代码里面，训练还要自己写循环，，而tensonflow直接调用fit函数即可和老师做了一下InceptionNet还有ResNet，ResNet主要是有一条path，由于维度不同需要使用
TensorFlow笔记之多元线性回归 Mr_Stutter Python机器学习 tensorflow 线性回归 python
文章目录前言一、数据处理二、TensorFlow1.x1.定义模型2.训练模型3.结果可视化4.模型预测5.TensorBoard可视化三、TensorFlow2.x1.定义模型2.训练模型3.结果可视化4.模型预测总结前言记录使用TensorFlow1.x和TensorFlow2.x完成多元线性回归的过程。一、数据处理在此使用波士顿房价数据集，包含506个样本，输入为12个房屋信息特征，输出为房
TensorFlow笔记之单变量线性回归 Mr_Stutter Python机器学习 tensorflow 线性回归
文章目录前言一、数据集生成二、TensorFlow1.x1.定义模型2.训练模型3.模型预测三、TensorFlow2.x1.定义模型2.训练模型3.模型预测总结前言记录使用TensorFlow1.x和TensorFlow2.x完成单变量线性回归的过程。一、数据集生成生成带标准正态分布噪声的y=2x+1数据集importnumpyasnpimportmatplotlib.pyplotasplt#数
Tensorflow笔记之【神经网络的初步搭建】不理不理不理左卫门机器学习 Tensorflow
一、基本概念基于Tensorflow的神经网络用张量表示数据，用计算图搭建神经网络，用会话执行计算图，优化线上的权重，得到模型。张量——多维数组参数——神经元线上的权重计算图——搭建神经网络的计算过程，只搭建不计算会话——执行计算图中的节点运算例：矩阵乘法importtensorflowastf#引入模块x=tf.constant([[1.0,2.0]])#定义一个2阶1x2张量等于[[1.0,2
TensorFlow笔记之单神经元完成多分类任务 Mr_Stutter Python机器学习 tensorflow 分类
文章目录前言一、逻辑回归1.二分类问题2.多分类问题二、数据集调用三、TensorFlow1.x1.定义模型2.训练模型3.结果可视化四、TensorFlow2.x1.定义模型2.训练模型3.结果可视化总结前言记录分别在TensorFlow1.x与TensorFlow2.x中使用单神经元完成MNIST手写数字识别的过程。一、逻辑回归将回归值映射为各分类的概率1.二分类问题1.sigmod函数：y=
1TensorFlow笔记——基础概念简介&Python简明教程 weixin_45165961 python tensorflow
0.1人工智能让机器看起来跟人一样，目前处于弱人工智能NarrowAI，距离强人工智能GeneralAI还有很大一段路要走。0.1.1机器学习让计算机自动学习，获得规律（模型），用新规律预测。0.1.2分类有监督学习：给带结果的数据进行训练，线性回归、逻辑回归、支持向量机、随机森林等。无监督学习：给数据，找规律进行分类，常见的无监督学习算法有自编码器、生成对抗网络等。半监督学习：给一小部分有标注数
人工智能学习第一篇（tensorflow笔记）＆ Pumbaa tensorflow
本文是在学习北大课程“人工智能实践：tensorflow笔记”的基础上，自己做的笔记，用于温故知新。张量（Tensor）:多维数组（列表）阶：张量的维数（从0开始）张量可以表示0阶到n阶数组（列表）eg1:importtensorflowastfa=tf.constant([1,5],dtype=tf.int64)print(a)print(a.dtype)print(a.shape)结果：tf.
神经网络学习笔记——鸢尾花分类 XL_0502 神经网络学习笔记神经网络 tensorflow
TensorFlow笔记——鸢尾花分类代码笔记记录实验流程和代码功能，附上关于所涉及到的tensorflow库中函数的解释实验流程数据集读入数据集乱序生成训练集和测试集(即x_train/y_train)数据类型转换配成(输入特征，标签)对，每次读入一小撮(batch)搭建网络定义神经网路中所有可训练参数参数优化嵌套循环迭代，with结构更新参数，显示当前loss测试效果计算当前参数前向传播后的准
用tensorflow搭建全连接神经网络实现mnist数据集的识别 humuhumunukunukuapua 爱好 machine learning mnist tensorflow
说明：本代码来自于北京大学曹健老师的MOOC人工智能实践：Tensorflow笔记第五讲I前向传播网络搭建在mnist_forward.py中搭建两层全连接网络，这里面就是定义层数，节点数，激活函数这些。输入节点数目就是mnist数据集的图片28*28大小，用784行的向量作为输入。第一层y1=relu（x*w1+b1）其中y1为500行的向量。那么w1里面就有784*500个变量啦～～b1是50
TensorFlow笔记_05——神经网络八股功能拓展要什么自行车儿 #TensorFlow2.0 tensorflow 神经网络深度学习
目录5.神经网络八股功能拓展5.1自制数据集，解决本领域应用5.2数据增强，扩充数据集5.3断点续训，存取模型5.3.1读取保存模型5.4参数提取，把参数存入文本5.5acc/loss可视化，查看训练效果5.6应用程序，给图实物（手写数字识别）上一篇：TensorFlow笔记_04——八股搭建神经网络下一篇：敬请期待5.神经网络八股功能拓展5.1自制数据集，解决本领域应用defgenerateds
TensorFlow笔记之：填充使用tf.sequence_mask()函数详细说明和应用场景模糊包 TensorFlow
tf.sequence_mask()函数这个函数目前我主要用于数据填充时候使用。文章目录tf.sequence_mask()函数1.函数介绍2.参数解释要点解释：3.函数举例4.注意事项和应用场景1.函数介绍这个是官方定义，耐心看完解释再看后面的例子，你会一下就懂了。#函数定义sequence_mask(lengths,maxlen=None,dtype=tf.bool,name=None)#返回
小白笔记：深度学习之Tensorflow笔记（七：神经网络优化过程） my小马 tensorflow 深度学习神经网络 tensorflow 深度学习
激活函数激活函数是用来加入非线性因素的，因为线性模型的表达能力不够。引入非线性激活函数，可使深层神经网络的表达能力更加强大。简化模型：MP模型：优秀的激活函数：•非线性：激活函数非线性时，多层神经网络可逼近所有函数•可微性：优化器大多用梯度下降更新参数•单调性：当激活函数是单调的，能保证单层网络的损失函数是凸函数•近似恒等性：f(x)≈x当参数初始化为随机小值时，神经网络更稳定激活函数输出值的范围
人工智能实践：Tensorflow笔记 Class 2：神经网络优化 By4te 机器学习 Python tensorflow 人工智能神经网络
目录2.1基础知识2.2复杂度学习率1.复杂度2.学习率2.3激活函数1.sigmoid函数2.tanh函数3.relu函数4.leaky-relu函数2.4损失函数1.均方误差2.自定义损失函数3.交叉熵损失函数4.softmax与交叉熵结合2.5缓解过拟合正则化2.6优化器1.SGD2.SGDM3.Adagrad4.RMSProp5.Adam2.1基础知识2.2复杂度学习率1.复杂度2.学习率
《人工智能实践：Tensorflow笔记》听课笔记24_7.1卷积神经网络 RENeast 人工智能人工智能
附：课程链接第七讲.卷积神经网络7.1卷积神经网络由于个人使用Win7系统，并未完全按照课程所讲，以下记录的也基本是我的结合课程做的Windows系统+PyCharm操作。且本人有python基础，故一些操作可能简略。并未完全按照网课。记住编写代码时，除注释内容外，字符均使用英文格式。一、回顾及展开前两讲中我们利用全连接网络实现了对mnist数据集的训练，我们已学会使用数据集训练模型，并让训练好的
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h

Tensorflow笔记——第二讲：神经网络优化

目录

2.1 预备知识

2.1.1 tf.where()函数：

2.1.2 np.random.RandomState.rand()返回一个[0,1)之间的随机数：

2.1.3 np.vstack() 将两个数组按垂直方向叠加：

2.1.4 np.mgrid[ ] 、.ravel( ) 、np.c_[ ]三个函数结合使用，生成网格坐标点：

2.2 神经网络（NN）复杂度学习率

2.1.1 神经网络（NN）复杂度:

2.2.2 学习率

2.3 激活函数

2.3.1 Sigmoid激活函数：

2.3.2 Tanh激活函数：

2.3.3 Relu激活函数：

2.3.4 Leaky Relu激活函数，为解决Relu在负区间梯度消失：

2.4 损失函数

2.4.1 均方误差mse：

2.4.2 自定义损失函数：

2.4.3 交叉熵损失函数CE(Cross Entropy)：表征两个概率分布之间的距离：

2.4.4 softmax与交叉熵结合：

2.5 缓解过拟合

2.5.1 什么是欠拟合与过拟合：

2.5.2 欠拟合与过拟合解决方案：

2.5.3 正则化缓解过拟合：

2.6 优化器

2.6.1 神经网络参数优化器：

2.6.2 随机梯度下降：SGD（无momentum，也就是不含动量）

2.6.3 SGDM（含momentum的SGD），在SGD基础上增加一阶动量

2.6.4 Adagrad，在SGD基础上增加二阶动量

2.6.5 RMSProp，SGD基础上增加二阶动量

2.6.6 Adam, 同时结合SGDM一阶动量和RMSProp二阶动量

你可能感兴趣的:(Tensorflow笔记)