我是管小亮 :)

TensorFlow2.0 学习笔记（二）：多层感知机（MLP）

专栏——TensorFlow学习笔记

文章目录

专栏——TensorFlow学习笔记

一、基础知识
二、Keras 的模型和层
三、多层感知机（MLP）

3.1、数据获取及预处理
3.2、模型构建
3.3、模型训练
3.4、模型评估
3.5、完整代码

四、总结
推荐阅读

参考文章

一、基础知识

使用 TensorFlow 2.0 快速搭建动态模型，主要有四个部分：

模型的构建： tf.keras.Model 和 tf.keras.layers
模型的损失函数： tf.keras.losses
模型的优化器： tf.keras.optimizer
模型的评估： tf.keras.metrics

分别通过各自的函数进行构建。

二、Keras 的模型和层

在 TensorFlow 2.0 中，推荐使用 Keras（ tf.keras ）构建模型。Keras 是一个广为流行的高级神经网络 API，简单、快速而不失灵活性，现已得到 TensorFlow 的官方内置和全面支持，这也是 TensorFlow 2.0 更加简洁的原因之一。

Keras 有两个重要的概念：模型和层。

层将各种计算流程和变量进行了封装（例如基本的全连接层，CNN 的卷积层、池化层等）；
模型将各种层进行组织和连接并封装成一个整体（例如输入数据通过各种层以及运算而得到输出等）。

Keras 在 tf.keras.layers 下内置了深度学习中大量常用的的预定义层，同时也允许进行自定义层；而在需要模型调用的时候，使用 y_pred = model(X) 的形式即可。

使用 super () 函数调用父类方法，使用 __call__() 方法对实例进行调用。

常用的模型写法是以类的形式呈现，通过继承 tf.keras.Model 这个 Python 类来定义自己的模型。在继承类中，需要重写 __init__() （构造函数，初始化）和 call(input) （模型调用）两个方法，同时也可以根据需要增加自定义的方法。

代码如下：

class Model(tf.keras.Model):
    def __init__(self):
    	# Python 2 下使用 super(Model, self).__init__()
        super().__init__()
        # 此处添加初始化代码（包含 call 方法中会用到的层），例如：
        layer1 = tf.keras.layers.BuiltInLayer(...)
        layer2 = MyCustomLayer(...)

    def call(self, input):
        # 此处添加我们模型调用的代码（处理输入并返回输出），例如：
        x = layer1(input)
        output = layer2(x)
        return output

    # 还可以添加自定义的方法

继承 tf.keras.Model 后，就同时可以使用父类的若干方法和属性，例如在实例化类 model = Model() 后，可以通过 model.variables 这一属性直接获得模型中的所有变量，免去一个个显式指定变量的麻烦。

举一个例子，通过模型类的方式编写一个线性模型 y_pred = a * X + b：

import tensorflow as tf

X = tf.constant([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
y = tf.constant([[10.0], [20.0]])

class Linear(tf.keras.Model):
    def __init__(self):
        super().__init__()
        self.dense = tf.keras.layers.Dense(
            units=1,
            activation=None,
            kernel_initializer=tf.zeros_initializer(),
            bias_initializer=tf.zeros_initializer()
        )

    def call(self, input):
        output = self.dense(input)
        return output

# 实例化类
model = Linear()
optimizer = tf.keras.optimizers.SGD(learning_rate=0.01)
for i in range(100):
    with tf.GradientTape() as tape:
        # 调用模型 y_pred = model(X) 而不是显式写出 y_pred = a * X + b
        y_pred = model(X)
        # 均方误差损失函数
        loss = tf.reduce_mean(tf.square(y_pred - y))
    # 使用 model.variables 这一属性直接获得模型中的所有变量
    grads = tape.gradient(loss, model.variables)
    optimizer.apply_gradients(grads_and_vars=zip(grads, model.variables))
print(model.variables)

其中这个 全连接层（Fully-connected Layer） tf.keras.layers.Dense 封装了 output = activation(tf.matmul(input, kernel) + bias) 这一线性变换 + 激活函数的计算操作，kernel 和 bias 是层中可训练的变量。假设输入张量的形状为 input = [batch_size, input_dim] ，经过全连接层，输出张量的形状为 [batch_size, units] 的二维张量。

示意图如下：

主要参数：

units ：输出张量的维度；
activation ：激活函数，对应于 f(AW + b) 中的 f ，默认为无激活函数（ a(x) = x ）。常用的激活函数包括 tf.nn.relu 、 tf.nn.tanh 和 tf.nn.sigmoid ；
use_bias ：是否加入偏置向量 bias ，即 f(AW + b) 中的 b。默认为 True ；
kernel_initializer 、 bias_initializer ：权重矩阵 kernel 和偏置向量 bias 两个变量的初始化器。默认为 tf.glorot_uniform_initializer 。设置为 tf.zeros_initializer 表示将两个变量均初始化为全 0；

三、多层感知机（MLP）

我们之前写过关于感知机的 numpy 代码，详细在这个博客——深度学习之手撕神经网络代码（基于numpy）。

现在基于 TensorFlow 2.0 来写一个感知机，基于一个完整的网络构建过程，主要分为四个步骤：

使用 tf.keras.datasets 获得数据集并预处理
使用 tf.keras.Model 和 tf.keras.layers 构建模型
训练模型，使用 tf.keras.losses 计算损失函数，并使用 tf.keras.optimizer 优化模型
评估模型，使用 tf.keras.metrics 计算评估指标

数据还是手写数字识别 mnist，所以解决的问题是分类问题。

3.1、数据获取及预处理

目标是使用一个简单的 MNISTLoader 类获取 MNIST 数据集数据，通过 tf.keras.datasets 进行 MNIST 数据集的快速载入。

class MNISTLoader():
    def __init__(self):
        mnist = tf.keras.datasets.mnist
        (self.train_data, self.train_label), (self.test_data, self.test_label) = mnist.load_data()
        # MNIST中的图像默认为uint8（0-255的数字）
        # 以下代码将其归一化到0-1之间的浮点数，并在最后增加一维作为颜色通道
        self.train_data = np.expand_dims(
            self.train_data.astype(
                np.float32) / 255.0,
            axis=-1)  											# [60000, 28, 28, 1]
        self.test_data = np.expand_dims(
            self.test_data.astype(
                np.float32) / 255.0,
            axis=-1)   											# [10000, 28, 28, 1]
        self.train_label = self.train_label.astype(np.int32)    # [60000]
        self.test_label = self.test_label.astype(np.int32)      # [10000]
        self.num_train_data, self.num_test_data = self.train_data.shape[0], self.test_data.shape[0]

    def get_batch(self, batch_size):
        # 从数据集中随机取出batch_size个元素并返回
        index = np.random.randint(0, np.shape(self.train_data)[0], batch_size)
        return self.train_data[index, :], self.train_label[index]

在 DataLoader 类中， self.train_data 和 self.test_data 分别载入了 60,000 和 10,000 张大小为 28*28 的手写体数字图片。此外，在 TensorFlow 中，图像数据集的一种典型表示是 [图像数目，长，宽，色彩通道数] 的四维张量，所以使用 np.expand_dims() 函数为图像数据手动在最后添加一维通道，又由于读入的是灰度图片，色彩通道数为 1（彩色 RGB 图像色彩通道数为 3）。

3.2、模型构建

多层感知机的模型类实现使用 tf.keras.Model 和 tf.keras.layers 构建，又多个层数（顾名思义，“多层” 感知机），以及引入了非线性激活函数（这里使用了 ReLU 函数，即下方的 activation=tf.nn.relu ）。该模型输入一个向量（比如这里是拉直的 1×784 手写体数字图片），输出 10 维的向量，分别代表这张图片属于 0 到 9 的概率。

class MLP(tf.keras.Model):
    def __init__(self):
        super().__init__()
        # Flatten层将除第一维（batch_size）以外的维度展平
        self.flatten = tf.keras.layers.Flatten()
        # 全连接层
        self.dense1 = tf.keras.layers.Dense(units=100, activation=tf.nn.relu)
        self.dense2 = tf.keras.layers.Dense(units=10)

    def call(self, inputs):         # [batch_size, 28, 28, 1]
        x = self.flatten(inputs)    # [batch_size, 784]
        x = self.dense1(x)          # [batch_size, 100]
        x = self.dense2(x)          # [batch_size, 10]
        output = tf.nn.softmax(x)
        return output

网络示意图如下：

这里，因为期望的输出是 输入图片分别属于 0 到 9 的概率，也就是一个 10 维的离散概率分布，所以：

该向量中的每个元素均在 [0, 1] 之间；
该向量的所有元素之和为 1。

为了使得模型的输出能始终满足这两个条件，我们使用 Softmax 函数（归一化指数函数， tf.nn.softmax ）对模型的原始输出进行归一化，其形式为 $\sigma(\mathbf{z})_j = \frac{e^{z_j}}{\sum_{k=1}^K e^{z_k}}$ ，应该说 softmax 函数是我们这里的最佳选择！！！因为它完全符合上面的两个要求。不仅如此，softmax 函数能够 凸显原始向量中最大的值，并抑制远低于最大值的其他分量，这也是该函数被称作 softmax 函数的原因（即平滑化的 argmax 函数）。

3.3、模型训练

先定义一些模型超参数：

num_epochs = 5			# 训练轮数
batch_size = 50			# 批大小
learning_rate = 0.001	# 学习率

实例化模型和数据读取类，并实例化一个 tf.keras.optimizer 的优化器（这里使用常用的 Adam 优化器）：

model = MLP()														# 实例化模型
data_loader = MNISTLoader()											# 数据载入
optimizer = tf.keras.optimizers.Adam(learning_rate=learning_rate)	# 实例化优化器

然后迭代进行以下步骤：

从 DataLoader 中随机取一批训练数据；
将这批数据送入模型，计算出模型的预测值 y_pred；
将模型预测值与真实值进行比较，计算损失函数 loss；
计算损失函数关于模型变量的导数 grads；
将求出的导数值传入优化器 optimizer，使用优化器的 apply_gradients 方法更新模型参数以最小化损失函数。

具体代码实现如下：

num_batches = int(data_loader.num_train_data // batch_size * num_epochs)
for batch_index in range(num_batches):
		# 随机取一批训练数据
        X, y = data_loader.get_batch(batch_size)
        with tf.GradientTape() as tape:
        	# 计算模型预测值
            y_pred = model(X)
            # 计算损失函数
            loss = tf.keras.losses.sparse_categorical_crossentropy(
                y_true=y, y_pred=y_pred)
            loss = tf.reduce_mean(loss)
            print("batch %d: loss %f" % (batch_index, loss.numpy()))
        # 计算模型变量的导数
        grads = tape.gradient(loss, model.variables)
        # 优化器的使用
        optimizer.apply_gradients(grads_and_vars=zip(grads, model.variables))

你或许注意到了，没有显式地写出一个损失函数，而是使用 tf.keras.losses 中的 sparse_categorical_crossentropy （交叉熵）函数，将模型的预测值 y_pred 与真实的标签值 y 作为函数参数传入，由 Keras 帮助我们计算损失函数的值。

交叉熵作为损失函数，在分类问题中被广泛应用。其离散形式为

$\hat{y}) = -\sum_{i=1}^{n}y_i \log(\hat{y_i})$

其中 y 为真实概率分布， $\hat{y}$ 为预测概率分布， n 为分类任务的类别个数。预测概率分布与真实分布越接近，则交叉熵的值越小，反之则越大，这就是交叉熵函数的优势，也是为什么分类问题中很喜欢使用交叉熵函数的原因。

注意：

loss = tf.keras.losses.sparse_categorical_crossentropy(y_true=y, y_pred=y_pred)

等价于

loss = tf.keras.losses.categorical_crossentropy(y_true=tf.one_hot(y, depth=tf.shape(y_pred)[-1]), y_pred=y_pred)

也就是说是默认使用 one-hot 编码 的，也叫 独热编码，简单来说就是把（0.3，0.6，0.1）编码成（0，1，0）。

3.4、模型评估

最后，使用测试集来评估模型的性能，即使用 tf.keras.metrics 中的 SparseCategoricalAccuracy 评估器来评估模型在测试集上的性能，该评估器能够对模型预测的结果与真实结果进行比较，并输出预测正确的样本数占总样本数的比例。

我们迭代测试数据集，每次通过 update_state() 方法向评估器输入两个参数： y_pred 和 y_true ，即模型预测出的结果和真实结果。评估器具有内部变量来保存当前评估指标相关的参数数值（例如当前已传入的累计样本数和当前预测正确的样本数）。迭代结束后，使用 result() 方法输出最终的评估指标值（预测正确的样本数占总样本数的比例）。

在以下代码中，实例化了一个 tf.keras.metrics.SparseCategoricalAccuracy 评估器，并使用 For 循环迭代分批次传入了测试集数据的预测结果与真实结果，并输出训练后的模型在测试数据集上的准确率。

# 评估器
sparse_categorical_accuracy = tf.keras.metrics.SparseCategoricalAccuracy()
# 迭代轮数
num_batches = int(data_loader.num_test_data // batch_size)
for batch_index in range(num_batches):
    start_index, end_index = batch_index * batch_size, (batch_index + 1) * batch_size
    # 模型预测的结果
    y_pred = model.predict(data_loader.test_data[start_index: end_index])
    sparse_categorical_accuracy.update_state(
        y_true=data_loader.test_label[start_index: end_index], y_pred=y_pred)
print("test accuracy: %f" % sparse_categorical_accuracy.result())

3.5、完整代码

完整的代码如下：

import tensorflow as tf
import numpy as np


class MNISTLoader():
    def __init__(self):
        mnist = tf.keras.datasets.mnist
        (self.train_data, self.train_label), (self.test_data,
                                              self.test_label) = mnist.load_data()
        # MNIST中的图像默认为uint8（0-255的数字）
        # 以下代码将其归一化到0-1之间的浮点数，并在最后增加一维作为颜色通道
        self.train_data = np.expand_dims(
            self.train_data.astype(
                np.float32) / 255.0,
            axis=-1)  											# [60000, 28, 28, 1]
        self.test_data = np.expand_dims(
            self.test_data.astype(
                np.float32) / 255.0,
            axis=-1)   											# [10000, 28, 28, 1]
        self.train_label = self.train_label.astype(np.int32)    # [60000]
        self.test_label = self.test_label.astype(np.int32)      # [10000]
        self.num_train_data, self.num_test_data = self.train_data.shape[
            0], self.test_data.shape[0]

    def get_batch(self, batch_size):
        # 从数据集中随机取出batch_size个元素并返回
        index = np.random.randint(0, np.shape(self.train_data)[0], batch_size)
        return self.train_data[index, :], self.train_label[index]


class MLP(tf.keras.Model):
    def __init__(self):
        super().__init__()
        # Flatten层将除第一维（batch_size）以外的维度展平
        self.flatten = tf.keras.layers.Flatten()
        # 全连接层
        self.dense1 = tf.keras.layers.Dense(units=100, activation=tf.nn.relu)
        self.dense2 = tf.keras.layers.Dense(units=10)

    def call(self, inputs):         # [batch_size, 28, 28, 1]
        x = self.flatten(inputs)    # [batch_size, 784]
        x = self.dense1(x)          # [batch_size, 100]
        x = self.dense2(x)          # [batch_size, 10]
        output = tf.nn.softmax(x)
        return output


num_epochs = 5			# 训练轮数
batch_size = 50			# 批大小
learning_rate = 0.001  # 学习率


model = MLP()														# 实例化模型
data_loader = MNISTLoader()											# 数据载入
optimizer = tf.keras.optimizers.Adam(learning_rate=learning_rate)  # 实例化优化器


num_batches = int(data_loader.num_train_data // batch_size * num_epochs)
for batch_index in range(num_batches):
                # 随机取一批训练数据
    X, y = data_loader.get_batch(batch_size)
    with tf.GradientTape() as tape:
                # 计算模型预测值
        y_pred = model(X)
        # 计算损失函数
        loss = tf.keras.losses.sparse_categorical_crossentropy(
            y_true=y, y_pred=y_pred)
        loss = tf.reduce_mean(loss)
        print("batch %d: loss %f" % (batch_index, loss.numpy()))
    # 计算模型变量的导数
    grads = tape.gradient(loss, model.variables)
    # 优化器的使用
    optimizer.apply_gradients(grads_and_vars=zip(grads, model.variables))


# 评估器
sparse_categorical_accuracy = tf.keras.metrics.SparseCategoricalAccuracy()
# 迭代轮数
num_batches = int(data_loader.num_test_data // batch_size)
for batch_index in range(num_batches):
    start_index, end_index = batch_index * \
        batch_size, (batch_index + 1) * batch_size
    # 模型预测的结果
    y_pred = model.predict(data_loader.test_data[start_index: end_index])
    sparse_categorical_accuracy.update_state(
        y_true=data_loader.test_label[start_index: end_index], y_pred=y_pred)
print("test accuracy: %f" % sparse_categorical_accuracy.result())

输出结果：

# 测试了五次
test accuracy: 0.974600
test accuracy: 0.973600
test accuracy: 0.975200
test accuracy: 0.972600
test accuracy: 0.975200

第一次结果图如下：

可以注意到，使用这样简单的一个模型（多层感知机），就已经可以达到 97% 左右的准确率。

四、总结

还是和深度学习之手撕神经网络代码（基于numpy）进行对比，可以看得出整个令人厌烦的数学过程变得简单的多，数学帕金森患者不必忧虑了，通过慢慢地复现不同的网络，也能感知到 2.0 和 1.x 的区别是让人动容的，我反正是哭了，期待接下来的 CNN 复现了！

参考文章

TensorFlow 官方文档
简单粗暴 TensorFlow 2.0

你可能感兴趣的:(#,TensorFlow学习笔记)

tensorflow学习笔记（二）：机器学习必备API 我愛大泡泡深度学习机器学习深度学习
前一节介绍了一些最基本的概念和使用方法。因为我个人的最终目的还是在深度学习上，所以一些深度学习和机器学习模块是必须要了解的，这其中包括了tf.train、tf.contrib.learn、还有如训练神经网络必备的tf.nn等API。这里准备把常用的API和使用方法按照使用频次进行一个排列，可以当做一个以后使用参考。这一节介绍的内容可以有选择的看。而且最全的信息都在TensorFlow的API里面了
TensorFlow学习笔记 SIENTIST
使用“图”（graph）表示计算任务；在被称为“会话”（session）的“上下文”（context）中执行图；使用“张量”（tensor）表示数据，tensor可以任务是一个n维的数组或列表；通过“变量”（varible）维护状态；使用feed和fetch可以为任意的操作赋值或从中获取数据tensorflow.jpggraph中的节点称为op（operation），每个op能把输入的tensor
tensorflow学习笔记-图像分类模型-AlexNet实现飞天小小猫
之前一篇文章中总结了CNN中图像分类的经典模型，包括论文解读和分析，但是不写个代码搞一把总觉得虚～啊哈哈这个系列里准备把这些个经典模型用tensorflow实现一下。参考之前引用的blog：深度学习AlexNet模型详细分析上代码吧。参照着模型看更好读一些。'''图像分类模型的tensorflow实现之--AlexNetTensorflowVersion:1.4PythonVersion:3.6R
Tensorflow学习笔记（六）——卷积神经网络七月七叶
实现对fashion-minist分类：（1）引包importosos.environ["CUDA_VISIBLE_DEVICES"]="-1"importmatplotlibasmplimportmatplotlib.pyplotasplt%matplotlibinlineimportnumpyasnpimportpandasaspdimportsklearnimportsysimpor
tensorflow vgg基于cifar-10进行训练 GOGOYAO
最近接触tf，想在cifar-10数据集上训练下vgg网络。最开始想先跑vgg16，搜了一大圈，没有一个可以直接跑的（我参考【深度学习系列】用PaddlePaddle和Tensorflow实现经典CNN网络Vgg跑出来的精度就10%），要么是代码是针对1000种分类的，要么是预训练好的。最后在Tensorflow学习笔记：CNN篇（6）——CIFAR-10数据集VGG19实现找到了一个vgg19的
深度学习与Tensorflow学习笔记2 ——回调函数callbacks和Tensorboard 木头里有虫911
上一期我们从Fashion-mnist数据集开始，使用Tensorflow.keras搭建一个简单的神经网络来处理分类问题。通过这个简单例子我们熟悉了tf.keras的调用。本期我们来学习keras下面的回调函数callbacks的用法。这里，简单的再说一句，Tensorflow有非常完善的官方文档，相当于学习手册。（而且还有中文网站：https://tensorflow.google.cn/）在
TensorFlow学习笔记--（4）神经网络模型-数据集预处理 Postlude TensorFlow tensorflow 学习笔记
神经网络初步以scikit-leran鸢尾花为例通过scikit-learn库自带的鸢尾花数据集来测试数据的读入fromsklearnimportdatasetsfrompandasimportDataFrameimportpandasaspdx_data=datasets.load_iris().data#.data返回iris数据集所有输入特征y_data=datasets.load_iris
tensorflow学习笔记：识别图中模糊的手写体数字（2）基于多层神经网络以及TensorBoard可视化网络 heart_ace tensorflow学习笔记 tensorflow 神经网络可视化 python 深度学习
tensorflow学习笔记：识别图中模糊的手写体数字（2）基于多层神经网络以及TensorBoard可视化运行环境tensorflow-gpu1.11.0python3.6.9importtensorflowastfimportos读取MINIST数据集fromtensorflow.examples.tutorials.mnistimportinput_datamnist=input_data.
tensorflow学习笔记（十）：GAN生成手写体数字（MNIST）陈小虾深度学习框架实战 GAN手写体生成 GAN实战
文章目录一、GAN原理二、项目实战2.1项目背景2.2网络描述2.3项目实战一、GAN原理生成对抗网络简称GAN，是由两个网络组成的，一个生成器网络和一个判别器网络。这两个网络可以是神经网络（从卷积神经网络、循环神经网络到自编码器）。生成器从给定噪声中（一般是指均匀分布或者正态分布）产生合成数据，判别器分辨生成器的的输出和真实数据。前者试图产生更接近真实的数据，相应地，后者试图更完美地分辨真实数据
tensorflow学习笔记3 抬头挺胸才算活着
CreateaTensorFlowobjectthatreturnsx+yifx>y,andx-yotherwise.tf.cond相当于其他编程语言的?，比较要用tf.greatertf.cond(tf.greater(x,y),lambda:tf.add(x,y),lambda:tf.subtract(x,y))tf.case第一个参数是字典或者tuples都可以，只要是一对对，然后每一对第一
8月10日TensorFlow学习笔记——TensorFlow 数据类型、创建、索引与切片、维度变换、前向传播 Ashen_0nee tensorflow 学习 python
文章目录前言一、Numpy回归问题实战1、Step1：computeloss2、Step2：computeGradientandupdate二、手写数字识别1、Step1：XandY2、Step2：networkstructure3、Step3：循环计算Loss、梯度并更新参数三、数据类型1、tf.constant()2、TensorProperty(1)、.device(2)、.numpy()(
TensorFlow学习笔记--（3）张量的常用运算函数 Postlude TensorFlow tensorflow 学习笔记
损失函数及求偏导通过tf.GradientTape函数来指定损失函数的变量以及表达式最后通过gradient(%损失函数%,%偏导对象%)来获取求偏导的结果独热编码给出一组特征值来对图像进行分类可以用独热编码0的概率是第0种1的概率是第1种0的概率是第二种tf.one_hot(%某标签值%,%分类数%)这里还没太看懂结果的3X3矩阵是怎么来的如果单纯的是因为有几种类型就有几个1那传入的标签值参数就
tensorflow学习笔记--张量和基本运算 Yohance0_0 tensorflow框架学习深度学习
张量张量的阶和数据类型（1）张量的属性：graph：张量所属的默认图op：张量的操作名name：张量的字符串描述shape：张量形状一维{5}二维{2,3}三维{2，3，4}importtensorflowastfimportosos.environ['TF_CPP_MIN_LOG_LEVEL']='2'a=tf.constant(5.0)graph=tf.get_default_graph()p
tensorflow学习笔记----2.常用函数1 qq_35821503 tensorflow 深度学习
1.强制tensor转换为该数据类型tf.cast(张量名，dtype=数据类型)x1=tf.constant([1,2,3],dtype=tf.float64)print(x1)x2=tf.cast(x1,dtype=tf.int32)print("x2=",x2)运行结果：2.计算张量维度上元素的最小值tf.reduce_min(张量名)print("min=",tf.reduce_min(x
TensorFlow学习笔记----3.常用函数2 qq_35821503 tensorflow 深度学习
一.Gradienttape我们可以在with结构中，使用Gradienttape实现某个函数对指定参数的求导运算配合上一个文件讲的variable函数可以实现损失函数loss对参数w的求导计算with结构记录计算过程，gradient求出张量的梯度withtf.GradientTape()astape:若干个计算过程grad=tape.gradient(函数，对谁求导)withtf.Gradie
TensorFlow学习笔记--MLP多层感知机识别手写数字1-9 北航_Curry TensorFlow2.0 tensorflow 神经网络深度学习 1024程序员节
#简单粗暴tensorflow2.0合集视频p7-p9多层感知机（MLP）利用多层感知机MLP实现手写数字0-9的mnist数据集的识别importtensorflowastfimportnumpyasnp#数据的获取和预处理classMNISTLoader():def__init__(self):mnist=tf.keras.datasets.mnist(self.train_data,self
Tensorflow学习笔记--张量与会话 IT修炼家 tensorflow
张量张量是Tensorflow的核心组件之一，可以理解为Tensorflow就是张量和流组成的，张量可以简单地理解为多维数组，我的理解就是张量是一个数据模板，深度学习所有数据首先转换为张量的格式再进行计算，然后得到学习结果。横向看张量是整形、浮点型的数，另外注意张量计算中，有些计算需要张量数据的类型相同，否则会报错。纵向看张量是不同维度的“数组”，零阶张量是一个数，是计算的最小单元；二阶张量是向量
tensorflow学习笔记--Variable变量爱吃小白兔的大萝卜 tensorflow 学习 python
tf.Variable()变量：创建、初始化、保存、加载。1.创建Variable()构造函数需要变量的初始值，即任何形状和类型的张量Tensor。初始值定义其形状和类型，一旦构建，变量的类型和形状即确定。如果想要稍后改变变量的形状，需要带上validate_shape=False的赋值操作。#创建一个变量w=tf.Variable(tensor,name=)#运算y=tf.matmul(w,其他
tensorflow学习笔记：张量介绍以及张量操作函数 heart_ace tensorflow学习笔记深度学习 tensorflow 张量
张量（tensor）tensorflow程序使用tensor数据结构来代表所有的数据，计算图中，操作间传递的数据都是tensor。tensor堪为一个n维的数组或列表，每个tensor中包含类型（type）、阶（rank）和形状（shape）。tensor类型tensor类型python类型描述DF_FLOATtf.float3232位浮点数DF_DOUBLEtf.float6461为浮点数DF_
[TensorFlow 学习笔记-03]TensorFlow简介 caicaiatnbu TensorFlow学习笔记深度学习 TensorFlow
[版权说明]TensorFlow学习笔记参考：李嘉璇著TensorFlow技术解析与实战黄文坚唐源著TensorFlow实战郑泽宇顾思宇著TensorFlow实战Google深度学习框架乐毅王斌著深度学习-Caffe之经典模型详解与实战TensorFlow中文社区http://www.tensorfly.cn/极客学院著TensorFlow官方文档中文版TensorFlow官方文档英文版以及各位大
TensorFlow学习笔记--（2）张量的常用运算函数 Postlude TensorFlow tensorflow 学习笔记
张量的取值函数求张量的平均值:tf.reduce.mean(%张量名%)求张量的最小值:tf.reduce_min(%张量名%)求张量的最大值:tf.reduce_max(%张量名%)求张量的和:tf.reduce_sum(%张量名%)其次,对于上述所有操作都可在函数后添加一个新的参数axis=%维度%axis=0代表第一维度axis=1代表第二维度以此类推张量的四则运算加减乘除次方/开方特别注意
Tensorflow学习笔记：1-tensorflow-gpu部署 & keras简单使用-2023-2-12 Merlin雷 python机器学习笔记 tensorflow keras
tensorflow-gpu学习笔记：部署&keras简单使用-2023-2-12tensorflow2.6.0GPU版本部署及测试0-查看NVIDIA驱动版本1-安装2-测试3-简单使用4-tf.keras概述1、（单层）线性回归1、导包&数据读取和观察2、预测目标与损失函数3、创建模型4、训练5、预测2、多层感知器3、逻辑回归1、sigmoid函数2、交叉熵损失函数3、模型预测4、画图看损失和
TensorFlow学习笔记--（1）张量的随机生成 Postlude TensorFlow tensorflow 学习笔记
张量的生成如何判断一个张量的维数：看张量的中括号有几层012：零维数列[246]:一维向量[[123][456]]:二维数组两行三列第一行数据为123第二行数据为456以此类推n维张量有n层中括号tf.zeros(%指定一个张量的维数%)生成一个全0的张量tf.ones(%指定一个张量的维数%)生成一个全1的张量tf.fill(%指定一个张量的维数%,%Value%)生成一个全为Value的张量随
Tensorflow学习笔记：Keras函数式API 凿井而饮 tensorflow2 python tensorflow 深度学习
目录一、简介二、使用相同的层计算图定义多个模型三、模型可像层一样被调用四、处理复杂计算图拓扑1.多输入多输出模型2.建立一个小的ResNet五、共享层六、提取和重用层计算图节点七、使用自定义层扩展API八、何时使用函数式API1.函数式API的优势2.函数式API的劣势九、混合搭配的API式样1.将函数式模型用作子类化模型的一部分：2.在函数式API中使用任何子类化层或模型一、简介函数式API创建
tensorflow学习笔记--机器学习基础知识--（1）基本图像分类爱玩的阿是学习笔记 python tensorflow 机器学习深度学习
学习教材是tensorflow官网上的新手教程为了让自己有更深的印象和理解，将自己的学习笔记记录基础分类：对于衣服的图片分类本指南训练了一个神经网络模型来对衣服的图像进行分类，例如运动鞋和衬衫。本指南使用tf.keras在TensorFlow中构建和训练模型。from__future__importabsolute_import,division,print_function,unicode_li
TensorFlow学习笔记（未完待续）苏钟白 tensorflow 学习笔记
文章目录tf.Graph().as_default()sessiontensorflow.placeholder()tf.summarytf.Graph().as_default()withtf.Graph().as_default():withtf.device('/gpu:'+str(GPU_INDEX)):TensorFlow中所有计算都会被转化为计算图上的节点。是一个通过计算图的形式来表述
TensorFlow学习笔记（四）—— 入门 —— 基本使用 tiankong19999 TensorFlow TensorFlow 入门
教程地址：TensorFlow中文社区基本使用使用TensorFlow,你必须明白TensorFlow:使用图(graph)来表示计算任务.在被称之为会话(Session)的上下文(context)中执行图.使用tensor表示数据.通过变量(Variable)维护状态.使用feed和fetch可以为任意的操作(arbitraryoperation)赋值或者从其中获取数据.综述TensorFlow
TensorFlow学习笔记（四）——tf.data API 七月七叶
tf.data.Datasetcsv文件读取为dataset并用于训练tfrecord1.tf.data.Datasettf.data.Dataset使用流程：（1）以源数据创建一个dataset；（2）对数据进行预处理；（3）遍历整个dataset，进行数据处理1.1SourceDatasets（1）由数组、列表等创建，将其转化为tensor#创建一个datasetdataset=tf.data
tensorflow学习笔记————分类MNIST数据集 san.hang 人工智能 python
在使用tensorflow分类MNIST数据集中，最容易遇到的问题是下载MNIST样本的问题。一般是通过使用tensorflow内置的函数进行下载和加载，fromtensorflow.examples.tutorials.mnistimportinput_datamnist=input_data.read_data_sets("MNIST_data",one_hot=True)但是我使用时遇到了“
tensorflow学习笔记：运算函数、复数操作函数、规约计算、序列比较与索引提取以及错误类 heart_ace tensorflow学习笔记运算函数 tensorflow 错误类规约计算函数索引提前
运算函数、复数操作函数、规约计算、序列比较与索引提取以及错误类前一章提到了许多关于张量的操作函数，这里接着将一些运算函数、复数操作函数、规约计算、序列比较与索引提取以及错误类记录下来。算数运算函数函数描述tf.asign(x,y,name=None)令x=ytf.add(x,y,name=None)求和tf.subtract(x,y,name=None)减法tf.multiply(x,y,name
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc