代表最低水平的hhhuster

Tensorflow学习笔记（三）：神经网络八股

本文是个人的学习笔记，是跟随北大曹健老师的视频课学习的
附：bilibili课程链接和 MOOC课程链接以及源码下载链接（提取码：mocm）

文章目录

一、神经网络搭建八股：六步法
- 1. `import`
- 2. 导入dataset
- 3. `model = tf.keras.models.Sequential([网络结构])`：描述各层网络
- - 拉直层
  - 全连接层
  - 卷积层
  - LSTM层
- 4. `model.compile`：配置训练方法
- - 调用格式
  - optimizer=
  - loss=
  - metrics=
- 5. `model.fit`：训练
- - 调用格式
- 6. `model.summary`：打印网络结构、参数统计
- - 调用格式
二、举例与讨论
- 1. 复现：iris分类代码
- - （1）搭建网络八股sequential进行分类
  - （2）搭建网络八股class进行分类
- 2. MNIST数据集及分类
- - （1）认识数据集
  - （2）搭建神经网络进行手写数字识别
- 3. 练习：Fashion数据集及分类
- - （1）认识数据集
  - （2）搭建神经网络训练
三、网络八股功能扩展
- 复盘六步法
- - （1）总结
  - （2）限制
- 1. 自制数据集
- - 功能代码实现
  - 八股修改
- 2. 数据增强
- - 核心函数
  - 相关代码
  - 结果说明
- 3. 断点续训
- - 代码实现
  - 使用效果
- 4. 参数提取
- - 直接查看
  - 保存本地
- 5. Acc/Loss可视化
- - 代码实现
  - 结果展示
四、从训练到实际
- 训练源码
- 应用源码
- 使用效果

一、神经网络搭建八股：六步法

1. `import`

2. 导入dataset

3. `model = tf.keras.models.Sequential([网络结构])`：描述各层网络

拉直层

调用代码：tf.keras.layers.Flatten()
不含计算，仅仅形状转换，把输入特征一维数组

全连接层

调用代码：tf.keras.layers.Dense(神经元个数, activation=激活函数, kernel_regularizer=正则化方式)
激活函数：relu, softmax, sigmoid, tanh
正则化方式：tf.keras.regularizers.l1(), tf.keras.regularizers.l2()

卷积层

调用代码：tf.keras.layers.Conv2D(filters=卷积核个数, kernel_size=卷积核尺寸, strides=卷积步长, padding="valid" or "same")

LSTM层

调用代码：tf.keras.layers.LSTM()

4. `model.compile`：配置训练方法

调用格式

model.compile(optimizer=优化器, loss=损失函数, metrics=["准确率"])

optimizer=

'sgd' or tf.keras.optimizers.SGD(lr=, momentum=)
'adagrad' or tf.keras.optimizers.Adagrad(lr=)
'adadelta' or tf.keras.optimizers.Adadelta(lr=)
'adam' or tf.keras.optimizers.Adam(lr=, beta_1=0.9, beta_2=0.999)

loss=

'mse' or tf.keras.losses.MeanSquaredError()
'sparse_categorical_crossentropy' or tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False)：输出前经过概率分布为False，没有则为True

metrics=

根据数据标签 $y$ 和预测值 $\hat y$ 的形式确定参数值

'accuracy'： $y$ 和 $\hat y$ 都是数值，如 $~\hat y=[1]$
'categorical_accuracy'： $y$ 和 $\hat y$ 都是独热编码（概率分布），如 $~\hat y=[0.256,0.695,0.048]$
'sparse_categorical_accuracy'： $y$ 是数值， $\hat y$ 是独热编码（概率分布），如 $\hat y=[0.256,0.695,0.048]$

5. `model.fit`：训练

调用格式

model.fit(训练集输入特征, 训练集标签, batch_size=, epochs=, validation_data=(测试集的输入特征, 测试集的标签), validation_split=从训练集划分多少比例给测试集, validation_freq=多少次epoch测试一次)

6. `model.summary`：打印网络结构、参数统计

调用格式

model.summary()

二、举例与讨论

看到这里已经有些迷茫了。。。所以通过一个例子来看看是如何“搭积木”的

1. 复现：iris分类代码

（1）搭建网络八股sequential进行分类

源码

# import
import numpy as np
import tensorflow as tf
from sklearn import datasets

# 导入dataset
iris = datasets.load_iris()
x = iris.data
y = iris.target

np.random.seed(76)
np.random.shuffle(x)
np.random.seed(76)
np.random.shuffle(y)
tf.random.set_seed(76)

# model = models.Sequential
model = tf.keras.models.Sequential([
    tf.keras.layers.Dense(
        3,
        activation='softmax',
        kernel_regularizer=tf.keras.regularizers.l2()
    )
])

# model.compile
model.compile(
    optimizer=tf.keras.optimizers.SGD(lr=0.1),
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
    metrics=['sparse_categorical_accuracy']
)

# model.fit
model.fit(
    x, y, batch_size=32, epochs=500,
    validation_split=0.2,
    validation_freq=20
)

# model.summary
model.summary()

结果展示

Epoch 1/500
4/4 [==============================] - 0s 5ms/step - loss: 4.7593 - sparse_categorical_accuracy: 0.3417
Epoch 2/500
4/4 [==============================] - 0s 0s/step - loss: 3.2841 - sparse_categorical_accuracy: 0.3417
Epoch 3/500
4/4 [==============================] - 0s 0s/step - loss: 2.0309 - sparse_categorical_accuracy: 0.3417
Epoch 4/500
4/4 [==============================] - 0s 0s/step - loss: 1.2765 - sparse_categorical_accuracy: 0.3500
Epoch 5/500
4/4 [==============================] - 0s 0s/step - loss: 0.9750 - sparse_categorical_accuracy: 0.3750
Epoch 6/500
4/4 [==============================] - 0s 0s/step - loss: 0.8396 - sparse_categorical_accuracy: 0.4583
Epoch 7/500
4/4 [==============================] - 0s 5ms/step - loss: 0.7756 - sparse_categorical_accuracy: 0.6000
Epoch 8/500
4/4 [==============================] - 0s 0s/step - loss: 0.7225 - sparse_categorical_accuracy: 0.4250
Epoch 9/500
4/4 [==============================] - 0s 0s/step - loss: 0.6942 - sparse_categorical_accuracy: 0.4667
Epoch 10/500
4/4 [==============================] - 0s 5ms/step - loss: 0.6758 - sparse_categorical_accuracy: 0.4167
Epoch 11/500
4/4 [==============================] - 0s 0s/step - loss: 0.6634 - sparse_categorical_accuracy: 0.4583
Epoch 12/500
4/4 [==============================] - 0s 0s/step - loss: 0.6571 - sparse_categorical_accuracy: 0.4667
Epoch 13/500
4/4 [==============================] - 0s 0s/step - loss: 0.6481 - sparse_categorical_accuracy: 0.4917
Epoch 14/500
4/4 [==============================] - 0s 0s/step - loss: 0.6457 - sparse_categorical_accuracy: 0.4417
Epoch 15/500
4/4 [==============================] - 0s 0s/step - loss: 0.6406 - sparse_categorical_accuracy: 0.4667
Epoch 16/500
4/4 [==============================] - 0s 0s/step - loss: 0.6432 - sparse_categorical_accuracy: 0.4833
Epoch 17/500
4/4 [==============================] - 0s 5ms/step - loss: 0.6324 - sparse_categorical_accuracy: 0.5750
Epoch 18/500
4/4 [==============================] - 0s 0s/step - loss: 0.6320 - sparse_categorical_accuracy: 0.4917
Epoch 19/500
4/4 [==============================] - 0s 0s/step - loss: 0.6275 - sparse_categorical_accuracy: 0.4750
Epoch 20/500
4/4 [==============================] - 0s 52ms/step - loss: 0.6239 - sparse_categorical_accuracy: 0.5583 - val_loss: 0.6717 - val_sparse_categorical_accuracy: 0.3667
...
Epoch 481/500
4/4 [==============================] - 0s 0s/step - loss: 0.3849 - sparse_categorical_accuracy: 0.9750
Epoch 482/500
4/4 [==============================] - 0s 0s/step - loss: 0.3806 - sparse_categorical_accuracy: 0.9750
Epoch 483/500
4/4 [==============================] - 0s 0s/step - loss: 0.3830 - sparse_categorical_accuracy: 0.9833
Epoch 484/500
4/4 [==============================] - 0s 0s/step - loss: 0.3804 - sparse_categorical_accuracy: 0.9833
Epoch 485/500
4/4 [==============================] - 0s 0s/step - loss: 0.3829 - sparse_categorical_accuracy: 0.9833
Epoch 486/500
4/4 [==============================] - 0s 0s/step - loss: 0.3807 - sparse_categorical_accuracy: 0.9750
Epoch 487/500
4/4 [==============================] - 0s 0s/step - loss: 0.3802 - sparse_categorical_accuracy: 0.9833
Epoch 488/500
4/4 [==============================] - 0s 0s/step - loss: 0.3817 - sparse_categorical_accuracy: 0.9833
Epoch 489/500
4/4 [==============================] - 0s 0s/step - loss: 0.3805 - sparse_categorical_accuracy: 0.9750
Epoch 490/500
4/4 [==============================] - 0s 5ms/step - loss: 0.3798 - sparse_categorical_accuracy: 0.9833
Epoch 491/500
4/4 [==============================] - 0s 0s/step - loss: 0.3807 - sparse_categorical_accuracy: 0.9833
Epoch 492/500
4/4 [==============================] - 0s 0s/step - loss: 0.3801 - sparse_categorical_accuracy: 0.9833
Epoch 493/500
4/4 [==============================] - 0s 0s/step - loss: 0.3793 - sparse_categorical_accuracy: 0.9833
Epoch 494/500
4/4 [==============================] - 0s 0s/step - loss: 0.3817 - sparse_categorical_accuracy: 0.9917
Epoch 495/500
4/4 [==============================] - 0s 0s/step - loss: 0.3800 - sparse_categorical_accuracy: 0.9833
Epoch 496/500
4/4 [==============================] - 0s 0s/step - loss: 0.3793 - sparse_categorical_accuracy: 0.9750
Epoch 497/500
4/4 [==============================] - 0s 5ms/step - loss: 0.3811 - sparse_categorical_accuracy: 0.9667
Epoch 498/500
4/4 [==============================] - 0s 0s/step - loss: 0.3790 - sparse_categorical_accuracy: 0.9750
Epoch 499/500
4/4 [==============================] - 0s 0s/step - loss: 0.3791 - sparse_categorical_accuracy: 0.9750
Epoch 500/500
4/4 [==============================] - 0s 10ms/step - loss: 0.3787 - sparse_categorical_accuracy: 0.9750 - val_loss: 0.4051 - val_sparse_categorical_accuracy: 0.9667
Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
=================================================================
 dense (Dense)               (None, 3)                 15        
                                                                 
=================================================================
Total params: 15
Trainable params: 15
Non-trainable params: 0
_________________________________________________________________

使用sequential的局限：无法实现带有跳连的非顺序网络结构
解决方法：使用class搭建网络

（2）搭建网络八股class进行分类

源码
仅需将上述源码的model = models.Sequential部分更改为如下的class model即可

# class model
class irisModel(tf.keras.Model):
# 构建类
    def __init__(self):
        super(irisModel, self).__init__()
        # 定义网络结构块
        self.layer = tf.keras.layers.Dense(
            3,
            activation='softmax',
            kernel_regularizer=tf.keras.regularizers.l2()
        )

    def call(self, x):
        # 调用网络结构块，实现前向传播
        y = self.layer(x)
        return y

model = irisModel()  # 实例化对象

结果展示

Epoch 1/500
4/4 [==============================] - 0s 5ms/step - loss: 1.0251 - sparse_categorical_accuracy: 0.5750
Epoch 2/500
4/4 [==============================] - 0s 0s/step - loss: 0.9047 - sparse_categorical_accuracy: 0.4917
Epoch 3/500
4/4 [==============================] - 0s 5ms/step - loss: 0.8671 - sparse_categorical_accuracy: 0.5083
Epoch 4/500
4/4 [==============================] - 0s 0s/step - loss: 0.8382 - sparse_categorical_accuracy: 0.4833
Epoch 5/500
4/4 [==============================] - 0s 0s/step - loss: 0.8366 - sparse_categorical_accuracy: 0.5083
Epoch 6/500
4/4 [==============================] - 0s 0s/step - loss: 0.8193 - sparse_categorical_accuracy: 0.4750
Epoch 7/500
4/4 [==============================] - 0s 0s/step - loss: 0.8217 - sparse_categorical_accuracy: 0.4917
Epoch 8/500
4/4 [==============================] - 0s 0s/step - loss: 0.8032 - sparse_categorical_accuracy: 0.4917
Epoch 9/500
4/4 [==============================] - 0s 0s/step - loss: 0.7979 - sparse_categorical_accuracy: 0.5000
Epoch 10/500
4/4 [==============================] - 0s 5ms/step - loss: 0.7900 - sparse_categorical_accuracy: 0.4917
Epoch 11/500
4/4 [==============================] - 0s 0s/step - loss: 0.7835 - sparse_categorical_accuracy: 0.4917
Epoch 12/500
4/4 [==============================] - 0s 0s/step - loss: 0.7804 - sparse_categorical_accuracy: 0.4917
Epoch 13/500
4/4 [==============================] - 0s 5ms/step - loss: 0.7709 - sparse_categorical_accuracy: 0.5000
Epoch 14/500
4/4 [==============================] - 0s 0s/step - loss: 0.7676 - sparse_categorical_accuracy: 0.4750
Epoch 15/500
4/4 [==============================] - 0s 0s/step - loss: 0.7609 - sparse_categorical_accuracy: 0.5083
Epoch 16/500
4/4 [==============================] - 0s 0s/step - loss: 0.7633 - sparse_categorical_accuracy: 0.4917
Epoch 17/500
4/4 [==============================] - 0s 5ms/step - loss: 0.7491 - sparse_categorical_accuracy: 0.5083
Epoch 18/500
4/4 [==============================] - 0s 0s/step - loss: 0.7477 - sparse_categorical_accuracy: 0.5167
Epoch 19/500
4/4 [==============================] - 0s 0s/step - loss: 0.7409 - sparse_categorical_accuracy: 0.4917
Epoch 20/500
4/4 [==============================] - 0s 52ms/step - loss: 0.7351 - sparse_categorical_accuracy: 0.5000 - val_loss: 0.7733 - val_sparse_categorical_accuracy: 0.4333
...
Epoch 481/500
4/4 [==============================] - 0s 5ms/step - loss: 0.3890 - sparse_categorical_accuracy: 0.9750
Epoch 482/500
4/4 [==============================] - 0s 0s/step - loss: 0.3847 - sparse_categorical_accuracy: 0.9833
Epoch 483/500
4/4 [==============================] - 0s 0s/step - loss: 0.3874 - sparse_categorical_accuracy: 0.9833
Epoch 484/500
4/4 [==============================] - 0s 5ms/step - loss: 0.3845 - sparse_categorical_accuracy: 0.9833
Epoch 485/500
4/4 [==============================] - 0s 0s/step - loss: 0.3872 - sparse_categorical_accuracy: 0.9833
Epoch 486/500
4/4 [==============================] - 0s 0s/step - loss: 0.3847 - sparse_categorical_accuracy: 0.9750
Epoch 487/500
4/4 [==============================] - 0s 0s/step - loss: 0.3844 - sparse_categorical_accuracy: 0.9833
Epoch 488/500
4/4 [==============================] - 0s 0s/step - loss: 0.3858 - sparse_categorical_accuracy: 0.9833
Epoch 489/500
4/4 [==============================] - 0s 0s/step - loss: 0.3845 - sparse_categorical_accuracy: 0.9750
Epoch 490/500
4/4 [==============================] - 0s 0s/step - loss: 0.3836 - sparse_categorical_accuracy: 0.9833
Epoch 491/500
4/4 [==============================] - 0s 0s/step - loss: 0.3848 - sparse_categorical_accuracy: 0.9833
Epoch 492/500
4/4 [==============================] - 0s 0s/step - loss: 0.3838 - sparse_categorical_accuracy: 0.9833
Epoch 493/500
4/4 [==============================] - 0s 0s/step - loss: 0.3831 - sparse_categorical_accuracy: 0.9833
Epoch 494/500
4/4 [==============================] - 0s 5ms/step - loss: 0.3857 - sparse_categorical_accuracy: 0.9750
Epoch 495/500
4/4 [==============================] - 0s 0s/step - loss: 0.3838 - sparse_categorical_accuracy: 0.9833
Epoch 496/500
4/4 [==============================] - 0s 0s/step - loss: 0.3831 - sparse_categorical_accuracy: 0.9833
Epoch 497/500
4/4 [==============================] - 0s 0s/step - loss: 0.3849 - sparse_categorical_accuracy: 0.9833
Epoch 498/500
4/4 [==============================] - 0s 5ms/step - loss: 0.3828 - sparse_categorical_accuracy: 0.9833
Epoch 499/500
4/4 [==============================] - 0s 0s/step - loss: 0.3828 - sparse_categorical_accuracy: 0.9833
Epoch 500/500
4/4 [==============================] - 0s 5ms/step - loss: 0.3822 - sparse_categorical_accuracy: 0.9750 - val_loss: 0.4033 - val_sparse_categorical_accuracy: 0.9667
Model: "iris_model"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
=================================================================
 dense (Dense)               multiple                  15        
                                                                 
=================================================================
Total params: 15
Trainable params: 15
Non-trainable params: 0
_________________________________________________________________

两种方法搭建出来的网络训练结果是相同的

2. MNIST数据集及分类

（1）认识数据集

数据集在哪里？

tensorflow库中就有MNIST数据集，我们可以用如下代码导入

# 导入数据集
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()

训练集和测试集是怎么组成的？

想要在MNIST数据集上训练，就首先要认识训练集和测试集是什么“样子”，print出来数据集的shape看看

# 数据集形状
print("x_train.shape:", x_train.shape)
print("y_train.shape:", y_train.shape)
print("x_test.shape:", x_test.shape)
print("y_test.shape:", y_test.shape)

结果是

x_train.shape: (60000, 28, 28)
y_train.shape: (60000,)
x_test.shape: (10000, 28, 28)
y_test.shape: (10000,)

也就是说，MNIST是由含60000个元素的训练集和含10000个元素的测试集组成的。对于每一个元素而言，对应的数据为一个2828(=784)大小的二维数组，对应的标签为一个11的数值

那数据和标签到底是什么？

以训练集的第一个元素为例，我们尝试将它print出来，这用代码很容易实现

print('x_train[0]=\n{}\ny_train[0]={}'.format(x_train[0], y_train[0]))

结果是

x_train[0]=
[[  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   3  18  18  18 126 136 175  26 166 255 247 127   0   0   0   0]
 [  0   0   0   0   0   0   0   0  30  36  94 154 170 253 253 253 253 253 225 172 253 242 195  64   0   0   0   0]
 [  0   0   0   0   0   0   0  49 238 253 253 253 253 253 253 253 253 251  93  82  82  56  39   0   0   0   0   0]
 [  0   0   0   0   0   0   0  18 219 253 253 253 253 253 198 182 247 241   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0  80 156 107 253 253 205  11   0  43 154   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0  14   1 154 253  90   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0 139 253 190   2   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0  11 190 253  70   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0  35 241 225 160 108   1   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0  81 240 253 253 119  25   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0  45 186 253 253 150  27   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0  16  93 252 253 187   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 249 253 249  64   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0  46 130 183 253 253 207   2   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0  39 148 229 253 253 253 250 182   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0  24 114 221 253 253 253 253 201  78   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0  23  66 213 253 253 253 253 198  81   2   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0  18 171 219 253 253 253 253 195  80   9   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0  55 172 226 253 253 253 253 244 133  11   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0 136 253 253 253 212 135 132  16   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]]
y_train[0]=5

额，只看懂了它的标签是’5‘，我们不是cpu，看不懂这一堆数据是什么意思，但这么多数据对应了28*28个像素点的灰度值，我们可以show出来

plt.imshow(x_train[0], cmap='gray')
plt.show()

至此，我们终于知道了，原来是一个手写的数字“5”

（2）搭建神经网络进行手写数字识别

认识MNIST数据集之后，我们就可以搭建一个基本的三层网络对手写数字进行分类识别，设置隐藏层神经元个数为128，使用relu，结合iris代码的复现，我们很容易就用python写出这个神经网络了
为了提升训练效果，我们可以在导入MNIST时对数据进行归一化处理

利用sequential

# import
import tensorflow as tf

# 导入dataset
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

# model = models.Sequential
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

# model.compile
model.compile(
    optimizer='adam',
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
    metrics=['sparse_categorical_accuracy']
)

# model.fit
model.fit(
    x_train, y_train,
    batch_size=32, epochs=5,
    validation_data=(x_test, y_test),
    validation_freq=1
)

# model.summary
model.summary()

结果

Epoch 1/5
1875/1875 [==============================] - 3s 1ms/step - loss: 0.2566 - sparse_categorical_accuracy: 0.9262 - val_loss: 0.1357 - val_sparse_categorical_accuracy: 0.9588
Epoch 2/5
1875/1875 [==============================] - 2s 1ms/step - loss: 0.1150 - sparse_categorical_accuracy: 0.9658 - val_loss: 0.0966 - val_sparse_categorical_accuracy: 0.9710
Epoch 3/5
1875/1875 [==============================] - 2s 1ms/step - loss: 0.0795 - sparse_categorical_accuracy: 0.9757 - val_loss: 0.0892 - val_sparse_categorical_accuracy: 0.9732
Epoch 4/5
1875/1875 [==============================] - 2s 1ms/step - loss: 0.0600 - sparse_categorical_accuracy: 0.9816 - val_loss: 0.0786 - val_sparse_categorical_accuracy: 0.9753
Epoch 5/5
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0455 - sparse_categorical_accuracy: 0.9862 - val_loss: 0.0839 - val_sparse_categorical_accuracy: 0.9744
Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
=================================================================
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense (Dense)               (None, 128)               100480    
                                                                 
 dense_1 (Dense)             (None, 10)                1290      
                                                                 
=================================================================
Total params: 101,770
Trainable params: 101,770
Non-trainable params: 0
_________________________________________________________________

注：这里每个epoch的1875指的是60000/32

利用class

# import
import tensorflow as tf

# 导入dataset
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

# class model
class mnistModel(tf.keras.Model):
# 构建类
    def __init__(self):
        super(mnistModel, self).__init__()
        # 定义网络结构块
        self.inlayer = tf.keras.layers.Flatten()
        self.hiddenlayer = tf.keras.layers.Dense(128, activation='relu')
        self.outlayer = tf.keras.layers.Dense(10, activation='softmax')

    def call(self, x):
        # 调用网络结构块，实现前向传播
        x = self.inlayer(x)
        s1 = self.hiddenlayer(x)
        y = self.outlayer(s1)
        return y

model = mnistModel()  # 实例化对象

# model.compile
model.compile(
    optimizer='adam',
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
    metrics=['sparse_categorical_accuracy']
)

# model.fit
model.fit(
    x_train, y_train,
    batch_size=32, epochs=5,
    validation_data=(x_test, y_test),
    validation_freq=1
)

# model.summary
model.summary()

结果

Epoch 1/5
1875/1875 [==============================] - 3s 1ms/step - loss: 0.2608 - sparse_categorical_accuracy: 0.9261 - val_loss: 0.1376 - val_sparse_categorical_accuracy: 0.9606
Epoch 2/5
1875/1875 [==============================] - 3s 2ms/step - loss: 0.1171 - sparse_categorical_accuracy: 0.9656 - val_loss: 0.0935 - val_sparse_categorical_accuracy: 0.9725
Epoch 3/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.0802 - sparse_categorical_accuracy: 0.9758 - val_loss: 0.0857 - val_sparse_categorical_accuracy: 0.9726
Epoch 4/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.0603 - sparse_categorical_accuracy: 0.9820 - val_loss: 0.0809 - val_sparse_categorical_accuracy: 0.9753
Epoch 5/5
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0451 - sparse_categorical_accuracy: 0.9858 - val_loss: 0.0770 - val_sparse_categorical_accuracy: 0.9769
Model: "mnist_model"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
=================================================================
 flatten (Flatten)           multiple                  0         
                                                                 
 dense (Dense)               multiple                  100480    
                                                                 
 dense_1 (Dense)             multiple                  1290      
                                                                 
=================================================================
Total params: 101,770
Trainable params: 101,770
Non-trainable params: 0
_________________________________________________________________

3. 练习：Fashion数据集及分类

（1）认识数据集

通过MNIST数据集，我们已经很熟悉认识这个新数据集的流程了

import tensorflow as tf
import matplotlib.pyplot as plt

# 导入dataset
fashion = tf.keras.datasets.fashion_mnist
(x_train, y_train), (x_test, y_test) = fashion.load_data()

# fashion数据集形状
print('x_train.shape:', x_train.shape)
print('y_train.shape', y_train.shape)
print('x_test.shape', x_test.shape)
print('y_test.shape', y_test.shape)

# 数据集内容
print('x_train[0]=\n{}\ny_train[0]={}'.format(x_train[0], y_train[0]))
plt.imshow(x_train[0], cmap='gray')
plt.show()

我们发现此数据集和MNIST数据集形状是相同的

x_train.shape: (60000, 28, 28)
y_train.shape (60000,)
x_test.shape (10000, 28, 28)
y_test.shape (10000,)

也就是说，Fashion也是由含60000个元素的训练集和含10000个元素的测试集组成的。对于每一个元素而言，对应的数据为一个2828(=784)大小的二维数组，对应的标签为一个11的数值

以训练集的第一个元素为例，我们将它print出来，结果是

x_train[0]=
[[  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   1   0   0  13  73   0   0   1   4   0   0   0   0   1   1   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   3   0  36 136 127  62  54   0   0   0   1   3   4   0   0   3]
 [  0   0   0   0   0   0   0   0   0   0   0   0   6   0 102 204 176 134 144 123  23   0   0   0   0  12  10   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0 155 236 207 178 107 156 161 109  64  23  77 130  72  15]
 [  0   0   0   0   0   0   0   0   0   0   0   1   0  69 207 223 218 216 216 163 127 121 122 146 141  88 172  66]
 [  0   0   0   0   0   0   0   0   0   1   1   1   0 200 232 232 233 229 223 223 215 213 164 127 123 196 229   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0 183 225 216 223 228 235 227 224 222 224 221 223 245 173   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0 193 228 218 213 198 180 212 210 211 213 223 220 243 202   0]
 [  0   0   0   0   0   0   0   0   0   1   3   0  12 219 220 212 218 192 169 227 208 218 224 212 226 197 209  52]
 [  0   0   0   0   0   0   0   0   0   0   6   0  99 244 222 220 218 203  198 221 215 213 222 220 245 119 167  56]
 [  0   0   0   0   0   0   0   0   0   4   0   0  55 236 228 230 228 240 232 213 218 223 234 217 217 209  92   0]
 [  0   0   1   4   6   7   2   0   0   0   0   0 237 226 217 223 222 219 222 221 216 223 229 215 218 255  77   0]
 [  0   3   0   0   0   0   0   0   0  62 145 204 228 207 213 221 218 208  211 218 224 223 219 215 224 244 159   0]
 [  0   0   0   0  18  44  82 107 189 228 220 222 217 226 200 205 211 230 224 234 176 188 250 248 233 238 215   0]
 [  0  57 187 208 224 221 224 208 204 214 208 209 200 159 245 193 206 223  255 255 221 234 221 211 220 232 246   0]
 [  3 202 228 224 221 211 211 214 205 205 205 220 240  80 150 255 229 221 188 154 191 210 204 209 222 228 225   0]
 [ 98 233 198 210 222 229 229 234 249 220 194 215 217 241  65  73 106 117  168 219 221 215 217 223 223 224 229  29]
 [ 75 204 212 204 193 205 211 225 216 185 197 206 198 213 240 195 227 245 239 223 218 212 209 222 220 221 230  67]
 [ 48 203 183 194 213 197 185 190 194 192 202 214 219 221 220 236 225 216 199 206 186 181 177 172 181 205 206 115]
 [  0 122 219 193 179 171 183 196 204 210 213 207 211 210 200 196 194 191 195 191 198 192 176 156 167 177 210  92]
 [  0   0  74 189 212 191 175 172 175 181 185 188 189 188 193 198 204 209  210 210 211 188 188 194 192 216 170   0]
 [  2   0   0   0  66 200 222 237 239 242 246 243 244 221 220 193 191 179 182 182 181 176 166 168  99  58   0   0]
 [  0   0   0   0   0   0   0  40  61  44  72  41  35   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]]
y_train[0]=9

鞋子对应的标签为‘9’，通过查阅资料：该数据集用0-9分别表示10种不同的衣物

（2）搭建神经网络训练

# import
import tensorflow as tf

# 导入dataset
fashion = tf.keras.datasets.fashion_mnist
(x_train, y_train), (x_test, y_test) = fashion.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

# model = models.Sequential
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(512, activation='relu'),
    tf.keras.layers.Dense(512, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

''''也可以使用如下方法
# class model
class fashionModel(tf.keras.Model):
# 构建类
    def __init__(self):
        super(fashionModel, self).__init__()
        # 定义网络结构块
        self.inlayer = tf.keras.layers.Flatten()
        self.hiddenlayer = tf.keras.layers.Dense(256, activation='relu')
        self.hiddenlayer = tf.keras.layers.Dense(256, activation='relu')
        self.outlayer = tf.keras.layers.Dense(10, activation='softmax')

    def call(self, x):
        # 调用网络结构块，实现前向传播
        x = self.inlayer(x)
        s1 = self.hiddenlayer(x)
        y = self.outlayer(s1)
        return y

model = fashionModel()  # 实例化对象'''

# model.compile
model.compile(
    optimizer='adam',
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
    metrics=['sparse_categorical_accuracy']
)

# model.fit
model.fit(
    x_train, y_train,
    batch_size=32, epochs=5,
    validation_data=(x_test, y_test),
    validation_freq=1
)

# model.summary
model.summary()

结果（我尝试了更改隐藏层的层数和神经元个数，在相同epoch的情况下似乎没有什么显著的改变）

Epoch 1/5
1875/1875 [==============================] - 22s 11ms/step - loss: 0.4655 - sparse_categorical_accuracy: 0.8287 - val_loss: 0.4106 - val_sparse_categorical_accuracy: 0.8519
Epoch 2/5
1875/1875 [==============================] - 22s 12ms/step - loss: 0.3535 - sparse_categorical_accuracy: 0.8697 - val_loss: 0.3885 - val_sparse_categorical_accuracy: 0.8632
Epoch 3/5
1875/1875 [==============================] - 21s 11ms/step - loss: 0.3178 - sparse_categorical_accuracy: 0.8829 - val_loss: 0.3430 - val_sparse_categorical_accuracy: 0.8770
Epoch 4/5
1875/1875 [==============================] - 18s 10ms/step - loss: 0.2954 - sparse_categorical_accuracy: 0.8898 - val_loss: 0.3423 - val_sparse_categorical_accuracy: 0.8769
Epoch 5/5
1875/1875 [==============================] - 16s 9ms/step - loss: 0.2769 - sparse_categorical_accuracy: 0.8951 - val_loss: 0.3506 - val_sparse_categorical_accuracy: 0.8777
Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
=================================================================
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense (Dense)               (None, 512)               401920    
                                                                 
 dense_1 (Dense)             (None, 512)               262656    
                                                                 
 dense_2 (Dense)             (None, 10)                5130      
                                                                 
=================================================================
Total params: 669,706
Trainable params: 669,706
Non-trainable params: 0
_________________________________________________________________

三、网络八股功能扩展

复盘六步法

（1）总结

import
train, test
model = Sequential / Class
model.compile
model.fit
model.summary

（2）限制

导入数据都是load_data调库，如果是自己专业领域数据怎么办？——自制数据集
数据量少，模型泛化能力弱？——数据增强
每次模型训练从零开始？——断点续训，实时保存最优模型
保存训练好的参数？——参数提取
训练/测试效果？——Acc/Loss可视化
学到的知识如何在实际中应用？——给图识物应用程序（将在第四部分介绍）

基于上述限制，将以MNIST数据集训练网络代码为模板进行修改，并一一给出解决方案

1. 自制数据集

库中的数据集虽然好用，但只能作为一个范例，当我们想要以专业领域的数据集进行训练时，自制数据集是必要的

功能代码实现

从以文件形式存储的数据到能够作为训练依据的数据集，主要过程是读取文件内容、对内容进行规范化处理、写入内存等，为方便起见，我编写了一个类，包含对MNIST数据集和Fashion数据集的生成，可以看出，基本就是对文件的操作以及一些规范化

class SelfMadeDataset():

    def __init__(self):
        pass

    def generateds(self, path, txt_path):
        f = open(txt_path, 'r')
        # 逐行读出，每一行格式为“图片地址 标签”，如“28755_0.jpg 0”
        contents = f.readlines()
        f.close()

        x, y = [], []  # x, y分别存放数据和标签
        for content in contents:
            value = content.split()  # 每一行以空格分开，value = [图片地址, 标签]
            img_path = path + value[0]  # 总路径+该图片路径
            img = Image.open(img_path)
            img = np.array(img.convert('L'))  # 标准化
            img = img / 255.  # 归一化
            x.append(img)
            y.append(value[1])
            print('loading:'+content)  # print出加载进程

        x = np.array(x)
        y = np.array(y)
        y = y.astype(np.int64)
        return x, y

    def load_mnist(self):
        # 一级目录地址
        dic_path = "D:/source/repos/FNN/MNIST_FC/mnist_image_label/"

        # 相关文件夹及txt文件的偏移地址
        train_path = dic_path + 'mnist_train_jpg_60000/'
        train_txt = dic_path + 'mnist_train_jpg_60000.txt'
        x_train_savepath = dic_path + 'mnist_x_train.npy'
        y_train_savepath = dic_path + 'mnist_y_train.npy'

        test_path = dic_path + 'mnist_test_jpg_10000/'
        test_txt = dic_path + 'mnist_test_jpg_10000.txt'
        x_test_savepath = dic_path + 'mnist_x_test.npy'
        y_test_savepath = dic_path + 'mnist_y_test.npy'

        # 如果.npy文件已经创建完成
        if os.path.exists(x_train_savepath) and \
                os.path.exists(y_train_savepath) and \
                os.path.exists(x_test_savepath) and \
                os.path.exists(y_test_savepath):
            # img和label信息通过若干个一维数组存放，需要对img形状进行重塑，并分别存入x/y中
            print('---------- Load Datasets ----------')
            x_train_save = np.load(x_train_savepath)
            x_train = np.reshape(x_train_save, (len(x_train_save), 28, 28))
            y_train = np.load(y_train_savepath)
            x_test_save = np.load(x_test_savepath)
            x_test = np.reshape(x_test_save, (len(x_test_save), 28, 28))
            y_test = np.load(y_test_savepath)

        else:
            # 先直接将数据和标签存入输出
            print('---------- Generate Datasets ----------')
            x_train, y_train = self.generateds(train_path, train_txt)
            x_test, y_test = self.generateds(test_path, test_txt)

            # 再以若干行（一维数组）的形式存入.txt文件中
            print('---------- Save Datasets ----------')
            x_train_save = np.reshape(x_train, (len(x_train), -1))
            x_test_save = np.reshape(x_test, (len(x_test), -1))
            np.save(x_train_savepath, x_train_save)
            np.save(y_train_savepath, y_train)
            np.save(x_test_savepath, x_test_save)
            np.save(y_test_savepath, y_test)

        return (x_train, y_train), (x_test, y_test)

    # 类似可以写出Fashion自制数据集
    def load_fashion(self):
        # 一级目录地址
        dic_path = "D:/source/repos/FNN/FASHION_FC/fashion_image_label/"

        train_path = dic_path + 'fashion_train_jpg_60000/'
        train_txt = dic_path + 'fashion_train_jpg_60000.txt'
        x_train_savepath = dic_path + 'fashion_x_train.npy'
        y_train_savepath = dic_path + 'fashion_y_train.npy'

        test_path = dic_path + 'fashion_test_jpg_10000/'
        test_txt = dic_path + 'fashion_test_jpg_10000.txt'
        x_test_savepath = dic_path + 'fashion_x_test.npy'
        y_test_savepath = dic_path + 'fashion_y_test.npy'

        if os.path.exists(x_train_savepath) and \
                os.path.exists(y_train_savepath) and \
                os.path.exists(x_test_savepath) and \
                os.path.exists(y_test_savepath):
            print('---------- Load Datasets ----------')
            x_train_save = np.load(x_train_savepath)
            x_train = np.reshape(x_train_save, (len(x_train_save), 28, 28))
            y_train = np.load(y_train_savepath)
            x_test_save = np.load(x_test_savepath)
            x_test = np.reshape(x_test_save, (len(x_test_save), 28, 28))
            y_test = np.load(y_test_savepath)

        else:
            print('---------- Generate Datasets ----------')
            x_train, y_train = self.generateds(train_path, train_txt)
            x_test, y_test = self.generateds(test_path, test_txt)

            print('---------- Save Datasets ----------')
            x_train_save = np.reshape(x_train, (len(x_train), -1))
            x_test_save = np.reshape(x_test, (len(x_test), -1))
            np.save(x_train_savepath, x_train_save)
            np.save(y_train_savepath, y_train)
            np.save(x_test_savepath, x_test_save)
            np.save(y_test_savepath, y_test)

        return (x_train, y_train), (x_test, y_test)

八股修改

以MNIST数据集为例，我们仅需要将原来第二部分的

# 导入dataset
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

更改为

# 导入dataset
mnist = expand.SelfMadeDataset()
(x_train, y_train), (x_test, y_test) = mnist.load_fashion()

注：因我们的自制数据集已经将数据规范化，因此不用再进行规范化操作了

2. 数据增强

给定的数据集并不能完全反应真实情况，同时有时数据集元素的数量较少、情况较为单一，因此训练出的模型泛化能力不一定强，因此，利用进行伸缩、旋转、翻转等变换后的图像进行训练是十分必要的，这就是所谓的数据增强

核心函数

首先实例化数据增强类

image_gen_train = tf.keras.preprocessing.image.ImageDataGenerator(...)

这个函数有以下几个参数：

rescale=所有数据将乘以该数值（可归一化）
rotation_range=随机旋转角度数范围
width_shift_range=随机宽度偏移量
height_shift_range=随机高度偏移量
horizontal_flip=是否随机水平翻转
zoom_range=随机缩放的范围（1±x）

之后，对类进行操作用以对训练集进行数据增强，并在model.fit训练时匹配，注意这里的x_train要求为四维数组，因此需要进行reshape

image_gen_train.fit(x_train)
model.fit(image_gen_train.flow(x_train, y_train, batch_size=32), ...)

结果说明

最终测试集准确率大概达到了0.92，和数据增强前（0.97）比较甚至变低了，但这并不能反映数据增强的真实效果，因为我们的测试集是标准的MNIST数据集，而不是实际情况，而在实际的手写数据识别中，数据增强的意义就体现出来了

3. 断点续训

每次训练都从零开始显然是费时费力的，为了解决这个问题，我们是否可以保存训练好的参数呢？这便是所谓的断点续训的方法，每次训练结束后可根据需要将训练好的相关量保存在本地，方便后续调用

代码实现

在训练前，加入断点内容保存和回调函数代码

# checkpoint save & callback
checkpoint_save_path = "./checkpoint/mnist.ckpt"
if os.path.exists(checkpoint_save_path + '.index'):
    print('---------- Load the Model ----------')
    model.load_weights(checkpoint_save_path)

cp_callback = tf.keras.callbacks.ModelCheckpoint(
    filepath=checkpoint_save_path,
    save_weights_only=True,
    save_best_only=True
)

训练时，加入参数

callbacks=[cp_callback]

使用效果

若从零开始，慢慢向上爬

Epoch 1/5
val_loss: 0.1375 - val_sparse_categorical_accuracy: 0.9585
Epoch 2/5
val_loss: 0.1008 - val_sparse_categorical_accuracy: 0.9680
Epoch 3/5
val_loss: 0.0843 - val_sparse_categorical_accuracy: 0.9728
Epoch 4/5
val_loss: 0.0774 - val_sparse_categorical_accuracy: 0.9766
Epoch 5/5
val_loss: 0.0732 - val_sparse_categorical_accuracy: 0.9763

使用之前的结果，“出生即巅峰”

---------- Load the Model ----------
Epoch 1/5
val_loss: 0.0797 - val_sparse_categorical_accuracy: 0.9752
Epoch 2/5
val_loss: 0.0809 - val_sparse_categorical_accuracy: 0.9776
Epoch 3/5
val_loss: 0.0871 - val_sparse_categorical_accuracy: 0.9750
Epoch 4/5
val_loss: 0.0760 - val_sparse_categorical_accuracy: 0.9786
Epoch 5/5
val_loss: 0.0812 - val_sparse_categorical_accuracy: 0.9772

4. 参数提取

断点续训保留了每次训练后的最优参数，那么如何查看这些参数值呢？这便是参数提取的内容了

直接查看

一个很自然的想法是print出来，一行代码就搞定了

print(model.trainable_variables)

看看结果（这里只复制了第一个参数）

[<tf.Variable 'dense/kernel:0' shape=(784, 128) dtype=float32, numpy=
array([[ 0.00500327,  0.04753769, -0.01752532, ...,  0.03947137,
        -0.01869851, -0.06784071],
       [ 0.03976591, -0.01105286, -0.06868242, ..., -0.02361085,
        -0.01682989, -0.01024982],
       [ 0.06888347, -0.08000371,  0.04266344, ..., -0.01104672,
        -0.05294819, -0.05270603],
       ...,
       [ 0.03220175,  0.05865171, -0.06073547, ...,  0.03521375,
         0.04109269,  0.061808  ],
       [-0.00427113, -0.02391875,  0.0570228 , ...,  0.01772309,
        -0.01797158,  0.03190365],
       [-0.06256977, -0.06899459, -0.02244005, ...,  0.02622585,
         0.05694849,  0.05649317]]

每个结果中间都有省略号，这是因为数据太多了，而想要查看完整的参数，只需在最开始加入一行代码

np.set_printoptions(threshold=np.inf)

threshold这个值表示限制到多少，可以任意更改；这次的结果便是不带省略号的完整版（太多了就不复制了）

保存本地

如果想在本地查看参数值，可以以.txt文件记录到本地

# save to disk
file = open('./weights.txt', 'w')
for v in model.trainable_variables:
    file.write(str(v.name) + '\n')
    file.write(str(v.shape) + '\n')
    file.write(str(v.numpy()) + '\n')
file.close()

5. Acc/Loss可视化

同样，我们想要以更加直观的方式查看训练/测试效果

代码实现

加val的表示validation（验证集/测试集）

# visualize acc & loss
acc = history.history['sparse_categorical_accuracy']
val_acc = history.history['val_sparse_categorical_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']

plt.subplot(1, 2, 1)
plt.plot(acc, label='Training Accuracy')
plt.plot(val_acc, label='Validation Accuracy')
plt.title('Training and Validation Accuracy')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(loss, label='Training Loss')
plt.plot(val_loss, label='Validation Loss')
plt.title('Training and Validation Loss')
plt.legend()

plt.suptitle('Curves of Accuracy and Loss')
# plt.savefig('./results.png')  # save to disk
plt.show()

结果展示

四、从训练到实际

经过了不断的改进和训练，我们得到了越加完美的参数空间，我们可以通过这些参数来进行真正的手写数字识别

训练源码

# import
import matplotlib.pyplot as plt
import tensorflow as tf
import numpy as np
import os

np.set_printoptions(threshold=np.inf)

# 导入dataset
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

# data_gen
x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
image_gen_train = tf.keras.preprocessing.image.ImageDataGenerator(
    rescale=1. / 1.,
    rotation_range=45,
    width_shift_range=.15,
    height_shift_range=.15,
    horizontal_flip=False,
    zoom_range=0.5
)
image_gen_train.fit(x_train)

# model = models.Sequential
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

# model.compile
model.compile(
    optimizer='adam',
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
    metrics=['sparse_categorical_accuracy']
)

# checkpoint save & callback
checkpoint_save_path = "./checkpoint/mnist.ckpt"
if os.path.exists(checkpoint_save_path + '.index'):
    print('---------- Load the Model ----------')
    model.load_weights(checkpoint_save_path)

cp_callback = tf.keras.callbacks.ModelCheckpoint(
    filepath=checkpoint_save_path,
    save_weights_only=True,
    save_best_only=True
)

# model.fit
history = model.fit(
    image_gen_train.flow(x_train, y_train, batch_size=32), epochs=5,
    validation_data=(x_test, y_test),
    validation_freq=1,
    callbacks=[cp_callback]
)

# model.summary
model.summary()

# save to disk
file = open('./weights.txt', 'w')
for v in model.trainable_variables:
    file.write(str(v.name) + '\n')
    file.write(str(v.shape) + '\n')
    file.write(str(v.numpy()) + '\n')
file.close()


''''# visualize acc & loss
acc = history.history['sparse_categorical_accuracy']
val_acc = history.history['val_sparse_categorical_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']

plt.subplot(1, 2, 1)
plt.plot(acc, label='Training Accuracy')
plt.plot(val_acc, label='Validation Accuracy')
plt.title('Training and Validation Accuracy')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(loss, label='Training Loss')
plt.plot(val_loss, label='Validation Loss')
plt.title('Training and Validation Loss')
plt.legend()

plt.suptitle('Curves of Accuracy and Loss')
# plt.savefig('./results.png')  # save to disk
plt.show()'''


''''# class model
class mnistModel(tf.keras.Model):
# 构建类
    def __init__(self):
        super(mnistModel, self).__init__()
        # 定义网络结构块
        self.inlayer = tf.keras.layers.Flatten()
        self.hiddenlayer = tf.keras.layers.Dense(128, activation='relu')
        self.outlayer = tf.keras.layers.Dense(10, activation='softmax')

    def call(self, x):
        # 调用网络结构块，实现前向传播
        x = self.inlayer(x)
        s1 = self.hiddenlayer(x)
        y = self.outlayer(s1)
        return y

model = mnistModel()  # 实例化对象'''

应用源码

import cv2 as cv
import numpy as np
from PIL import Image
import tensorflow as tf


def recognition():
    model_save_path = "./checkpoint/mnist.ckpt"

    # model = models.Sequential
    model = tf.keras.models.Sequential([
        tf.keras.layers.Flatten(),
        tf.keras.layers.Dense(128, activation='relu'),
        tf.keras.layers.Dense(10, activation='softmax')
    ])

    model.load_weights(model_save_path)

    image_path = './MNIST_FC/number.png'
    img = Image.open(image_path)
    img = img.resize((28, 28), Image.ANTIALIAS)
    img_arr = np.array(img.convert('L'))

    # 图像预处理，滤去噪声
    for m in range(28):
        for n in range(28):
            if img_arr[m][n] < 200:
                img_arr[m][n] = 255
            else:
                img_arr[m][n] = 0

    img_arr = img_arr / 255.
    x_predict = img_arr[tf.newaxis, ...]
    print('---------- Recognizing ----------')
    result = model.predict(x_predict)

    pred = tf.argmax(result, axis=1)
    result = str(pred[0].numpy())
    print('---------- Success! ----------')
    print('\nthe number is:{}'.format(result))
    return result


# 鼠标的回调函数的参数格式是固定的，不要随意更改。
def mouse_event(event, x, y, flags, param):
    global start, drawing

    # 左键按下：开始画图
    if event == cv.EVENT_LBUTTONDOWN:
        drawing = True
        start = (x, y)
    # 鼠标移动，画图
    elif event == cv.EVENT_MOUSEMOVE:
        if drawing:
            cv.circle(img, (x, y), 8, 0, -1)
    # 左键释放：结束画图
    elif event == cv.EVENT_LBUTTONUP:
        drawing = False
        cv.circle(img, (x, y), 8, 0, -1)


def initialize():
    cv.destroyAllWindows()  # 清空所有窗口
    img = 255 * np.ones((256, 256), np.uint8)  # 创建白幕
    cv.namedWindow('image')
    cv.setMouseCallback('image', mouse_event)
    return img


def show():
    if flag:
        src = cv.imread('./MNIST_FC/number.png')

        # 调用cv.putText()添加文字
        text = recognition()
        AddText = src.copy()
        cv.putText(AddText, text, (0, 50), cv.FONT_HERSHEY_COMPLEX, 1.5, (0, 0, 255), 5)

        # 显示拼接后的图片
        cv.imshow('text', AddText)
        cv.waitKey()

    img = initialize()
    return img


drawing = False  # 是否开始画图
start = (-1, -1)
flag = False

img = initialize()

while True:
    cv.imshow('image', img)
    # 按ESC键退出程序
    if cv.waitKey(1) == 27:
        break
    # 按r重启
    elif cv.waitKey(1) == ord('r'):
        img = initialize()
        continue
    # 按Enter进行识别
    elif cv.waitKey(1) == 13:
        flag = True
        cv.imwrite('./MNIST_FC/number.png', img)
        show()
        continue

opencv与手写板部分，参考了这位大神的文章，cv2库就是opencv，可以直接安装

pip install opencv-python

使用效果

还是蛮好玩的，就是有点出墨不太顺畅and很卡，以及‘4’容易识别成‘9’，正确率在可接受范围内吧，今后还可以继续改进！

这一部分名字是“八股”，内容还是很多的，尤其是我把老师两讲的东西合到了一起，不过给我的感觉就是很大一部分都是在“套模板”，不是很难，没什么可以发挥的地方。不过在此过程中，也了解到了关于文件、cv等“附加内容”，也还是蛮有收获的吧，ok收工啦！

你可能感兴趣的:(Tensorflow学习笔记,神经网络,tensorflow,学习)

Java高并发系统限流算法的应用赵广陆 arithmetic java 算法开发语言
目录1概述2计数器限流2.1概述2.2实现2.3结果分析2.4优缺点2.5应用3漏桶算法3.1概述3.2实现3.3结果分析3.4优缺点4令牌桶算法4.1概述4.2实现4.3结果分析4.4应用5滑动窗口5.1概述5.2实现5.3结果分析5.4应用想学习架构师构建流程请跳转：Java架构师系统架构设计1概述在开发高并发系统时有三把利器用来保护系统：缓存、降级和限流。限流可以认为服务降级的一种，限流是对
Python从0到100完整学习指南（必看导航）是Dream呀 Python python 人工智能爬虫 web 神经网络算法深度学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学业升学和工作就业的先行者！【优惠信息】•新专栏订阅前1000名享9.9元优惠•订阅量破10
(SERIES1) MacOS Terminal远程SSH连接Aliyun ECS服务器纯命令行模式下部署DM8教程（服务器环境Ubuntu 20.04LTS ） Ender-Shadows 达梦数据库 ubuntu macos 阿里云
1DM数据库版本介绍1.1版本区别 DM8目前的版本主要包括标准版、企业版、安全版和开发版。前三项的比较如表1-1所示。以适用场景为角度进行分类，标准版适用于小型应用开发，企业版适合生产环境级应用，安全版则在具备所有企业版基础上加入了对四权分立、强制访问控制、审计和实时侵害检测等功能上的补全，在安全性方面实现了更加全面完善的安全策略；至于开发版则专供开发者学习、测试、开发用途，有1年免费试用期，
Python|读取word文档表格内容算法与编程之美算法之美编程语言人工智能 python 数据挖掘数据可视化
本文首发于微信公众号："算法与编程之美"，欢迎关注，及时了解更多此系列文章。引言在日常生活里，不管是办公、学习还是制作邀请函、请柬、简历等等，我们都会使用一个软件MicrosoftOfficeWord，OfficeWord是微软公司的一个收费文字处理应用程序，是最流行的文字处理程序之一，它虽功能强大，但简学易懂，但同时也有一个缺点，当一个Word文档储存的内容特别庞大的时候，使用者想要提取自己想要
记忆力锻炼方法穗余记忆力计算机视觉人工智能深度学习
记忆力锻炼的核心在于科学方法、持续训练和健康生活习惯的结合。通过重复训练、关联记忆、充足睡眠等方式，可有效提升大脑信息处理与存储能力。关键在于长期坚持，并结合多种技巧形成适合自己的记忆策略。一、科学记忆方法重复训练与间隔复习大脑通过重复强化神经连接，但机械重复效率低。建议采用间隔重复法，例如学习新知识后，在1天、3天、1周等间隔复习，利用“遗忘曲线”规律巩固记忆。关联记忆法将新信息与已知内容关联，
让AI自己学会“怎么学”——元学习，才是高效训练的终极武器！ Echo_Wish Python 进阶人工智能学习
让AI自己学会“怎么学”——元学习，才是高效训练的终极武器！朋友们，今天咱不聊ChatGPT，不聊大模型黑魔法，也不玩Prompt咒语。我想聊一个比“怎么训模型”更底层、更值得思考的问题：如果我们能让模型自己学会怎么更快、更聪明地学习，是不是就能少走很多弯路？这，就是元学习（MetaLearning）要解决的事儿。说白了，元学习是AI给AI上培训课的过程。咱们天天琢磨怎么喂模型数据、调超参、搞迁移
【机器学习&深度学习】模型微调的基本概念与流程一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、什么是模型微调（Fine-tuning）？二、预训练vs微调：什么关系？三、微调的基本流程（以BERT为例）1️⃣准备数据2️⃣加载预训练模型和分词器3️⃣数据编码与加载4️⃣定义优化器5️⃣开始训练6️⃣评估与保存模型四、是否要冻结BERT层？五、完整训练示例代码5.1环境依赖5.2执行代码总结：微调的优势前言在自然语言处理（NLP）快速发展的今天，预训练模型如BERT成为了众多任务
PHP学习笔记（十二）
访问控制（可见性）对属性或方法的访问控制（PHP7.1后支持常量），是通过在前面添加关键字public（公有）、protected、private来实现。公有的任意可见，受保护的可被自身及其子类和父类访问，私有的只能被其定义所在的类访问属性的访问控制类属性可以定义为public，private或者protected。在没有任何访问控制关键字的情况下，属性声明为public不对称属性可见性从PHP8
前沿技术推动机器人的智能化升级 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据机器人 ai
前沿技术推动机器人的智能化升级关键词：机器人智能化、人工智能、机器学习、计算机视觉、自主导航、人机交互、边缘计算摘要：本文深入探讨了前沿技术如何推动机器人从传统自动化向智能化升级的演进过程。文章首先分析了机器人技术发展的历史脉络和当前挑战，然后详细阐述了人工智能、机器学习、计算机视觉等关键技术如何赋能机器人智能化。通过算法原理分析、数学模型构建和实际项目案例，展示了智能机器人的核心技术实现路径。最
鸿蒙HarmonyOS 5.0开发实战：自定义安全键盘实现案例炫酷盖茨猫先生鸿蒙5.0开发鸿蒙应用开发案例 harmonyos 华为前端 android ArkUI ArkTS 鸿蒙系统
往期鸿蒙5.0全套实战文章必看：（文中附带鸿蒙5.0全栈学习资料）鸿蒙开发核心知识点，看这篇文章就够了最新版！鸿蒙HarmonyOSNext应用开发实战学习路线鸿蒙HarmonyOSNEXT开发技术最全学习路线指南鸿蒙应用开发实战项目，看这一篇文章就够了（部分项目附源码）自定义安全键盘案例
第八章：LeRobot摄像头配置与应用指南贾全实战具身智能机器人深度学习人工智能算法机器学习机器人
引言在机器人学习系统中，视觉感知是至关重要的组成部分。摄像头作为机器人的"眼睛"，为系统提供环境信息，使机器人能够理解周围世界并做出相应的决策。LeRobot作为一个完整的机器人学习框架，提供了灵活且强大的摄像头支持系统，能够适配多种类型的摄像头设备。本章将详细介绍LeRobot的摄像头配置和使用方法，帮助读者掌握如何在机器人学习项目中有效地集成和使用视觉系统。8.1LeRobot摄像头系统架构L
LeRobot环境搭建与安装（简洁版）贾全 LeRobot系列教程机器人人工智能机器学习 ai
一、引言在上一篇文章（LeRobot入门：开启AI机器人开发之旅）中，我们全面了解了LeRobot的基本概念、核心优势和应用场景。现在，是时候动手实践了！本文将详细指导你完成LeRobot开发环境的搭建，确保你能够顺利开始LeRobot的学习和开发之旅。为了保证易读性，对文章进行了大幅精简，如果需要更加详细的介绍，可以查看详解篇：《LeRobot开发环境搭建详解》，二、准备工作创建专用虚拟环境虚拟
Android-ThreadLocal并发安全与内存泄漏原理详解
你生来一无所有，何惧从头再来---勉励自己ThreadLocal是如何实现线程隔离的?为什么ThreadLocal会造成内存泄露?如何解决？本篇文章主要是针对这两个问题进行剖析，确保每个小伙伴都能读懂，深刻理解，篇幅较长，请耐心阅读。大家如果还有什么难点，欢迎在评论区留言，小编将和大家一起学习。定义：ThreadLocal提供线程局部变量，通过为每个线程提供不同的局部变量副本，实现线程之间的数据隔
单片机开发全攻略：从零开始，迈向嵌入式开发高手之路 DTcode7 学习提升单片机 mongodb 嵌入式硬件
单片机开发全攻略：从零开始，迈向嵌入式开发高手之路一、单片机开发基础1.1单片机概述1.2开发环境搭建1.3编程语言与框架二、实战案例：LED闪烁2.1硬件准备2.2代码示例2.3解释三、高级应用：温度监控系统3.1硬件扩展3.2代码实现3.3解释四、开发技巧与问题排查4.1优化内存使用4.2问题排查思路4.3调试工具五、相关项目积分资源5.1在线学习资源5.2社区与论坛5.3开源项目结语与讨论在
PHP语法基础篇(五)：流程控制 zorro_z php手记实战 php
任何PHP脚本都是由一系列语句构成的。一条语句可以是一个赋值语句，一个函数调用，一个循环，一个条件语句或者甚至是一个什么也不做的语句（空语句）。语句通常以分号结束。此外，还可以用花括号将一组语句封装成一个语句组。语句组本身可以当作是一行语句。本篇文章将记录流程控制的学习过程。目录一、条件语句1、if语句2、if...else语句3、if...elseif...else语句4、switch语句4.1
linux深度学习问题汇总不想改代码备忘录 linux python 深度学习 pytorch 人工智能 1024程序员节
目录一、异常问题1.segementationfault(coredump)2.Illegalinstruction(coredumped)3.死锁4.掉卡二、通用方法1.查看重启记录2.系统性能监控3.后台执行命令4.异常日志三、深度学习技术1.普通网络改DDP训练，单机多卡，pytorch四、专业内容方法1.微调diffusion类模型本文记录一些在使用linux服务器进行深度学习时遇到的问题
学习如何让STM32在运行时改变PWM频率和占空比 ZERONG_H 嵌入式 stm32 嵌入式硬件单片机
前言最近有个需求是关于调节占空比去控制风扇实现三挡风力大小的。由于硬件供电和控制成本等原因，普通的芯片支撑不起几个风扇同时转起来，于是就沿用了一个神奇的电路方案，但是这个方案在输出占空比的时候达不到真正的占空比（这里解释不清），因为电机类需要特别注意频率的大小，频率太高或者太低或多或少都会让人耳接受不了，反正是需要在运行时同时改变PWM频率和占空比，本文着重于应用，不讲原理。一、定时器介绍使用的是
PHP基础语法讲解程序员小羊！杂文 php
大家好，我是程序员小羊！前言：PHP（HypertextPreprocessor）是一种常用于网页开发的服务器端脚本语言，易于学习并且与HTML紧密结合。以下是PHP的基础语法详细讲解。1.PHP基础结构1.1PHP脚本结构PHP代码通常嵌入到HTML文件中，并且用特殊的标记或短标记包围：是结束标记。PHP代码可以放在HTML代码中间，服务器解析时只执行PHP代码，输出结果会生成标准HTML页面。
DS18B20温度传感器的Verilog初始化程序实战指南北海有座岛
本文还有配套的精品资源，点击获取简介：DS18B20是一款适用于宽温度范围的高精度数字温度传感器，采用Verilog语言实现其初始化程序，以便能够正确地在系统中运行。本指南详细介绍了DS18B20的初始化过程，包括电源配置、分辨率选择、报警阈值设定等，并解释了如何使用Verilog来控制和通信DS18B20传感器，对于嵌入式系统设计和硬件描述语言的学习具有重要价值。1.DS18B20传感器概述1.
Python 爬虫实战：抓取哔哩哔哩收藏夹视频（API 逆向 + 视频分类整理）西攻城狮北 python 爬虫音视频
引言哔哩哔哩（B站）作为国内知名的视频分享平台，拥有丰富多样的视频资源和活跃的用户社区。对于视频创作者、数据分析人员或爬虫学习者来说，抓取B站收藏夹中的视频数据，不仅能帮助我们更好地了解用户喜好和视频内容，还能为创作和研究提供有力支持。本文将深入浅出地讲解如何通过Python爬虫实现抓取哔哩哔哩收藏夹视频，并对其进行分类整理，涵盖从环境搭建、API逆向分析到数据处理与存储等关键步骤，旨在为读者提供
【Python学习】可视化图表-使用matplotlib绘制不同种类散点图西攻城狮北 Python实用案例 python 学习 matplotlib 可视化图形
一、引言在数据可视化领域，散点图是一种极其强大的工具，它能够直观地展示变量之间的关系、数据分布的模式以及潜在的聚类情况等。通过散点图，我们可以轻松地发现数据中的异常值、相关性以及其他隐藏的特征。Python的matplotlib库提供了丰富而灵活的功能，可以帮助我们绘制出各种类型的散点图，以满足不同的数据分析和展示需求。本文将深入探讨如何使用matplotlib绘制多种类型的散点图，并提供详细的代
关于微信小程序实例源码的研究过程（一） tommy___2005 微信小程序小程序
1部署微信小程序示例源码通过开始|微信开放文档指引，申请微信小程序账号、安装开发者工具，就可以在开放文档的帮助下，进行微信小程序开发了。在了解微信小程序的运行的基础逻辑和框架后，就可以学习微信小程序实例源码了。该源码的git地址为：https://github.com/wechat-miniprogram/miniprogram-demo。根据超级完整的Git的下载、安装、配置与使用以及命令_gi
Python 自动批量生成发卡平台卡密信息并导入数据库拉灯的小手支付相关及一些实用小脚本 Python脚本 Python 自动脚本自动发卡平台发卡网
本文仅供学习交流使用，如侵立删！demo下载见文末Python自动批量生成发卡平台卡密信息并导入数据库环境win10Python：3.6.7os、csv、uuid、datetime1、生成脚本生成卡密文件：txt、csv各一份txt：导入发卡平台csv：导入数据库#-*-coding:utf-8-*-#作者：Administrator#文件：提取码txt转csv脚本.py
【AI】AI大模型发展史：从理论探索到技术爆发不想当程序汪的第N天 AI 人工智能
一、早期探索阶段—理论与技术奠基1.1符号主义与连接主义的博弈20世纪50-70年代，符号主义AI主导研究方向，通过专家系统模拟人类逻辑推理，但受限于计算能力和数据规模。80年代连接主义AI兴起，以神经网络为核心，反向传播算法的提出为深度学习奠定基础。1.2神经网络初步实践1980年：卷积神经网络（CNN）雏形诞生1998年：LeNet-5模型成功应用于手写数字识别，成为首个商用深度学习模型关键局
LVS 负载均衡群集 2301_80329775 Linux系统管理 lvs 负载均衡 android
前言在前面已经学习了使用Nginx、LVS做负载均衡群集，它们都具有各自的特点，本章将要介绍另一款比较流行的群集调度工具Haproxy。首先介绍负载均衡常用调度算法，然后介绍Haproxy搭建Web群集的方法，最后介绍Haproxy的参数优化和日志配置。一。案例分析1.案例概述Haproxy是目前比较流行的一种群集调度工具，同类群集调度工具有很多，如LVS和Nginx。相比较而言，LVS性能最好，
初识 Flask 框架 2301_80329775 pyton编程基础 flask python 后端
前言Flask是一个轻量级的Web框架，基于Python语言开发，设计理念注重简洁、灵活和易用。作为一个"微框架"，它本身非常简洁，提供了构建web应用所需的核心工具，但并不强制开发者遵循复杂的项目结构，因此被广泛应用于web开发领域。Flask非常适合初学者学习Web开发，因为它让开发者能够专注于应用逻辑，而无需过多担心框架本身的复杂性。无论是快速原型开发，还是较小规模的Web应用，Flask都
（Note）音频向量化表示
音频向量化表示经典语音特征（MFCC等）语音信号的传统特征提取方法包括MFCC（梅尔倒谱系数）、PLP等，用于描述语音的频谱包络信息。这些特征设计依据生理听觉模型，在ASR、情感识别等任务中长期有效。但它们仍属浅层特征，无法自动学习更高阶的语言和语音信息，对说话人和环境的鲁棒性有限，通常需配合复杂模型来提高性能。梅尔倒谱系数特征示意图自监督语音模型（Wav2Vec、HuBERT等）近年来，语音领域
如何构建AI原生应用领域的高效SaaS架构 AI原生应用开发 AI-native 架构 ai
如何构建AI原生应用领域的高效SaaS架构关键词：AI原生应用、SaaS架构、微服务、容器化、机器学习模型部署、自动扩展、多租户隔离摘要：本文深入探讨如何构建面向AI原生应用的高效SaaS架构。我们将从基础概念出发，逐步解析AISaaS架构的核心组件、设计原则和最佳实践，并通过实际案例展示如何实现高性能、可扩展的AI服务交付平台。文章将涵盖从基础设施选择到模型部署，从多租户隔离到自动扩展的全方位技
大模型系列——提示词工程：从原理、实践到未来的一部系统性综述猫猫姐大模型人工智能大模型提示词
提示词工程：从原理、实践到未来的一部系统性综述摘要本文系统性地阐述了提示词工程（PromptEngineering）这一关键领域，它作为释放大语言模型（LLM）潜能的核心人机交互范式。报告从LLM的“下一个词预测”基本机制出发，追溯了提示词工程从GPT-3时代“上下文学习”的偶然发现到当前系统化、工程化的演进历程。本文深度剖析了多种高级提示框架，包括旨在激发模型逐步推理的“思维链”（Chain-o
小程序学习笔记：优化商铺列表页面的下拉刷新功能 you4580 学习笔记小程序
在前端开发中，下拉刷新功能能显著提升用户体验，让用户方便地获取最新数据。今天就来和大家分享在开发商铺列表页面时，如何实现并优化下拉刷新功能，同时美化相关窗口样式。本文以微信小程序开发为例进行讲解。开启下拉刷新功能在微信小程序里，开启下拉刷新很简单。找到商铺列表页面的.json配置文件，添加enablePullDownRefresh配置节点，把它的值从默认的false改成true，就能开启下拉刷新效
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

Tensorflow学习笔记（三）：神经网络八股

文章目录

一、神经网络搭建八股：六步法

1. import

2. 导入dataset

3. model = tf.keras.models.Sequential([网络结构])：描述各层网络

拉直层

全连接层

卷积层

LSTM层

4. model.compile：配置训练方法

调用格式

optimizer=

loss=

metrics=

5. model.fit：训练

调用格式

6. model.summary：打印网络结构、参数统计

调用格式

二、举例与讨论

1. 复现：iris分类代码

（1）搭建网络八股sequential进行分类

（2）搭建网络八股class进行分类

2. MNIST数据集及分类

（1）认识数据集

（2）搭建神经网络进行手写数字识别

3. 练习：Fashion数据集及分类

（1）认识数据集

（2）搭建神经网络训练

三、网络八股功能扩展

复盘六步法

（1）总结

（2）限制

1. 自制数据集

功能代码实现

八股修改

2. 数据增强

核心函数

相关代码

结果说明

3. 断点续训

代码实现

使用效果

4. 参数提取

直接查看

保存本地

5. Acc/Loss可视化

代码实现

结果展示

四、从训练到实际

训练源码

应用源码

使用效果

你可能感兴趣的:(Tensorflow学习笔记,神经网络,tensorflow,学习)

1. `import`

3. `model = tf.keras.models.Sequential([网络结构])`：描述各层网络

4. `model.compile`：配置训练方法

5. `model.fit`：训练

6. `model.summary`：打印网络结构、参数统计