Keras深度学习实践1—Keras介绍和“Hello world”

内容参考以及代码整理自“深度学习四大名“著之一《Python深度学习》

一、Keras简介

Keras是一个python深度学习框架，可以方便的定义和训练几乎所有的深度学习模型。

Keras具有以下重要特性：

相同的代码可以在CPU或CPU上无缝切换运行
具有用户友好的API, 便于快速开发深度学习模型的原型。
内置支持卷积网络(用于计算机视觉)、循环网络(用于序列处理)以及二者的任意组合。
支持任意网络架构: 多输入或多输出模型、层共享、模型共享等

1.Keras与TensorFlow等其他深度学习框架的关系

Keras是一个模型级(model-level)的库，位深度学习模型提供了高层次的构建模块。它不处理张量操作、求微分等低层次的运算。相反，它依赖于一个专门的、高度优化的张量库来完成这些运算，这个张量库就是Keras的后端引擎(backend engine)。Keras没有选择单个张量库并Keras与这个库绑定，而是以模块化的方式处理这个问题。因此，几个不同的后端引擎都可以无缝嵌入到Keras中。目前，Keras有三个后端实现: TensorFlow后端、Theano后端和微软认知工具包(CNTK)后端。

image.png

2.使用Keras开发流程

典型的Keras工作流程如下：

定义训练数据: 输入张量和目标张量
定义层组成的网络(或模型), 将输入映射到目标
配置学习过程: 选择损失函数、优化器和需要监控的指标
调用模型的fit方法在训练数据上进行迭代。
定义模型有两种方法：一种是使用Sequential类(仅用于层的线性堆叠，这是目前常用的网络架构), 另一种是函数式API(fuctional API, 用于层组成的有向无环图，让你可以构建任意形式的网络)

利用Seqential类定义两层模型：

from keras import models
from keras import layers

model = models.Sequential()
model.add(layers.Dense(32, activation='relu', imput_shape=(784,)))
model.add(layers.Dense(10, activation='softmax'))

使用函数式API定义相同的模型：

input_tensor = layers.Input(shape=(784,))
x = layers.Dense(32, activation='relu')(input_tensor)
output_tensor = layers.Dense(10, activation='softmax')(x)

model = models.Model(inputs=input_tensor, outputs=output_tensor)

配置学习过程是在编译这一步，你需要指定模型使用的优化器和损失函数，以及训练过程中想要的监控指标。

from keras import optimizers

model.compile(optimizer=optimizers.RMSprop(lr=0.001), loss='mse', metrics=['accuracy'])

最后通过fit方法将输入数据的Numpy数组转入模型。

model.fit(input_tensor, target_tensor, batch_size=128, epochs=10)

二、Keras实现深度学习的“hello word”

下面我们就来按照Keras开发流程来解决一个深度学习领域的“hello world”问题——MINST手写数字分类问题。

MINST数据集，是机器学习领域的一个经典数据集，这个问题可以被描述为：将数字的灰度图像(28 x 28 像素)划分到10个类别当中(0~9)。

step1 数据加载

首先，导入会使用到的包和加载数据集，Keras可以自动的去MINST数据集

from keras.datasets import mnist
from keras import models
from keras import layers
import matplotlib.pyplot as plt
from keras.utils import to_categorical

'''
加载训练数据和测试数据
train_images是图片，train_labels是图片的数字
'''
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

step2 定义网络

这个网络有两个Dense层(全连接)层，最后一层是一个10路softmax层，它将返回一个由10个概率值(总和为1)组成的输出，概率最大的一个被认为是对应分类

'''
开始为神经网络添加层：
第一层是一个有512个节点，使用relu激活函数，输入为 28 * 28向量的全连接层(dense)
第二层是一个具有是个节点，使用'softmax'激活的全连接层，作为输出层，对应10中输出
'''
network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28 * 28,)))
network.add(layers.Dense(10, activation='softmax'))

step3 编译网络

这一步我们将设置网络的优化器，损失函数和评价标准

'''编译网络, 优化器使用rmsprop, 损失函数使用交叉熵损失函数， 网络评估方式是精确度(accuracy)'''
network.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

step 4 对网络进行训练

开始训练网络，传入训练数据，设置训练轮数5，每个批次使用128个样本

'''对网络进行训练，进行5轮训练，每批次训练使用128个样本'''
network.fit(train_images, train_labels, epochs=5, batch_size=128)

step 5 在测试集上验证网络并评价

传入测试集，并且获取训练结果，到此训练结束。

'''评价网络'''
test_loss, test_acc = network.evaluate(test_images, test_labels)
print('test_acc:', test_acc)

查询训练结果：