内容参考以及代码整理自“深度学习四大名“著之一《Python深度学习》
一、Keras简介
Keras是一个python深度学习框架,可以方便的定义和训练几乎所有的深度学习模型。
Keras具有以下重要特性:
- 相同的代码可以在CPU或CPU上无缝切换运行
- 具有用户友好的API, 便于快速开发深度学习模型的原型。
- 内置支持卷积网络(用于计算机视觉)、循环网络(用于序列处理)以及二者的任意组合。
- 支持任意网络架构: 多输入或多输出模型、层共享、模型共享等
1.Keras与TensorFlow等其他深度学习框架的关系
Keras是一个模型级(model-level)的库,位深度学习模型提供了高层次的构建模块。它不处理张量操作、求微分等低层次的运算。相反,它依赖于一个专门的、高度优化的张量库来完成这些运算,这个张量库就是Keras的后端引擎
(backend engine)。Keras没有选择单个张量库并Keras与这个库绑定,而是以模块化的方式处理这个问题。因此,几个不同的后端引擎都可以无缝嵌入到Keras中。目前,Keras有三个后端实现: TensorFlow后端、Theano后端和微软认知工具包(CNTK)后端。
2.使用Keras开发流程
典型的Keras工作流程如下:
定义训练数据: 输入张量和目标张量
定义层组成的网络(或模型), 将输入映射到目标
配置学习过程: 选择损失函数、优化器和需要监控的指标
调用模型的fit方法在训练数据上进行迭代。
定义模型有两种方法:一种是使用Sequential类(仅用于层的线性堆叠,这是目前常用的网络架构), 另一种是函数式API(fuctional API, 用于层组成的有向无环图,让你可以构建任意形式的网络)
利用Seqential类定义两层模型:
from keras import models
from keras import layers
model = models.Sequential()
model.add(layers.Dense(32, activation='relu', imput_shape=(784,)))
model.add(layers.Dense(10, activation='softmax'))
使用函数式API定义相同的模型:
input_tensor = layers.Input(shape=(784,))
x = layers.Dense(32, activation='relu')(input_tensor)
output_tensor = layers.Dense(10, activation='softmax')(x)
model = models.Model(inputs=input_tensor, outputs=output_tensor)
配置学习过程是在编译这一步,你需要指定模型使用的优化器和损失函数,以及训练过程中想要的监控指标。
from keras import optimizers
model.compile(optimizer=optimizers.RMSprop(lr=0.001), loss='mse', metrics=['accuracy'])
最后通过fit方法将输入数据的Numpy数组转入模型。
model.fit(input_tensor, target_tensor, batch_size=128, epochs=10)
二、Keras实现深度学习的“hello word”
下面我们就来按照Keras开发流程来解决一个深度学习领域的“hello world”问题——MINST手写数字分类问题。
MINST数据集,是机器学习领域的一个经典数据集,这个问题可以被描述为:将数字的灰度图像(28 x 28 像素)划分到10个类别当中(0~9)。
step1 数据加载
首先,导入会使用到的包和加载数据集,Keras可以自动的去MINST数据集
from keras.datasets import mnist
from keras import models
from keras import layers
import matplotlib.pyplot as plt
from keras.utils import to_categorical
'''
加载训练数据和测试数据
train_images是图片,train_labels是图片的数字
'''
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
step2 定义网络
这个网络有两个Dense层(全连接)层,最后一层是一个10路softmax层,它将返回一个由10个概率值(总和为1)组成的输出,概率最大的一个被认为是对应分类
'''
开始为神经网络添加层:
第一层是一个有512个节点,使用relu激活函数,输入为 28 * 28向量的全连接层(dense)
第二层是一个具有是个节点,使用'softmax'激活的全连接层,作为输出层,对应10中输出
'''
network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28 * 28,)))
network.add(layers.Dense(10, activation='softmax'))
step3 编译网络
这一步我们将设置网络的优化器,损失函数和评价标准
'''编译网络, 优化器使用rmsprop, 损失函数使用交叉熵损失函数, 网络评估方式是精确度(accuracy)'''
network.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])
step 4 对网络进行训练
开始训练网络,传入训练数据,设置训练轮数5,每个批次使用128个样本
'''对网络进行训练,进行5轮训练,每批次训练使用128个样本'''
network.fit(train_images, train_labels, epochs=5, batch_size=128)
step 5 在测试集上验证网络并评价
传入测试集,并且获取训练结果,到此训练结束。
'''评价网络'''
test_loss, test_acc = network.evaluate(test_images, test_labels)
print('test_acc:', test_acc)
查询训练结果:
三、小结
通过mnist这个例子,我们可以看出Keras可以快速建立一个深度学习网络,并进行训练和测试,非常方便。
查看完整代码,请看:
https://github.com/ubwshook/MachineLearning/blob/master/keras/mnist_relu.py