Keras深度学习实践1—Keras介绍和“Hello world”

内容参考以及代码整理自“深度学习四大名“著之一《Python深度学习》

一、Keras简介

Keras是一个python深度学习框架,可以方便的定义和训练几乎所有的深度学习模型。

Keras具有以下重要特性:

  • 相同的代码可以在CPU或CPU上无缝切换运行
  • 具有用户友好的API, 便于快速开发深度学习模型的原型。
  • 内置支持卷积网络(用于计算机视觉)、循环网络(用于序列处理)以及二者的任意组合。
  • 支持任意网络架构: 多输入或多输出模型、层共享、模型共享等

1.Keras与TensorFlow等其他深度学习框架的关系

Keras是一个模型级(model-level)的库,位深度学习模型提供了高层次的构建模块。它不处理张量操作、求微分等低层次的运算。相反,它依赖于一个专门的、高度优化的张量库来完成这些运算,这个张量库就是Keras的后端引擎(backend engine)。Keras没有选择单个张量库并Keras与这个库绑定,而是以模块化的方式处理这个问题。因此,几个不同的后端引擎都可以无缝嵌入到Keras中。目前,Keras有三个后端实现: TensorFlow后端、Theano后端和微软认知工具包(CNTK)后端。

image.png

2.使用Keras开发流程

典型的Keras工作流程如下:

定义训练数据: 输入张量和目标张量
定义层组成的网络(或模型), 将输入映射到目标
配置学习过程: 选择损失函数、优化器和需要监控的指标
调用模型的fit方法在训练数据上进行迭代。
定义模型有两种方法:一种是使用Sequential类(仅用于层的线性堆叠,这是目前常用的网络架构), 另一种是函数式API(fuctional API, 用于层组成的有向无环图,让你可以构建任意形式的网络)

利用Seqential类定义两层模型:

from keras import models
from keras import layers

model = models.Sequential()
model.add(layers.Dense(32, activation='relu', imput_shape=(784,)))
model.add(layers.Dense(10, activation='softmax'))

使用函数式API定义相同的模型:

input_tensor = layers.Input(shape=(784,))
x = layers.Dense(32, activation='relu')(input_tensor)
output_tensor = layers.Dense(10, activation='softmax')(x)

model = models.Model(inputs=input_tensor, outputs=output_tensor)

配置学习过程是在编译这一步,你需要指定模型使用的优化器和损失函数,以及训练过程中想要的监控指标。

from keras import optimizers

model.compile(optimizer=optimizers.RMSprop(lr=0.001), loss='mse', metrics=['accuracy'])

最后通过fit方法将输入数据的Numpy数组转入模型。

model.fit(input_tensor, target_tensor, batch_size=128, epochs=10)

二、Keras实现深度学习的“hello word”

下面我们就来按照Keras开发流程来解决一个深度学习领域的“hello world”问题——MINST手写数字分类问题。

MINST数据集,是机器学习领域的一个经典数据集,这个问题可以被描述为:将数字的灰度图像(28 x 28 像素)划分到10个类别当中(0~9)。

step1 数据加载

首先,导入会使用到的包和加载数据集,Keras可以自动的去MINST数据集

from keras.datasets import mnist
from keras import models
from keras import layers
import matplotlib.pyplot as plt
from keras.utils import to_categorical

'''
加载训练数据和测试数据
train_images是图片,train_labels是图片的数字
'''
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

step2 定义网络

这个网络有两个Dense层(全连接)层,最后一层是一个10路softmax层,它将返回一个由10个概率值(总和为1)组成的输出,概率最大的一个被认为是对应分类

'''
开始为神经网络添加层:
第一层是一个有512个节点,使用relu激活函数,输入为 28 * 28向量的全连接层(dense)
第二层是一个具有是个节点,使用'softmax'激活的全连接层,作为输出层,对应10中输出
'''
network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28 * 28,)))
network.add(layers.Dense(10, activation='softmax'))

step3 编译网络

这一步我们将设置网络的优化器,损失函数和评价标准

'''编译网络, 优化器使用rmsprop, 损失函数使用交叉熵损失函数, 网络评估方式是精确度(accuracy)'''
network.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

step 4 对网络进行训练

开始训练网络,传入训练数据,设置训练轮数5,每个批次使用128个样本

'''对网络进行训练,进行5轮训练,每批次训练使用128个样本'''
network.fit(train_images, train_labels, epochs=5, batch_size=128)

step 5 在测试集上验证网络并评价

传入测试集,并且获取训练结果,到此训练结束。

'''评价网络'''
test_loss, test_acc = network.evaluate(test_images, test_labels)
print('test_acc:', test_acc)

查询训练结果:

image.png

三、小结

通过mnist这个例子,我们可以看出Keras可以快速建立一个深度学习网络,并进行训练和测试,非常方便。

查看完整代码,请看:
https://github.com/ubwshook/MachineLearning/blob/master/keras/mnist_relu.py

你可能感兴趣的:(Keras深度学习实践1—Keras介绍和“Hello world”)