keras介绍
tf.keras是tensorflow2引入的高封装度的框架,可以用于快速搭建神经网络模型,keras为支持快速实验而生,能够把想法迅速转换为结果,是深度学习框架之中最终易上手的一个,它提供了一致而简洁的API,能够极大地减少一般应用下的工作量,提高代码地封装程度和复用性。
一.用tf.keras创建网络的步骤
1.import 引入相应的python库
2.train,test告知要喂入的网络的训练集和测试集是什么,指定训练集的输入特征,x_train和训练集的标签y_train,以及测试集的输入特征和测试集的标签。
3.model = tf,keras,models,Seqential 在Seqential中搭建网络结构,逐层表述每层网络,走一边前向传播。
4.model.compile 在complie()中配置训练方法。告知训练器选择哪种优化器,选择哪个损失函数,哪种评测指标
5。model.fit 在fit中执行训练过程,告知训练集和测试集的训练特征和标签,告知每个batch是多少,要迭代多少次数据集。
6.model.summary 用summary()打印出网络的结构和参数统计
二.改进鸢尾花分类
相关函数说明
1.tf.keras.models.Sequential()
Sequential函数是一个容器,描述了神经网络的网络结构,在Sequential函数的输入参数中描述从输入层到输出层的网络结构。
全连接层:tf.keras.layers.Dense( 神经元个数,
activation=”激活函数”,
kernel_regularizer=”正则化方式”)
其中:
activation激活函数(字符串给出)可选relu、softmax、sigmoid、tanh等
kernel_regularizer正则化可选tf.keras.regularizers.l1()、
tf.keras.regularizers.l2()
2.Model.compile()
Model.compile( optimizer = 优化器,
loss = 损失函数,
metrics = [“准确率”])
Compile用于配置神经网络的训练方法,告知训练时使用的优化器、损失函数和准确率评测标准。
其中:
optimizer可以是字符串形式给出的优化器名字,也可以是函数形式,使用函数形式可以设置学习率、动量和超参数。
可选项包括:
‘sgd’or tf.optimizers.SGD( lr=学习率,
decay=学习率衰减率,
momentum=动量参数)
‘adagrad’or tf.keras.optimizers.Adagrad(lr=学习率,
decay=学习率衰减率)
‘adadelta’or tf.keras.optimizers.Adadelta(lr=学习率,
decay=学习率衰减率)
‘adam’or tf.keras.optimizers.Adam (lr=学习率,
decay=学习率衰减率)
Loss可以是字符串形式给出的损失函数的名字,也可以是函数形式。
可选项包括:
‘mse’or tf.keras.losses.MeanSquaredError()
‘sparse_categorical_crossentropy
or tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False)
损失函数常需要经过softmax等函数将输出转化为概率分布的形式。from_logits则用来标注该损失函数是否需要转换为概率的形式,取False时表示转化为概率分布,取True时表示没有转化为概率分布,直接输出。
4.Metrics标注网络评测指标。
可选项包括:
‘accuracy’:y_和y都是数值,
如y_=[1] y=[1]。
‘categorical_accuracy’:y_和y都是以独热码和概率分布表示。
如y_=[0, 1, 0], y=[0.256, 0.695, 0.048]。
‘sparse_ categorical_accuracy’:y_是以数值形式给出,y是以独热码形式给出。
如y_=[1],y=[0.256, 0.695, 0.048]。
5.model.fit()
model.fit(训练集的输入特征, 训练集的标签, batch_size, epochs,
validation_data = (测试集的输入特征,测试集的标签),
validataion_split = 从测试集划分多少比例给训练集,
validation_freq = 测试的epoch间隔次数)
fit函数用于执行训练过程
6.model.summary()
summary函数用于打印网络结构和参数统计
上图是model.summary()对鸢尾花分类网络的网络结构和参数统计,对于一个输入为4输出为3的全连接网络,共有15个参数。
代码清单:
# 使用tf.keras改进鸢尾花数据集的预测
# 1.import
import tensorflow as tf
from sklearn import datasets
import numpy as np
from tensorflow.keras.layers import Dense
from tensorflow.keras import Model
# 2.train test
x_train = datasets.load_iris().data
y_train = datasets.load_iris().target
np.random.seed(116) # 使用相同的seed,保证输入特征和标签一一对应
np.random.shuffle(x_train) #shuffle-洗牌
np.random.seed(116)
np.random.shuffle(y_train)
# 3.model.Sequential()
# model = tf.keras.models.Sequential([
# tf.keras.layers.Dense(3,activation='softmax',kernel_regularizer=tf.keras.regularizers.l2())
# ])
# class Mymodel
class IrisModel(Model):#子类IrisModel继承父类Model
# 定义网络结构块
def __init__(self):# 接收父类的属性信息
super(IrisModel,self).__init__()# super将子类父类关联,并使子类调用父类的方法
self.d1 = Dense(3,activation='softmax',kernel_regularizer=tf.keras.regularizers.l2())
# 调用网络结构块,这里实现前向传播
def call(self,x):
y = self.d1(x)
return y
#实例化model
model = IrisModel()
# 4.complie
model.compile(optimizer=tf.keras.optimizers.SGD(learning_rate=0.1),
loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
metrics=['sparse_categorical_accuracy']
)
# 5.model.fit
model.fit(x_train,y_train,batch_size=32,epochs=500,validation_split=0.2,validation_freq=20)
# 6.summary
model.summary()