keras学习笔记(三):模型复现

由于模型在构造的时候会引入大量的随机参数,所以神经网络有个非常重要的一个问题就是模型无法复现。在模型的训练过程中,我们需要保证特定模型的性能是不变的。以确定性能的变化是来自模型还是数据集的变化,或者仅仅是一些新的随机样本点带来的结果。下面的代码片段解决模型复现的问题,针对 Python 3 环境,以TensorFlow作为keras的后端。

import numpy as np
import tensorflow as tf
import random as rn

# 以下是 Python 3.2.3 以上所必需的,
# 为了使某些基于散列的操作可复现。
# https://docs.python.org/3.4/using/cmdline.html#envvar-PYTHONHASHSEED
# https://github.com/keras-team/keras/issues/2280#issuecomment-306959926

import os
os.environ['PYTHONHASHSEED'] = '0'

# 以下是 Numpy 在一个明确的初始状态生成固定随机数字所必需的。

np.random.seed(42)

# 以下是 Python 在一个明确的初始状态生成固定随机数字所必需的。

rn.seed(12345)

# 强制 TensorFlow 使用单线程。
# 多线程是结果不可复现的一个潜在的来源。
# 更多详情,见: https://stackoverflow.com/questions/42022950/which-seeds-have-to-be-set-where-to-realize-100-reproducibility-of-training-res

session_conf = tf.ConfigProto(intra_op_parallelism_threads=1, inter_op_parallelism_threads=1)

from keras import backend as K

# `tf.set_random_seed()` 将会以 TensorFlow 为后端,
# 在一个明确的初始状态下生成固定随机数字。
# 更多详情,见: https://www.tensorflow.org/api_docs/python/tf/set_random_seed

tf.set_random_seed(1234)

sess = tf.Session(graph=tf.get_default_graph(), config=session_conf)
K.set_session(sess)

# 剩余代码 ...

你可能感兴趣的:(人工智能,Keras学习笔记)