创建全连接层的时候tf 1.15 提供了2个函数:
tf.keras.layers.Dense 和 tf.layers.Dense
这2个函数的用法看上去一模一样
tf.keras.layers.Dense(
units, activation=None, use_bias=True, kernel_initializer='glorot_uniform',
bias_initializer='zeros', kernel_regularizer=None, bias_regularizer=None,
activity_regularizer=None, kernel_constraint=None, bias_constraint=None,
**kwargs
)
tf.layers.Dense(
units, activation=None, use_bias=True, kernel_initializer=None,
bias_initializer=tf.zeros_initializer(), kernel_regularizer=None,
bias_regularizer=None, activity_regularizer=None, kernel_constraint=None,
bias_constraint=None, trainable=True, name=None, **kwargs
)
但是在实际上使用的时候有一个大坑:正则项的保存位置
正常情况下,我们使用
weights = tf.get_variable(name='weights', initializer=init, regularizer=tf.nn.l2_loss)
来定义一个带有正则项的系数矩阵。(这里额外插一句,这种方法有一个缺陷,tf 只提供了tf.nn.l2_loss 而没有提供 tf.nn.l1_loss,呵呵呵呵呵,如果想用l1 正则,还是自己手动写吧)这样定义的系数矩阵的正则项保存在tf.GraphKeys.REGULARIZATION_LOSSES 中。
我用tf.layers.Dense 定义的全连接层,loss 也确实都在里面tf.GraphKeys.REGULARIZATION_LOSSES
dense_layer = tf.layers.Dense(layer2_units,
use_bias=True,
trainable=is_training,
activation = tf.nn.leaky_relu,
kernel_regularizer=tf.keras.regularizers.l1_l2(l1=0.001,l2=0.001))
但是我用tf.keras.layers.Dense
dense_layer = tf.keras.layers.Dense(layer2_units,
use_bias=True,
trainable=is_training,
activation = tf.nn.leaky_relu,
kernel_regularizer=tf.keras.regularizers.l1_l2(l1=0.001,l2=0.001))
发现loss 并没有保存在tf.GraphKeys.REGULARIZATION_LOSSES 中,几经查找,终于找到loss 保存在了 dense_layer.losses 中