wzg2016

批标准化 tf.keras.layers.BatchNormalization 参数解析与应用分析

Table of Contents

函数调用

设置training=None时可能存在的问题 :tf.keras.backend.learning_phase()的特点

批标准化函数产生的变量是可训练的吗？

在使用批标准化时，要保存所有变量，而不仅仅是可训练变量

应用分析

滑动平均的计算公式：

滑动平均计算节点在批标准化中的作用

滑动平均的计算时机与注意事项：添加依赖控制

如果没有添加依赖控制会怎样？

批标准化过程

说明：

1. 我用的tensorflow是1.14.0。 tensorflow的一些参数含义在1.*版本和2.*版本上是不同的。这点需要注意。以下面代码中的参数“trainable=True/False”为例，在1.*版本和2.*版本上是完全相反的含义。（劝大家早日逃离tensorflow）.

2. trainable参数：是在批标准化层的类对象参数。

training参数：是批标准化的类对象的调用函数call()的参数。

3. trainable参数：

上面提到，在tensorflow 2.0和tensorflow 1.*中，对于批标准化层的trainable参数的相同设置有不同的含义。下面第二个代码框内有介绍。

所应用的到底是哪种含义，建议直接去源码查看说明，我用的是tf 1.14.0, 在批标准化层的说明。

参数介绍

基类的定义如下：

class BatchNormalizationBase(Layer):
  def __init__(self,
               axis=-1,# 指向[NHWC]的channel维度，当数据shape为[NCHW]时，令axis=1
               momentum=0.99,# 计算均值与方差的滑动平均时使用的参数（滑动平均公式中的beta，不要与这里混淆）
               epsilon=1e-3,
               center=True,# bool变量，决定是否使用批标准化里的beta参数(是否进行平移)
               scale=True,# bool变量，决定是否使用批标准化里的gamma参数(是否进行缩放)
               beta_initializer='zeros',# 调用init_ops.zeros_initializer()，beta参数的0初始化，beta参数是平移参数
               gamma_initializer='ones',# 调用init_ops.ones_initializer()，gamma参数的1初始化,gamma参数是缩放参数
               moving_mean_initializer='zeros',# 均值的滑动平均值的初始化，初始均值为0
               moving_variance_initializer='ones',# 方差的滑动平均值的初始化，初始均值为1# 可见初始的均值与方差是标准正态分布的均值与方差
               beta_regularizer=None,# beta参数的正则化向，一般不用
               gamma_regularizer=None,# gamma 参数的正则化向，一般不用
               beta_constraint=None,# beta参数的约束项，一般不用
               gamma_constraint=None,# gamma 参数的约束项，一般不用
               renorm=False,
               renorm_clipping=None,
               renorm_momentum=0.99,
               fused=None,
               trainable=True,# 默认为True，这个我觉得就不要改了，没必要给自己找麻烦，
                              # 就是把我们标准化公式里面的参数添加到
                              # GraphKeys.TRAINABLE_VARIABLES这个集合里面去，
                              # 因为只有添加进去了，参数才能更新，毕竟γ和β是需要学习的参数。
                              # 但是，tf.keras.layers.BatchNormalization中并没有做到这一点，
                              # 所以需要手工执行这一操作。
               virtual_batch_size=None,
               adjustment=None,
               name=None,
               **kwargs):
    ########################
    ##只介绍参数，具体执行代码省略
    #####################

  def _get_training_value(self, training=None):
    #######
    ###该函数说明了training在不同取值时的处理，把输入的training参数转为bool变量输出，
    ###这里主要关注对training=None的处理
    #######
    if training is None:
      training = K.learning_phase() # K表示keras.backend,learning_phase()函数返回当前状态flag，是train还是test阶段，供keras使用
    if self._USE_V2_BEHAVIOR:
      if isinstance(training, int):
        training = bool(training)
      if base_layer_utils.is_in_keras_graph():
        training = math_ops.logical_and(training, self._get_trainable_var())
      else:
        training = math_ops.logical_and(training, self.trainable)
    return training

  def call(self, inputs,# 就是输入数据，默认shape=[NHWC],如果是其它shape，要对上面的axis值进行修改
         training=None  # 有三种选择：True,False，None，用于判断网络是处于训练阶段还是测试阶段。
                        # `training=True`: 网络处于训练阶段，The layer will normalize its inputs 
                        #    using the mean and variance of the current batch of inputs.
                        #  `training=False`: 网络处于测试阶段或inference阶段，The layer will normalize its inputs using 
                        #    the mean and variance of its moving statistics, learned during training.
                        # 即，training=True：使用当前批次的均值与方差进行标准化；training=False,使用滑动均值，滑动方差进行标准化。
                       
          ):
   
    training = self._get_training_value(training)

    ###
    ###只介绍参数，具体执行代码省略
    ###

关于trainable的设置，以下是keras的说明：

"""
class BatchNormalization(normalization.BatchNormalizationBase):

  __doc__ = normalization.replace_in_base_docstring([
      ('{{TRAINABLE_ATTRIBUTE_NOTE}}',
       '''
  **About setting `layer.trainable = False` on a `BatchNormalization layer:**
关于 BatchNormalization 层中 layer.trainable = False 的设置：

  The meaning of setting `layer.trainable = False` is to freeze the layer,
  i.e. its internal state will not change during training:
  its trainable weights will not be updated
  during `fit()` or `train_on_batch()`, and its state updates will not be run.
对于一个一般的层，设置layer.trainable = False表示冻结这一层的参数，使这一层的内部状态不随着训练过程改变，即这一层的可训练参数不被更新，也即，在`fit()` or `train_on_batch()`过程中，这一层的状态不会被更新。

  Usually, this does not necessarily mean that the layer is run in inference
  mode (which is normally controlled by the `training` argument that can
  be passed when calling a layer). "Frozen state" and "inference mode"
  are two separate concepts.
通常，设置layer.trainable = False并不一定意味着这一层处于inference状态（测试状态），（模型是否处于inference状态，通常调用该层的call函数时用一个叫training的参数控制。）所以，“冻结状态”和“推断模式”是两种不同的概念。

  However, in the case of the `BatchNormalization` layer, **setting
  `trainable = False` on the layer means that the layer will be
  subsequently run in inference mode** (meaning that it will use
  the moving mean and the moving variance to normalize the current batch,
  rather than using the mean and variance of the current batch).
但是，在BatchNormalization中，设置trainable = False 意味着这一层会以“推断模式”运行。
这就意味着，如果在训练过程中设置批标准化层的trainable = False，就意味着批标准化过程中会使用滑动均值与滑动方差来执行当前批次数据的批标准化，而不是使用当前批次的均值与方差。
----》个人理解：对于批标准化，我们希望的是，在训练过程中使用每个minibatch自己的均值与方差执行标准化，同时保持一个滑动均值与滑动方差在测试过程中使用。如果在训练过程中，设置trainable = False的话，会导致，在训练过程中，批标准化层就会使用滑动均值与方差进行批标准化。


  This behavior has been introduced in TensorFlow 2.0, in order
  to enable `layer.trainable = False` to produce the most commonly
  expected behavior in the convnet fine-tuning use case.
这一操作已经被引入到TensorFlow 2.0中，目的是使`layer.trainable = False`产生最期待的行为：以便在网络fine-tune中使用。
---》个人理解：在网络fine-tune中，我们希望冻结一些层的参数，仅仅训练个别层的参数。对于批标准化层来说，我们希望这一层在训练过程中仍旧使用已经训练好的滑动均值和滑动方差，而不是当前批次的均值和方差。

  Note that:
    - This behavior only occurs as of TensorFlow 2.0. In 1.*,
      setting `layer.trainable = False` would freeze the layer but would
      not switch it to inference mode.
注意：这一行为仅仅发生在TensorFlow 2.0上。在1.*版本上，设置标准化层的`layer.trainable = False`，仍旧只会冻结标准化层的gamma和beta,仍旧使用当前批次的均值和方差标准化。
--》个人理解：在1.*版本上，设置标准化层的`layer.trainable = False`，得到的操作是：
    1）标准化层的gamma和beta不被训练
    2）执行标准化时，使用的是当前批次的均值和方差，而不是滑动均值和滑动方差。
    3）滑动均值和滑动方差仍旧会被计算吗？这有待确定。
    - Setting `trainable` on an model containing other layers will
      recursively set the `trainable` value of all inner layers.
当给一整个model设置trainable参数时，相当于给其内部的每个层都设置了这一相同的参数。
    - If the value of the `trainable`
      attribute is changed after calling `compile()` on a model,
      the new value doesn't take effect for this model
      until `compile()` is called again.
如果，model在调用“compile()”时改变了trainable参数，新的trainable参数值并不影响这个model,直到再次调用“compile()”函数。
      ''')])
"""

函数调用

综上，在调用tf.keras.layers.BatchNormalization 时，我们几乎不需要设定任何参数，只需要输入数据就好。

但是

1. tf.keras.layers.BatchNormalization有一个bug：无论“trainable=True"还是“trainable=False"，tf.keras.layers.BatchNormalization都不会把批标准化中的变量放到 tf.GraphKeys.UPDATE_OPS, bn_update_ops中去，所以需要手动添加。

示例：

import tensorflow as tf

input = tf.ones([1, 2, 2, 3])
output = tf.keras.layers.BatchNormalization(trainable=None)(input,training=True)
#output = tf.keras.layers.BatchNormalization(trainable=True)(input,training=True)
#output = tf.keras.layers.BatchNormalization(trainable=False)(input,training=True)

update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)
print(update_ops)
"""
以上三种情况都是返回 []
"""

根据打印结果可见，keras没有把批标准化中的变量添加到tf.GraphKeys.UPDATE_OPS中,所以不能直接调用tf.GraphKeys.UPDATE_OPS 去进行更新节点的提取。

因此，需要手动把BN的更新节点到tf.GraphKeys.UPDATE_OPS,的方法如下：

import tensorflow as tf

input = tf.ones([1, 2, 2, 3])
output = tf.keras.layers.BatchNormalization()(input,training=True)

# 手动添加方法
ops = tf.get_default_graph().get_operations()
bn_update_ops = [x for x in ops if ("AssignMovingAvg" in x.name and x.type=="AssignSubVariableOp")]
tf.add_to_collection(tf.GraphKeys.UPDATE_OPS,bn_update_ops)

update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)
print(update_ops)

2. 批标准化的一个比较重要的参数是"training"，在一些其他批标准化函数中需要手工设定，在keras里既可以通过手工设定，也可以通过另外一种方式设定：用tf.keras.backend.set_learning_phase()来设定。

from tensorflow.keras import backend as K
# 设置keras的训练状态，模拟训练或测试状态
K.set_learning_phase(1) # 1 代表训练状态， 0 代表测试状态
is_training = K.learning_phase()
print(is_training)
"""
打印： 1
"""

用tf.keras.backend.set_learning_phase()设定训练状态（一个全局变量）后，tf.keras.layers.BatchNormalization可以识别这一状态，然后对training=None进行自动处理：令training=True或False.这个操作在tf.keras.layers.BatchNormalization的源码中有所体现，这里不再赘述。

示例：

import tensorflow as tf
from keras import backend as K

# 设置keras的训练状态，模拟训练或测试状态
K.set_learning_phase(0) # 1 代表训练状态， 0 代表测试状态
is_training = K.learning_phase()
print ("is_training =",K.learning_phase())

input = tf.ones([1, 2, 2, 3])
output = tf.keras.layers.BatchNormalization()(input,training=None)

# 手动添加方法
ops = tf.get_default_graph().get_operations()
bn_update_ops = [x for x in ops if ("AssignMovingAvg" in x.name and x.type=="AssignSubVariableOp")]
tf.add_to_collection(tf.GraphKeys.UPDATE_OPS,bn_update_ops)


update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)
print(”update_ops=“，update_ops)
"""
当设置 K.set_learning_phase(0) 时，打印：
is_training = 0
update_ops= [[]]


当设置 K.set_learning_phase(1) 时，打印：
is_training = 1
update_ops= [[
, 

]]

"""

设置training=None时可能存在的问题 :tf.keras.backend.learning_phase()的特点

tf.keras.backend.learning_phase()的设定要出现在所有节点（尤其批标准化层）的定义之前

tf.keras.backend.learning_phase()会获取一个全局变量，是一个tensorflow的bool型tensor。在使用前需要预先设定。如果不预先设定，在执行全部变量初始化时会被初始化为False.如下：

import tensorflow as tf
from tensorflow.keras import backend as K

is_training = K.learning_phase()
print(is_training)

with tf.Session() as sess:
	tf.global_variables_initializer().run()
	print(sess.run(is_training))
"""
打印：
Tensor("keras_learning_phase:0", shape=(), dtype=bool)
False
"""

多说一句，如果不用 tensorflow.keras.backend.set_learning_phase()预先设定神经网络的训练或测试状态，keras或tensorflow是不会通过你的其他行为代码任务判断你是在训练还是在测试的，它还没那么智能，而且也很难有一个很明显的行为特征来指示这一点。因此，如果在用tf.keras.layers.BatchNormalization批标准化时打算用training=None的参数设置，一定要预先用 tf.keras.backend.set_learning_phase()设定好程序的运行状态。

再多说一句，tf.keras.backend.set_learning_phase()一定要出现在所有计算节点之前才有效，否则，如果在set_learning_phase()之前定义了BatchNormalization()(training=None)层,此时keras不知道程序的训练或测试状态，会默认生成滑动均值的更新计算节点，即使后面设置了tf.keras.backend.set_learning_phase(0)也不会改变。

示例代码如下：

示例1：set_learning_phase()出现在BatchNormalization()(training=None)之前

import tensorflow as tf
from tensorflow.keras import backend as K

# 设置keras的训练状态，模拟训练或测试状态
K.set_learning_phase(0) # 1 代表训练状态， 0 代表测试状态
is_training = K.learning_phase()
print ("is_training =",is_training)

# 定义计算节点及BN层
input = tf.ones([1, 2, 2, 3])
output = tf.keras.layers.BatchNormalization()(input,training=None)

# 检测update_ops的生成手动添加方法
ops = tf.get_default_graph().get_operations()
bn_update_ops = [x for x in ops if ("AssignMovingAvg" in x.name and x.type=="AssignSubVariableOp")]

print("bn_update_ops=",bn_update_ops)
"""
实验结果：
K.set_learning_phase(0)时打印：
is_training = 0
bn_update_ops= []

K.set_learning_phase(1)时打印：
is_training = 1
bn_update_ops= [
, 
]

结果符合预期
"""

示例2：set_learning_phase()出现在BatchNormalization()(training=None)之后

import tensorflow as tf
from tensorflow.keras import backend as K

# 定义计算节点及BN层
input = tf.ones([1, 2, 2, 3])
output = tf.keras.layers.BatchNormalization()(input,training=None)

# 设置keras的训练状态，模拟训练或测试状态
K.set_learning_phase(0) # 1 代表训练状态， 0 代表测试状态
is_training = K.learning_phase()
print ("is_training =",is_training)

# 检测update_ops的生成手动添加方法
ops = tf.get_default_graph().get_operations()
bn_update_ops = [x for x in ops if ("AssignMovingAvg" in x.name and x.type=="AssignSubVariableOp")]

print("bn_update_ops=",bn_update_ops)

"""
实验结果：
K.set_learning_phase(0)时打印：
is_training = 0
bn_update_ops= [
, 
]

K.set_learning_phase(1)时打印：
is_training = 1
bn_update_ops= [
, 
]

结果不符合预期， keras的训练与测试的状态设定对批标准化无影响
"""

还有一种情况就是，即设置了training=True又设置了K.set_learning_phase(0)，或者反过来，这种自相矛盾的事希望大家还是不要发生。

综上，training=None/True/False的设定问题，看大家的习惯，不要造成紊乱。个人觉得手工设定training=True/False好一些。这个习惯与其他的批标准化函数也统一一些。毕竟K.set_learning_phase(0)是keras独有的。

批标准化函数产生的变量是可训练的吗？

批标准化的流程如下：

由流程图可见：

1）在训练时（training=True），

(a) 使用的是当前批次数据的均值与方差做数据标准化,

(b) 同时维持了一个均值的滑动平均值与方差的滑动平均值。这两个数值在训练期间不起作用。

备注：训练时的更新节点，是对“均值的滑动平均值”与“方差的滑动平均值”进行更新。与当前批次的均值与方差的计算，beta与gamma的更新没有任何关系。

2）在测试时（training=False）:

（a）用训练过程中的“均值的滑动平均值”与“方差的滑动平均值”对测试数据进行标准化。

(b) 由于测试时，不再执行“参数更新节点”，要注意也不要再执行“均值与方差的滑动平均节点”，所以此时滑动均值，滑动方差，放缩变量，平移变量均不会再进行变化。

如果：在训练时，设置了training=False,会导致什么结果？

1）设置 training =False,会导致 “均值与方差的滑动均值节点”不会被创建，从而均值与方差的滑动平均值永远保持初始值：均值的滑动均值等于0，方差的滑动均值等于1.

2）设置training=False，会导致批标准化算法不会使用当前批次的均值与方差对数据进行标准化，而是使用均值与方差的滑动平均值进行标准化。

3）如1）和2)所描述的，当在训练过程中设置training=False时，批标准化算法会以均值与方差的滑动平均值进行数据标准化，而这两个数值又因为training=False时不存在滑动平均的更新节点而不会被更新。所以，最终导致，如果在训练过程中设置training=False，批标准化算法不会执行数据标准化操作。

4）但是，无论training=True或False,批标准化层都会产生两个可训练的变量：平移变量beta和放缩变量gamma.这两个变量会在可训练参数的更新过程中被实时更新。

5）综上，如果在训练过程中设置了training =False，最终会导致，批标准化层消除了批标准化操作，但是保留了数据的放缩与平移。

总结：批标准化算法会带来4个变量：moving-mean，moving_variance, gamma(放缩变量)，beta(平移变量)。在训练过程中设置training = False, 会导致moving_mean，moving_variance永远维持初始值，即 moving_mean=0，moving_variance=1。而gamma与beta是可训练变量，这两个变量仍旧会随着模型的训练过程被优化/改变。所以，在训练过程中设置training = False，会导致数据不会被执行标准化，但是仍旧会执行放缩与平移。所以说，也不能说这种情况下算法完全没有使用BN。我觉得，在实践中，这种方式也可以作为一种尝试。这种操作可能对内部协变量漂移的问题没有解决作用，但是毕竟增加了两个变量，可能仍旧会对改善模型有帮助。所以：在训练与测试的过程中都设置training=False，也可能有利于模型的改善。

无论training=True 或者False, tf.keras.layers.BatchNormalization都会产生四个变量：

moving_mean ：参数的滑动均值，以上流程中的 $\mu _{B}$ , 为不可训练变量
moving_variance：参数的滑动方差，以上流程中的 $\sigma _{B}^{2}$ , 为不可训练变量
gamma ：放缩变量，初始化为1 ，是可训练变量
beta ：平移变量，初始化为0 ，是可训练变量

其中 gamma与beta是可训练的， moving_mean 与moving_variance是不可训练的，示例如下：

import tensorflow as tf
from keras import backend as K

# 设置keras的训练状态，模拟训练或测试状态
K.set_learning_phase(0) # 1 代表训练状态， 0 代表测试状态
is_training = K.learning_phase()
print ("is_training =",K.learning_phase())

input = tf.ones([1, 2, 2, 3])
output = tf.keras.layers.BatchNormalization()(input,training=None)

# 手动添加方法
ops = tf.get_default_graph().get_operations()
bn_update_ops = [x for x in ops if ("AssignMovingAvg" in x.name and x.type=="AssignSubVariableOp")]
tf.add_to_collection(tf.GraphKeys.UPDATE_OPS,bn_update_ops)

update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)
gl_var_list = tf.global_variables()
tr_var_list = tf.trainable_variables()
print("update_ops=",update_ops)
print("gl_var_list=",gl_var_list)
print("tr_var_list=",tr_var_list)
"""
# 在测试状态下
is_training = 0
update_ops= [[]]
gl_var_list= [
    , 
    ,
     , 
    ]
tr_var_list= [
    , 
    ]


# 在训练状态下
is_training = 1
update_ops= [[
    ,
     
]]
gl_var_list= [
    , 
    ,
     , 
    ]
tr_var_list= [
    ,
     
]

"""

在使用批标准化时，要保存所有变量，而不仅仅是可训练变量

因为在测试过程中，要用到

moving_mean ：不可训练变量
moving_variance：不可训练变量

这两个不可训练的变量，所以在保存模型时要保存tf.global_variables() 而不是 tf.trainable_variables().

否则，可能会存在模型加载错误，或者，更严重的，可能会导致moving_mean与moving_variance又被初始化为0和1被使用，这与我们训练时得到的参数不同，会导致测试结果远差于训练效果。

具体会发生那种情况，我还没测试过，但很明显，我们不能让这种情况发生。

应用分析

由以上分析，不论 training=True 或 training=False, tf.keras.layers.BatchNormalization都会产生四个变量：

gamma
beta
moving_mean
moving_variance

[, 
, 
, 
]

不同的是， training=False没有产生计算滑动平均的两个计算节点：

[, 
]

这两个节点一个用于计算mean的滑动平均，一个用于计算var的滑动平均。

滑动平均的计算公式：

假设是个mini-batch数据的均值，代表迭代次数，则第次迭代时的滑动均值为

${m^{'}_t} = \beta* {m^{'}_{t-1}} + (1-\beta)m_t$ ,

对应的，假设是个mini-batch数据的var，代表第次迭代时输入的mini-batch数据的var，则第次迭代时var的滑动均值 $var^{'}_{t}$ 为:

$var^{'}_{t} = \beta*var^{'}_{t-1} + (1-\beta)*var_{t}$

滑动平均计算节点在批标准化中的作用

训练过程中，通常用mean与var的滑动平均值去标准化当前minibatch的数据，当training=False或未执行滑动平均的更新操作时，批标准化操作是以 mean 与var的滑动平均值的初始化值进行标准化，在整个过程中，mean的滑动均值与var的滑动均值不会被改变。

在训练过程中， mean 与var的滑动平均值的分别被初始化为0和1，由参数设置决定，如果training=False则永不更新。根据批标准化公式，相当于未执行批标准化。
在测试过程中，mean 与var的滑动平均值的分别被初始化为模型保存的对应变量值，如果training=False则永不更新。
如果在训练过程中，training被设置为False， mean 与var的滑动平均值的分别被初始化为0和1，且永不更新，最终保存到模型里的值也是0和1，在测试时仍会以0和1被加载。

所以，正确设置training的值很重要。或者，更本质一些，在恰当的时候执行 mean与var的滑动平均值的更新，对批标准化操作很重要。

滑动平均的计算时机与注意事项：添加依赖控制

在每一次minibatch数据输入之前，即，在每一次迭代训练之前更新mean与var的滑动平均值，要用tf.control_dependencies添加依赖控制，具体如下：


import tensorflow as tf
 
input = tf.ones([1, 2, 2, 3])
output = tf.keras.layers.BatchNormalization()(input,training=None)

# 手动添加滑动平均更新节点到tf.GraphKeys.UPDATE_OPS,bn_update_ops中
ops = tf.get_default_graph().get_operations()
bn_update_ops = [x for x in ops if ("AssignMovingAvg" in x.name and x.type=="AssignSubVariableOp")]
tf.add_to_collection(tf.GraphKeys.UPDATE_OPS,bn_update_ops)

# 在训练中添加对滑动平均更新节点的依赖控制
update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)
with tf.control_dependencies(update_ops):
	train_op = optimizer.minimize(loss)
 
# 执行训练
with tf.Session() as sess:
 	sess.run(tf.global_variables_initializer())
        # 保存模型时要保存所有变量，因为批标准化操作产生的变量是不可训练的。
 	saver = tf.train.Saver(var_list=tf.global_variables())
 	saver.save(sess, "batch_norm_layer/Model")

什么时候进行update_ops?

如上面介绍，批标准化操作会带来两个更新节点：一个用于计算moving_mean的滑动平滑计算节点，一个用于计算moving_variance的滑动平滑计算节点。这两个节点在优化过程中不会被主动调用。如何执行这两个节点呢？以及什么时候运行这两个节点呢？上面提到了用控制依赖法，用with tf.control_dependencies(update_ops): train_op = optimizer.minimize(loss)，使update_ops节点运行与变量优化同步运行，或者严格意义上是先于参数更新运行。

个人理解：在BN的流程图中，什么时候执行滑动平均计算操作？按照定义是在一次迭代完成之后。

在训练过程中，滑动平均并不参与任何模型参数与批标准化过程，滑动平均的计算仅仅是为了在测试阶段使用。所以严格来说，滑动平均值，只需要在当次小批量的BN的均值与方差计算完之后就可以计算。或者在下一次迭代开始之前就可以。在以上的例子中是与参数优化一起执行的，这肯定是在计算完梯度之后了，即前向计算完成之后了。所以肯定可以。

我自己有一个想法：是不是可以在sess.run()完批量数据的优化之后用sess.run()去运行滑动平均节点？事实证明，这样也能改变这四个变量：moving_mean.moving_variance,gamma,beta 也会改变，但是好像效果不如用控制依赖好，不知道为什么？

左图是用sess.run()更新，右图是用控制依赖更新。右图看着下降更平滑一些，而且下降的也更快一些。不知道为什么？

还有个实验，在训练时设置training=False好像也收敛的更快。个人猜测是：我用的relu激活函数，在批标准化时仅仅使用平移与放缩也能达到批标准化的效果，而不用非得执行标准化。

如果没有添加依赖控制会怎样？

我在一次实验中用了批标准化层，但是没有在训练时添加依赖控制，即没有执行mean与var的滑动平均更新，训练得到的模型中，BN层的变量数值如下：

 1.0191431
 0.01283348
 0.0
 1.0


 1.0
 0.0
 0.0
 1.0


 1.0107784
 -0.0097986935
 0.0
 1.0


 1.074267
 0.005866247
 0.0
 1.0


 1.065175
 -0.017884836
 0.0
 1.0

可见，与上面分析的一致，mean与var的滑动平均值保持了其初始化数值，没有进行更新，而beta与gamma两个变量的值有所改变，因为这两个变量是可训练的变量，所以在执行trainable_variable优化时会被更新。这可能危害不是特别大，根据批标准化的流程公式，这相当于没有执行BN，或只进行了放缩与平移。安慰下自己，至少测试时用的BN参数与训练时相同。没有带来特别负面的影响。

模型中变量值的查看代码如下：

import tensorflow as tf

model_path = "/media/***/model.ckpt-18000"

tf.reset_default_graph() # 清空图，防止图上存在干扰节点
with tf.Session(graph=tf.get_default_graph()) as sess:
	saver = tf.train.import_meta_graph(model_path+".meta")# 从model.meta文件中加载保存的图结构
	saver.restore(sess, model_path)# 从model中加载保存的变量数据
	
	var_list = tf.global_variables() # 获取图上的所有变量
	bn_var_list = [v for v in var_list if "batch_normalization" in v.name ] # 筛选与BatchNormalization相关的变量
	for v in bn_var_list:
		print(v,sess.run(v)[1]) # 打印变量名与对应数值，为了便于观察，打印变量张量的第一个数值

批标准化过程

算法1：训练过程的批标准化：用当前minibatch的均值与方差对当前minibatch的数据进行标准化，然后进行平移与缩放。

有两个需要学习的参数：缩放因子 $\gamma$ 和平移因子 $\beta$ 。这两个变量应该是随着训练进行更新的。

算法2：训练与测试过程的批标准化。

其中K表示K个标准化层。

步骤6表示：具有批标准化算法的神经网络的可训练变量，除了已有的可训练变量外，每个批标准化层都会带来额外的两个可训练变量 $\gamma$ 和 $\beta$ 所以用了一个并集的方式表示网络的所有可训练参数。

步骤10中：与可理解为训练过程中训练样本的moving_mean和moving_var.

步骤11表示：用训练集的moving_mean和moving_var对测试集样本进行批标准化，然后用训练集训练得到的放缩变量gamma和平移变量beta进行放缩和平移变换。

其他几个注意点：

1. batch-size要尽可能大，这样训练过程中计算得到的均值与方差才会尽可能稳定。

2. 由于训练时批标准化使用的均值与方差是当前batch的信息，测试时使用的是所有训练batch的滑动平均。所以二者会存在差异。可能会导致测试时的结果与训练时的结果不同。为了解决这一个问题，我们可以使momentum参数的值尽量小一些，这样计算得到的滑动平均对历史的记忆比较少，最后得到的滑动平均也与训练时用于批标准化的信息更接近。momentum=0时就使滑动平均完全保留当前的信息，完全抛弃历史信息了。

self.moving_mean = momentum * self.moving_mean + (1-momentum) * mean

参考：TensorFlow使用之tf.layers.batch_normalization函数详解

对tensorflow 的BatchNormalization的坑的理解与测试

对 BatchNormalization 中 Internal Convariate Shift 的理解

你可能感兴趣的:(批标准化 tf.keras.layers.BatchNormalization 参数解析与应用分析)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
2021-08-26 影幽
在生活中，女人与男人的感悟往往有所不同。人生最大的舞台就是生活，大幕随时都可能拉开，关键是你愿不愿意表演都无法躲避。在生活中，遇事不要急躁，不要急于下结论，尤其生气时不要做决断，要学会换位思考，大事化小小事化了，把复杂的事情尽量简单处理，千万不要把简单的事情复杂化。永远不要扭曲，别人善意，无药可救。昨天是张过期的支票，明天是张信用卡，只有今天才是现金，要善加利用！执着的攀登者不必去与别人比较自己的
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
每日一题——第九十题互联网打工人no1 C语言程序设计每日一练 c语言
题目：判断子串是否与主串匹配#include#include#include//////判断子串是否在主串中匹配//////主串///子串///boolisSubstring(constchar*str,constchar*substr){intlenstr=strlen(str);//计算主串的长度intlenSub=strlen(substr);//计算子串的长度//遍历主字符串，对每个可能得
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
《庄子.达生9》钱江潮369
【原文】孔子观于吕梁，县水三十仞，流沫四十里，鼋鼍鱼鳖之所不能游也。见一丈夫游之，以为有苦而欲死也，使弟子并流而拯之。数百步而出，被发行歌而游于塘下。孔子从而问焉，曰：“吾以子为鬼，察子则人也。请问，‘蹈水有道乎’”曰：“亡，吾无道。吾始乎故，长乎性，成乎命。与齐俱入，与汩偕出，从水之道而不为私焉。此吾所以蹈之也。”孔子曰：“何谓始乎故，长乎性，成乎命？”曰：“吾生于陵而安于陵，故也；长于水而安于
水泥质量纠纷案代理词徐宝峰律师
贵州领航建设有限公司诉贵州纳雍隆庆乌江水泥有限公司产品质量纠纷案代理词尊敬的审判长、审判员：贵州千里律师事务所接受被告贵州纳雍隆庆乌江水泥有限公司的委托，指派我担任其诉讼代理人，参加本案的诉讼活动。下面，我结合本案事实和相关法律规定发表如下代理意见，供合议庭评议案件时参考：原告应当举证证明其遭受的损失与被告生产的水泥质量的因果关系。首先水泥是一种粉状水硬性无机胶凝材料。加水搅拌后成浆体，能在空气中
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo