MLTalks

Pytorch LayerNorm源码详解

1. LayerNorm使用介绍

pytorch中的函数定义如下：

torch.nn.LayerNorm(normalized_shape, eps=1e-05, elementwise_affine=True, device=None, dtype=None)

函数参数说明如如下：

normalized_shape: 进行LayerNorm的维度定义，对于一个多维矩阵[N, C, H, W]来说，这里的normalized_shape定义都是要和矩阵最后几个维度保持一致的，这里就是[C, H, W]。对比数学公式，其中的 $\gamma$ 和 $\beta$ 的维度都是[C, H, W]， $x$ 和 $y$ 的维度都是[N, C, H, W]。
eps：为了防止计算公式中的分母为0，加上一个极小的数，默认值: 1e-5
elementwise_affine：设为True的时候，进行elementwise的仿射变换, $\gamma$ 和 $\beta$ 才会生效，在训练过程中做为参数会被学习更新，为False的话不生效。 $\gamma$ 所有元素初始为1， $\beta$ 所有元素初始为0的。 $\gamma$ 在代码实现中对应 $g amma$ , $\beta$ 在代码实现中对应 $b e t a$ 。

LayerNorm的数学公式定义如下：

$\begin{align*} Y &= \frac{X - E[X]}{\sqrt{Var[X] + \epsilon}} * \gamma + \beta \end{align*}$

pytorch使用示例，给定一个[N, C, H, W]的矩阵，在[C, H, W]维上进行LayerNorm操作：

>>> # Image Example
>>> N, C, H, W = 20, 5, 10, 10
>>> input = torch.randn(N, C, H, W)
>>> # Normalize over the last three dimensions (i.e. the channel and spatial dimensions)
>>> # as shown in the image below
>>> layer_norm = nn.LayerNorm([C, H, W])
>>> output = layer_norm(input)

2. LayerNorm反向推导公式

为了方便推导，eps先忽略，输入为一维矩阵。对应LayerNorm的数学公式定义如下, 其中 $x$ 是由 $x_1, ...,x_i, ..., x_N]$ 组成的一维向量, $y$ 是输出向量，维度跟 $x$ 一样; $E [x]$ 是期望，简写为 $\mu$ ; $Va r [x]$ 是方差【 $\frac{1}{N} \sum^N_{i=1}{(x_i-\mu)^2}$ 】; 标准差【 $\sqrt{Var[x]}$ 】简写为 $\sigma$ 。

$\begin{align*} y &= \frac{x - E[x]}{\sqrt{Var[x]}} * \gamma + \beta \\ &= \frac{x - \mu}{\sigma} * \gamma + \beta \\ &= \hat{x} * \gamma + \beta \\ \\ \mu &= \frac{1}{N}\sum^N_{j=1}{x_j} \\ \\ \sigma &= \left( \frac{1}{N} \sum^N_{j=1}{(x_j-\mu)^2} \right)^{\frac{1}{2}} \\ \\ \hat{x} &= \frac{x-\mu}{\sigma} \\ \\ \end{align*}$

这里有三个地方需要求梯度(即需要进行求导)，分别是对参数gamma $(\gamma)$ 和beta $(\beta)$ , 以及输入x的求导, 即 $\frac{\partial{l}}{\partial{\gamma}}$ 、 $\frac{\partial{l}}{\partial{\beta}}$ 、 $\frac{\partial{l}}{\partial{x}}$ 。同时在计算 $\frac{\partial{l}}{\partial{x}}$ 时会用到 $\frac{\partial{\mu}}{\partial{x}}$ ， $\frac{\partial{\sigma}}{\partial{x}}$ ， $\frac{\partial{\hat{x}}}{\partial{x}}$ 。

$\begin{align*} \frac{\partial{l}}{\partial{\gamma_i}} &= \frac{\partial{l}}{\partial{y_i}} * \frac{\partial{y_i}}{\partial{\gamma_i}} \\ &= \frac{\partial{l}}{\partial{y_i}} * \frac{x_i - \mu}{\sigma} \\ \\ \frac{\partial{l}}{\partial{\beta_i}} &= \frac{\partial{l}}{\partial{y_i}} * \frac{\partial{y_i}}{\partial{\beta_i}} \\ &= \frac{\partial{l}}{\partial{y_i}} * 1 \\ \\ \frac{\partial{\mu}}{\partial{x_i}} &= \frac{1}{N} \\ \\ \\ \frac{\partial{\sigma}}{\partial{x_i}} &= \frac{1}{2} * \left( \frac{1}{N} \sum^N_{j=1}{(x_j-\mu)^2} \right)^{-\frac{1}{2}} * \frac{\partial{}}{\partial{x_i}} \left( \frac{1}{N} \sum^N_{j=1}{(x_j-\mu)^2} \right) \\ &= \frac{1}{2} * \sigma^{-1} * \frac{\partial{}}{\partial{x_i}} \left( \frac{1}{N} \sum^N_{j=1}{(x_j-\mu)^2} \right) \\ &= \frac{1}{2} * \sigma^{-1} * \frac{1}{N} * 2 * (x_i - \mu) \\ &= \sigma^{-1} * \frac{1}{N} * (x_i - \mu) \\ \\ \frac{\partial{\hat{x}}}{\partial{x_i}} &= \frac{\partial{(x_j - \mu)}}{\partial{x_i}} * \sigma^{-1} + (x_j - \mu) * (-1) * \sigma^{-2} * \frac{\partial{\sigma}}{\partial{x_i}} \\ &= \sigma^{-1} * (\delta_{ij} - \frac{\partial{\mu}}{\partial{x_i}}) + \sigma^{-2} * (x_j - \mu) * (-1) * \frac{\partial{\sigma}}{\partial{x_i}} \\ &= \sigma^{-1} * \delta_{ij} + \sigma^{-1} * (- \frac{1}{N}) + \sigma^{-2} * (x_j - \mu) * (-1) * \frac{\partial{\sigma}}{\partial{x_i}} \\ &= \sigma^{-1} * \delta_{ij} + \sigma^{-1} * (- \frac{1}{N}) + \sigma^{-3} * \frac{1}{N} * (x_j - \mu) * (x_i - \mu) * (-1) \\ &[当i和j相等时，\delta_{ij}=1，否则\delta_{ij}=0] \\ \\ \frac{\partial{l}}{\partial{x_i}} &= \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \frac{\partial{y_j}}{\partial{x_i}} \\ &= \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \frac{\partial{y_j}}{\partial{\hat{x_j}}} * \frac{\partial{\hat{x_j}}}{\partial{x_i}} \\ &= \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * \left[ \sigma^{-1} * \delta_{ij} + \sigma^{-1} * (- \frac{1}{N}) + \sigma^{-3} * \frac{1}{N} * (x_j - \mu) * (x_i - \mu) * (-1) \right] \\ \end{align*}$

这里 $\gamma_i/\beta_i$ 与 $x_i$ 是一一对应的, 所以不用累加；但对于 $x_i$ 参与了所有 $y$ 的计算，反向的时候计算梯度也需要对涉及的所有的 $y_i$ 相关的梯度进行累加。

3. 源码实现

代码仓版本：https://github.com/pytorch/pytorch/tree/v2.0.1

3.1 前向计算

在aten/src/ATen/native/native_functions.yaml中的定义如下：

- func: native_layer_norm(Tensor input, SymInt[] normalized_shape, Tensor? weight, Tensor? bias, float eps) -> (Tensor, Tensor, Tensor)
  dispatch:
    CPU: layer_norm_cpu
    CUDA: layer_norm_cuda
    MPS: layer_norm_mps
    CompositeExplicitAutograd: math_native_layer_norm
    NestedTensorCPU, NestedTensorCUDA: nested_layer_norm
  autogen: native_layer_norm.out
  tags: core

这里以layer_norm_cpu的实现为例，layer_norm_cpu定义在aten/src/ATen/native/layer_norm.cpp中。

在layer_norm_cpu的前向函数中，会根据input和normalized_shape进行shape的转换计算，从多维矩阵转为 $\times N$ 的二维矩阵，比如input的shape是[2, 3, 4, 5]，normalized_shape是[4, 5], 那么M=2*3=6, N=4*5=20；同时还会进行weight(对应 $g amma$ )和bias(对应 $b e t a$ )矩阵的初始化。

std::tuple<Tensor, Tensor, Tensor> layer_norm_cpu(
    const Tensor& input,
    IntArrayRef normalized_shape, const c10::optional<Tensor>& weight_opt /* optional */, const c10::optional<Tensor>& bias_opt /* optional */,
    double eps) {
  // weight和bias初始化
  c10::MaybeOwned<Tensor> weight_maybe_owned = at::borrow_from_optional_tensor(weight_opt);
  const Tensor& weight = *weight_maybe_owned;
  c10::MaybeOwned<Tensor> bias_maybe_owned = at::borrow_from_optional_tensor(bias_opt);
  const Tensor& bias = *bias_maybe_owned;

  // 计算M和N
  auto M_N = _check_layer_norm_inputs(input, normalized_shape, weight, bias);
  auto M = M_N.first;
  auto N = M_N.second;
  auto X = input.expect_contiguous();
  auto gamma = weight.expect_contiguous();
  auto beta = bias.expect_contiguous();

  // 初始化mean/rstd，维度是M个，每N个input的元素会计算一个mean和rstd
  Tensor mean = at::empty({M}, X->options().dtype(dtype));
  Tensor rstd = at::empty({M}, X->options().dtype(dtype));
  
  // layer_norm_with_mean_rstd_out中会调用前向kernel(LayerNormKernel)
  layer_norm_with_mean_rstd_out(Y, mean, rstd, *X, normalized_shape, *gamma, *beta, eps, M, N);
  return std::make_tuple(std::move(Y), std::move(mean), std::move(rstd));
}

LayerNormKernel定义在aten/src/ATen/native/cpu/layer_norm_kernel.cpp中，实际的实现是LayerNormKernelImplInternal, 定义如下：

template <typename T, typename T_ACC>
void LayerNormKernelImplInternal(
    const Tensor& X,
    const Tensor& gamma,
    const Tensor& beta,
    int64_t M,
    int64_t N,
    T_ACC eps,
    Tensor* Y,
    Tensor* mean,
    Tensor* rstd) {
    ...   
}

在LayerNormKernelImplInternal首先了解at::parallel_for函数的使用，它的基本作用是对输入先进行分块，然后通过多线程进行并行处理，如下函数的定义是对[0, M]分成多段，分别调用匿名函数。

  at::parallel_for(0, M, 1, [&](int64_t start, int64_t end) {...})

回顾下前向计算过程：

$\begin{align*} y &= \frac{x - E[x]}{\sqrt{Var[x]+eps}} * \gamma + \beta \\ &= \frac{x - \mu}{\sigma} * \gamma + \beta \\ &= (\frac{x}{\sigma} + \frac{- \mu}{\sigma}) * \gamma + \beta \\ \end{align*}$

匿名函数逻辑中，对于 M * N的矩阵，每次处理N个元素进行LayerNorm操作。mean对应 $\mu$ , rstd_val和scale对应 $\frac{1}{\sigma}$ , bias对应 $\frac{-\mu}{\sigma}$ , 因此, $y = (x * sc a l e + bia s) * g amma + b e t a$

    for (const auto i : c10::irange(start, end)) {
      const T* X_ptr = X_data + i * N;
      T* Y_ptr = Y_data + i * N;
      T mean_val;
      T rstd_val;
      // 1. 计算mean_val和rstd_val
      std::tie(mean_val, rstd_val) = RowwiseMoments(X_ptr, N);
      rstd_val = T(1) / std::sqrt(rstd_val + eps);
      
      const T scale = rstd_val;
      const T bias = -rstd_val * mean_val;
      if (gamma_null || beta_null) {
        for (const auto j : c10::irange(N)) {
          const T gamma_v = gamma_null ? T(1) : gamma_data[j];
          const T beta_v = beta_null ? T(0) : beta_data[j];
          Y_ptr[j] = (X_ptr[j] * scale + bias) * gamma_v + beta_v;
        }
      } else {
        // 2. 计算layer norm的前向公式
        vec::map3<T>(
            [scale, bias](Vec x, Vec gamma, Vec beta) {
              return (x * Vec(scale) + Vec(bias)) * gamma + beta;
            },
            Y_ptr,
            X_ptr,
            gamma_data,
            beta_data,
            N);
      }
      if (!mean_null) {
        mean_data[i] = mean_val;
      }
      if (!rstd_null) {
        rstd_data[i] = rstd_val;
      }
    }
  }

3.2 反向计算

对于多维矩阵求反向，可以看成是M个大小为N的向量，以一个5维向量为例，向量维度为 $M_1, M_2, C, H, W]$ ，layer_norm的维度是 $[C, H, W]$ ，对应的 $M=M_1*M_2$ , $N = C * H * W$

在aten/src/ATen/native/native_functions.yaml中的定义如下：

- func: native_layer_norm_backward(Tensor grad_out, Tensor input, SymInt[] normalized_shape, Tensor mean, Tensor rstd, Tensor? weight, Tensor? bias, bool[3] output_mask) -> (Tensor, Tensor, Tensor)
  dispatch:
    CPU: layer_norm_backward_cpu
    CUDA: layer_norm_backward_cuda
    MPS: layer_norm_backward_mps
  autogen: native_layer_norm_backward.out
  tags: core

这里以layer_norm_backward_cpu的实现为例，layer_norm_backward_cpu定义在aten/src/ATen/native/layer_norm.cpp中。跟layer_norm_cpu类似，在backward中初始化相关tensor，和进行kernel的调用。

std::tuple layer_norm_backward_cpu(
    const Tensor& dY,
    const Tensor& input,
    IntArrayRef normalized_shape,
    const Tensor& mean,
    const Tensor& rstd,
    const c10::optional& weight_opt /* optional */,
    const c10::optional& bias_opt /* optional */,
    std::array grad_input_mask) {
  ......
  if (M > 0) {
    LayerNormBackwardKernel(
        kCPU, dY, *X, mean, rstd, *gamma, M, N, &dX, &dgamma, &dbeta);
  }
  return std::make_tuple(std::move(dX), std::move(dgamma), std::move(dbeta));   
}

为了方便和后续pytorch源码实现中对应，对上面推导公式的最后结果中做下相应的展开，展开如下：
$\begin{align*} \frac{\partial{l}}{\partial{x_i}} &= \sigma^{-1} * \frac{\partial{l}}{\partial{y_i}} * \gamma_i + (-1) * \sigma^{-1} * \frac{1}{N} * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j + \sigma^{-3} * \frac{1}{N} * (\mu - x_i) * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * (x_j - \mu) \\ &= \sigma^{-1} * \frac{\partial{l}}{\partial{y_i}} * \gamma_i + (-1) * \sigma^{-1} * \frac{1}{N} * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j + \sigma^{-3} * \frac{1}{N} * \mu * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * (x_j - \mu) + \sigma^{-3} * \frac{1}{N} * (- x_i) * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * (x_j - \mu) \\ &= \sigma^{-1} * \frac{\partial{l}}{\partial{y_i}} * \gamma_i + (-1) * \sigma^{-1} * \frac{1}{N} * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j + \sigma^{-3} * \frac{1}{N} * (-\mu) * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * (\mu - x_j) + \sigma^{-3} * \frac{1}{N} * (x_i) * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * (\mu - x_j) \\ &= \sigma^{-1} * \frac{\partial{l}}{\partial{y_i}} * \gamma_i + (-1) * \sigma^{-1} * \frac{1}{N} * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j + \sigma^{-3} * \frac{1}{N} * (-\mu) * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * (\mu - x_j) + \sigma^{-3} * \frac{1}{N} * x_i * \left[ \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * \mu - \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * x_j \right] \\ &= \gamma_i * \frac{\partial{l}}{\partial{y_i}} * \sigma^{-1} + \left[ -\sigma^{-3} * \frac{1}{N} * \mu * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * (\mu - x_j) - \sigma^{-1} * \frac{1}{N} * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j \right] + x_i * \left[ \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * \mu - \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * x_j \right] * \sigma^{-3} * \frac{1}{N} \\ \end{align*}$

kernel的实现在是aten/src/ATen/native/cpu/layer_norm_kernel.cpp文件的LayerNormBackwardKernelImplInternal函数中，实现分为两个阶段：

初始化一个shape大小为{2, max_threads, N}的buffer矩阵，对应其中的buffer[0]用于dgamma_buffer, buffer[1]用于dbeta_buffer。多线程分别计算dY和X。
对dgamma/dbeta的值进行累加操作，复用X[i]和dY[i]

对于代码实现是通过两层嵌套进行的，对于第一步来说，最外面是对 $M * N$ 的矩阵按行进行多线程并行，每个线程处理 $m_i*N$ 个元素；第二步是按N列进行元素的累加。layer_norm_backward_frame函数中包含了主要的计算逻辑, 后面进一步分析。

template <typename T>
void LayerNormBackwardKernelImplInternal(
    const Tensor& dY,
    const Tensor& X,
    const Tensor& mean,
    const Tensor& rstd,
    const Tensor& gamma,
    int64_t M,
    int64_t N,
    Tensor* dX,
    Tensor* dgamma,
    Tensor* dbeta) {
  ......
  // 第一步：计算dgamma/dbeta and dX
  at::parallel_for(0, M, 1, [&](int64_t start, int64_t end) {
    int tid = at::get_thread_num();
    TORCH_CHECK(
        tid < num_threads,
        "expect thread id smaller than ",
        num_threads,
        ", got thread id ",
        tid);
    T* dgamma_buffer_ptr = dgamma_null ? nullptr : buffer_data + tid * N;
    T* dbeta_buffer_ptr =
        dbeta_null ? nullptr : buffer_data + num_threads * N + tid * N;
    for (const auto i : c10::irange(start, end)) {
      layer_norm_backward_frame<T, T2, T_ACC>(dY_data, X_data, mean_data, rstd_data, gamma_data, dX_data, dgamma_buffer_ptr, dbeta_buffer_ptr, scale, gamma_null, dX_null, dgamma_null, dbeta_null, N, i);
    }
  });

  // 第二步：计算dgamma/dbeta的累加
  if (buffer_data != nullptr) {
    parallel_for(0, N, 1, [&](int64_t start, int64_t end) {
      for (const auto j : c10::irange(start, end)) {
        T_ACC dgamma_v = T_ACC(0);
        T_ACC dbeta_v = T_ACC(0);
        for (const auto i : c10::irange(num_threads)) {
          dgamma_v += buffer_data[i * N + j];
          dbeta_v += buffer_data[num_threads * N + i * N + j];
        }
        if (!dgamma_null) {
          // NOLINTNEXTLINE(clang-analyzer-core.NullDereference)
          dgamma_data[j] = dgamma_v;
        }
        if (!dbeta_null) {
          // NOLINTNEXTLINE(clang-analyzer-core.NullDereference)
          dbeta_data[j] = dbeta_v;
        }
      }
    });
  }
  ......
}

layer_norm_backward_frame函数中计算dgamma的逻辑如下，对应公式： $\frac{\partial{l}}{\partial{\gamma_i}} = \frac{\partial{l}}{\partial{y_i}} * \frac{x_i - \mu}{\sigma}$ , 其中 $a=\frac{1}{\sigma}$ , $b=\frac{-\mu}{\sigma}=-a*\mu$ 。

  if (!dgamma_null) {
    const T_ACC a = rstd_data[i];
    const T_ACC b = -a * mean_data[i];
    // Scalar math:
    // for (const auto j : c10::irange(N)) {
    //   dgamma_data[j] += dY_ptr[j] * (a * X_ptr[j] + b);
    // }
    vec::map3<T>(
        [a, b](Vec dgamma, Vec dy, Vec x) {
          return dgamma + dy * (Vec(a) * x + Vec(b));
        },
        dgamma_buffer_ptr,
        dgamma_buffer_ptr,
        dY_ptr,
        X_ptr,
        N);
  }

layer_norm_backward_frame函数中计算dbeta的逻辑如下，对应公式： $\frac{\partial{l}}{\partial{\beta_i}}= \frac{\partial{l}}{\partial{y_i}}$ 。

  if (!dbeta_null) {
    // Scalar math:
    // for (const auto j : c10::irange(N)) {
    //   dbeta_data[j] += dY_ptr[j];
    // }
    vec::map2<T>(
        [](Vec dbeta, Vec dy) { return dbeta + dy; },
        dbeta_buffer_ptr,
        dbeta_buffer_ptr,
        dY_ptr,
        N);
  }

layer_norm_backward_frame函数中计算dx的逻辑如下，对应公式:

$\begin{align*} \frac{\partial{l}}{\partial{x_i}} &= \gamma_i * \frac{\partial{l}}{\partial{y_i}} * \sigma^{-1} + \left[ -\sigma^{-3} * \frac{1}{N} * \mu * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * (\mu - x_j) - \sigma^{-1} * \frac{1}{N} * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j \right] + x_i * \left[ \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * \mu - \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * x_j \right] * \sigma^{-3} * \frac{1}{N} \\ \end{align*}$

layer_norm_backward_frame函数核心代码实现如下：

    if (gamma_null) {
      ......
    } else {
      ds = vec::map3_reduce_all<T>(
          [](Vec x, Vec y, Vec z) { return x * y * z; },
          [](Vec x, Vec y) { return x + y; },
          dY_ptr,
          X_ptr,
          gamma_data,
          N);
      db = vec::map2_reduce_all<T>(
          [](Vec x, Vec y) { return x * y; },
          [](Vec x, Vec y) { return x + y; },
          dY_ptr,
          gamma_data,
          N);
    }
    const T_ACC a = rstd_data[i];
    const T_ACC b = (db * mean_data[i] - ds) * a * a * a * scale;
    const T_ACC c = -b * mean_data[i] - db * a * scale;
    if (gamma_null) {
      ......
    } else {
      vec::map3<T>(
          [a, b, c](Vec dy, Vec gamma, Vec x) {
            return Vec(a) * dy * gamma + Vec(b) * x + Vec(c);
          },
          dX_ptr,
          dY_ptr,
          gamma_data,
          X_ptr,
          N);
    }
  }

代码中变量与公式对应关系如下：

ds对应 $\sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * x_j$
db对应 $\sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j$
a对应 $\sigma^{-1}$
scale对应 $\frac{1}{N}$
b对应 $\left[ \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * \mu - \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * x_j \right] * \sigma^{-3} * \frac{1}{N} = (db * \mu - ds) * a * a * a * scale$
c对应 $\left[ -\sigma^{-3} * \frac{1}{N} * \mu * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j * (\mu - x_j) - \sigma^{-1} * \frac{1}{N} * \sum_{j=1}^N \frac{\partial{l}}{\partial{y_j}} * \gamma_j \right]=-b * \mu - db * a * scale$
最终结果：dx = Vec(a) * dy * gamma + Vec(b) * x + Vec(c)

4. 参考资料

Vector, Matrix, and Tensor Derivatives
手推公式之“层归一化”梯度
矩阵求导浅析（一）
矩阵求导术（上）
矩阵求导术（下）
道理我都懂，但是神经网络反向传播时的梯度到底怎么求？
神经网络反向传播的数学原理
layernorm 反向传播推导及代码
pytorch-LAYERNORM
Layer Normalization-paper

你可能感兴趣的:(训练框架,pytorch,人工智能,python,深度学习,机器学习)

Python定义类的属性大数据张老师 python 开发语言
Python定义类的属性在Python的面向对象编程中，类的属性是用来描述类和对象的特征和数据的。类的属性可以分为两种：类属性和实例属性。本节将专注于如何定义类的属性，并讲解类属性和实例属性的区别与用法。什么是类的属性类的属性是用来存储数据的变量，它们可以在类的定义中直接声明。属性的主要作用是让类或对象能够存储数据，从而为行为（方法）提供数据支持。在类的内部，属性的定义和操作可以使用与普通变量类似
用python实战excel和word自动化重剑无锋1024 python excel word
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档python实现excel和word自动化--批量处理前言--需求快要期末了需要，提交一个年级的学生成绩数据，也就是几百份。当前我们收集了一份excel表格，它里面有学生的班级、姓名、成绩等信息。问题1：每个学生一个docx要有不同的文件名，要把文件名为班级+姓名（图片未改）问题2：每个docx文件中需要填写一些不一样的东西比如文件里
【python爬虫入门教程13--selenium的自动点击 --小小案例分享】重剑无锋1024 python 爬虫 selenium
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档《python爬虫入门教程12--selenium的安装与使用》selenium就是一个可以实现python自动化的模块，上次我们更新了如何安装以及它的语法。同时我也更新了如何用爬虫技术实现cookie免登录12306，再用selenium自动抢票。这个帖子主要是对selenium的一个语法讲解小案例，大家可以多运行试试。[免登录12
【《python爬虫入门教程12--重剑无峰168》】重剑无锋1024 python 爬虫开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档《python爬虫入门教程12--selenium的安装与使用》selenium就是一个可以实现python自动化的模块，上次我们更新了如何安装，这次我们来具体看看，它的语法，大家可以自己尝试一下，我的代码直接放在下面。前言一、selenium八种定位元素的方法1.完整示例代码二、总结。掌握这几种方法再在它们后面加入.click()或
PHP 与 AI 的强力组合，PHP 如何积极拥抱 AI 的 Ai 编码 Ai编码工具 idea插件 php教程 php 人工智能开发语言
PHP与AI的结合正在成为开发者探索的一个新领域。虽然PHP传统上并不是人工智能和机器学习应用的首选语言，但通过现代工具和技术的结合，PHP已经能够积极拥抱AI，推动创新和应用开发。点击：phpstorm里的JetBrainsAI有哪些好用的功能以下是几种方法和实践，通过它们PHP可以与AI强力结合。1.集成现有的AI服务和API对于很多开发者来说，最简单的方法是通过集成现有的AI服务和API。
用python解决潍坊期末概率填空题可以证明. python 开发语言
题目：一个点从数轴的原点开始运动，通过投掷骰子决定运动方向：若出现1，4面之一时，向负方向移动1个单位；若出现2，3，5，6面之一时，向正方向移动2个单位，（1）投掷1次骰子，该点位置的平均值为（）（2）投掷6次骰子后，概率大于的点的位置存在的最小区间为（）答案：1，[3,9]importrandom#投掷骰子的模拟defroll_dice():returnrandom.randint(1,6)#
【python】什么是对象 shanks66 python 开发语言
@[toc]python对象Object在Python中，对象（Object）是面向对象编程（OOP）的核心概念。对象是类的实例，类定义了对象的属性和行为。Python中的一切都是对象，包括数字、字符串、列表、函数等。对象的基本概念类（Class）：类是对象的蓝图或模板，定义了对象的属性和方法。通过类可以创建多个对象。对象（Object）：对象是类的实例，具有类定义的属性和方法。每个对象都有自己的
用Python写一个视频格式转换器 python狂徒 python 开发语言
一、怎样正确安装moviepy库笔者尝试用这两个命令行安装:“pipinstallmoviepy”、“pipinstall-ihttp://mirrors.aliyun.com/pypi/simple/moviepy”都不能成功。后来用这个命令行:“pipinstallmoviepy-ihttps://pypi.tuna.tsinghua.edu.cn/simple/”方能将此库安装完成。二、视频
【格式化输入输出】python基础啊吧啊吧， python 开发语言
1.在字符串开头的引导前加f或F，可以在{}中输入引用的变量age=20name='张三'a=f'Heis{name}{age}'print(a)2.想快速显示变量进行调试，可以用repr()或str()函数把值转化为字符串a='watchtv'print(str(a))print(repr(a))3.生成一组整齐的列，包含给定整数及其平方与立方
Vue环境变量配置指南：如何在开发、生产和测试中设置环境变量 Front_Yue 前端探索之路 vue.js 前端 javascript
-##前言Vue.js是一个流行的JavaScript框架，它提供了许多工具和功能来帮助开发人员构建高效、可维护的Web应用程序。其中一个重要的工具是环境变量，它可以让你在不同的环境中配置不同的参数和选项。在这篇博客中，我们将介绍如何在Vue应用程序中设置环境变量，以及如何在开发、生产和测试环境中使用它们。正文内容一、什么是环境变量环境变量是操作系统中的一组动态值，它们可以影响应用程序的行为。这些
华为OD机试2024年E卷-单词接龙[100分]（ Java | Python3 | C++ | C语言 | JsNode | Go）实现100%通过率梅花C 华为OD题库算法华为od java c++c语言 golang
点这里去解决这道题Go!题目描述单词接龙的规则是：可用于接龙的单词首字母必须要前一个单词的尾字母相同；当存在多个首字母相同的单词时，取长度最长的单词，如果长度也相等，则取字典序最小的单词；已经参与接龙的单词不能重复使用。现给定一组全部由小写字母组成单词数组，并指定其中的一个单词作为起始单词，进行单词接龙，请输出最长的单词串，单词串是单词拼接而成，中间没有空格。输入描述输入的第一行为一个非负整数，表
《AI赋能光追：开启图形渲染新时代》人工智能深度学习
光线追踪技术是图形渲染领域的重大突破，能够通过模拟光的传播路径，精准渲染反射、折射、阴影和间接光照等效果，实现高度逼真的场景呈现。而人工智能的加入，更是为光线追踪技术带来了前所未有的变革，主要体现在以下几个方面：降噪传统光线追踪为减少计算量，向场景发射少量光线样本，会产生带噪点的斑点图像，需人工设计降噪器通过多帧累积或空间插值来处理，但存在增加开发成本、降低帧率等问题。AI驱动的降噪技术则引入神经
MySQL数据库表的设计 weixin_34289744 数据库 python
2019独角兽企业重金招聘Python工程师标准>>>表的约束主键约束createtablestudent(idintprimarykey,namevarchar(40));createtablestudent(idintprimarykeyauto_increment,namevarchar(20));唯一约束createtablestudent(idintprimarykeyauto_incr
深度解析 React 中 setState 的原理：同步还是异步
在React框架的核心机制里，setState是实现动态交互与数据驱动视图更新的关键枢纽。深入理解setState的工作原理，尤其是其同步与异步的特性，对于编写高效、稳定且可预测的React应用至关重要。一、setState的基础认知在React组件中，状态（state）是驱动组件行为与渲染结果的核心数据。setState作为更新状态的唯一官方途径，负责触发组件的重新渲染，从而反映出状态的变化。以
python转换视频格式为mp4 宁君 Python python
1.第一种方法电脑下载安装ffmpeg方法见mac电脑安装ffmpeg两种方法然后代码如下frommoviepy.editorimportVideoFileClipimportosimportffmpegdefconvert_video_to_mp4(input_video_path,output_video_path):'''速度慢,CPU狂飙:paraminput_video_path::pa
华为OD机试E卷 --寻找符合要求的最长子串 --24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述给你一个字符串s，字符串s首尾相连成一个环形，请你在环中找出‘l’、‘o’、‘x’字符都恰好出现了偶数次最长子字符串的长度。输入描述输入是一串小写的字母组成的字符串输出描述输出是一个整数备注•1≤s.length≤5*10^5•s只包含小写英文字母用例输入alolobo输出6
华为OD机试E卷 --最大值--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述给定—组整数(非负)，重排顺序后输出一个最大的整数。示例1输入:[10,9]输出:910说明:输出结果可能非常大，所以你需要返回一个字符串而不是整数。输入描述数字组合输出描述最大的整数用例输入109输出910说明无题目解析给定一组非负整数，我们需要对这些整数进行重排，使得重新
华为OD机试C卷-- 字符串变换最小字符串（Java & JS & Python & C）飞码创造者华为OD机试题库华为od c语言 java javascript python
获取题库不需要订阅专栏，可直接私信我进入CSDN领军人物top1博主的华为OD交流圈观看完整题库、最新面试实况、考试报告等内容以及大佬一对一答疑。题目描述给定一个字符串s，最多只能进行一次变换，返回变换后能得到的最小字符串（按照字典序进行比较）。变换规则：交换字符串中任意两个不同位置的字符。输入描述一串小写字母组成的字符串s输出描述按照要求进行变换得到的最小字符串。备注s是都是小写字符组成1≤s.
VLM 系列——Qwen2 VL——论文解读——前瞻（源码解读） TigerZ* AIGC算法 AIGC 人工智能 transformer 计算机视觉图像处理
一、概述1、是什么是一系列多模态大型语言模型（MLLM），其中包括2B、7B、72B三个版本，整体采用视觉编码器+LLM形式（可以认为没有任何投射层）。比较创新的是图像缩放方式+3DLLM位置编码+（预估后面的训练方式也不太一样）。能够处理包括文本、图像在内的多种数据类型，具备图片描述、单图文问答、多图问对话、视频理解对话、json格式、多语言、agent、高清图理解（代码编写和debug论文暂时
Svelte 最新官方文档翻译（3）—— 符文（Runes）上
前言Svelte，一个非常“有趣”、用起来“很爽”的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目，也是我做个人项目的首选技术栈。目前Svelte基于Svelte5发布了最新的官方文档，但却缺少对应的中文
《鸿蒙Next微内核：解锁人工智能决策树并行计算的加速密码》人工智能深度学习算法
在当今人工智能飞速发展的时代，提升运算速度是推动其进步的关键。鸿蒙Next以其独特的微内核特性，为设计决策树的并行计算框架提供了新的思路和契机。鸿蒙Next微内核特性概述鸿蒙Next的微内核架构将核心功能模块化，仅保留进程管理、内存管理和通信机制等基础功能在内核中，文件系统、网络协议等都作为独立模块在用户空间运行。这种架构使内核精简、稳定且安全，模块间低耦合也让系统可扩展性和维护性更强，能根据不同
【Triton 教程】持久矩阵乘法 (Persistent Matmul)
Triton是一种用于并行编程的语言和编译器。它旨在提供一个基于Python的编程环境，以高效编写自定义DNN计算内核，并能够在现代GPU硬件上以最大吞吐量运行。更多Triton中文文档可访问→https://triton.hyper.ai/该脚本展示了使用Triton进行矩阵乘法的持久化内核实现(persistentkernelimplementations)。包含多种矩阵乘法方法，例如基础的朴
用c#做的打地鼠小游戏，整理一下上课学的臨鱼羡上天计算机软件资料适合小白小游戏
小游戏首先，我们要新建一个窗体应用程序，搭建好窗体的框架，有三个lable，分别是打地鼠，游戏时间和游戏得分，还有一个button按钮，text属性改为开始游戏.在每个土堆上拖入一个picturebox用于随机显示地鼠，再添加两个计时器timer，一个imagelist存储照片，一共两张照片一张没有被打中的，一张打中地鼠时要显示的图片，为了方便我把图片放最后了框架搭好了，双击button按钮开始游
《CPython Internals》阅读笔记：p151-p151 python
《CPythonInternals》学习第9天，p151-p1510总结，总计1页。一、技术总结无。二、英语总结(生词：1)1.marshal(1)marshalingMarshallingormarshaling(USspelling)istheprocessoftransformingthememoryrepresentationofanobjectintoadataformsuitablef
python实现自动登录12306抢票 -- selenium python
python实现自动登录12306抢票--selenium前言其实网上也出现了很多12306的代码，但是都不是最新的，我也是从网上找别人的帖子，看B站视频，然后写成了这个程序，想分享一下。其中我会说自己遇到的问题以及自己的一个改进。一、遇到的问题？1.url-正确的表头：就是首先url不要写错了，然后一定要加正确的表头，才可以拿到数据，就是我日期填写错误，然后生成的url就有问题，浪费了好多时间。
Go语言开发高效的RPC服务的方法 ac-er8888 golang rpc 开发语言
在Go语言中开发高效的RPC（远程过程调用）服务，可以通过以下几个关键步骤和方法来实现：一、定义服务接口首先需要定义需要提供的RPC方法及其参数和返回值。可以使用Go语言的interface类型来定义RPC接口，同时也可以为其添加必要的标记（如rpc）以便使用框架自动生成相关代码。例如：typeCalculatorinterface{Add(a,bint)int}二、注册服务使用Go语言的反射机制
人工智能时代的岗位变革人工智能
随着人工智能技术的飞速发展，它正深刻地改变着就业市场的格局，引发了一系列的岗位变革。一方面，人工智能的兴起使得一些重复性、规律性强的工作岗位面临被替代的风险。例如，在数据录入领域，以往需要大量人工手动输入数据的工作，如今借助人工智能的数据识别和自动化录入技术，能够快速、准确地完成。这导致许多数据录入员岗位需求减少。同样，在一些简单的生产装配环节，智能机器人凭借其高精度和高效率的优势，逐渐取代了部分
AI Agent：当年年都是爆发元年时人工智能算法
随着人工智能技术的不断进步，AIAgent的概念已经成为业界的热点。尽管许多公司推出了所谓的“Agent产品”，但这些产品往往只具备基本的自然语言理解能力，远未达到真正的Agent水平。从海外市场来看，科技巨头们无疑是这场角逐中的主力军。OpenAI、Anthropic、微软、谷歌等企业凭借深厚的技术积累与强大的研发实力，争先展示各自在AIAgent领域的阶段性成果，将其视为彰显企业竞争力的关键要
Python单例模式中的问题后端python
一、装饰器形式的单例模式首先先给出Python中装饰器的单例模式：python代码解读复制代码importthreadingdefsingleton(cls):_instances={}_lock=threading.Lock()defget_instance(*args,**kwargs):ifclsnotin_instances:with_lock:ifclsnotin_instances:_
回顾技术圈的2024尤雨溪喷React的“开年之战” 前端vue.jsreact
在2024年初，前端开发社区的一场激烈讨论围绕着React新版文档展开。这场讨论的导火索来自于Vue.js的创始人尤雨溪，他在Twitter上发表了对React新版文档的批评，认为React将复杂性转嫁给用户，未能有效地减轻使用该框架的心智负担。尤雨溪的言论迅速在React和Vue社区间引发了广泛的讨论，许多开发者开始针对React文档的设计哲学展开辩论，这一事件引起了前端开发者对框架设计理念和用
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><