FortiLZ

cs231n'18： Assignment 2 | Batch Normalization

Assignment 2 | Batch Normalization

上文吐槽BN部分讲的太烂，2018年果然更新了这一部分，slides里加了好多内容，详见Lecture 6的slides第54到61页，以及Lecture 7的slides第11到18页，这里结合着原始论文和作业，把BN及其几个变种好好总结一下。

Batch Normalization

Train

前面的作业中已经见识到了，weight初始化时方差的调校真的是很麻烦，小了梯度消失不学习，大了梯度爆炸没法学习。
即使开始初始化的很好，随着学习的深入，网络的加深，每一层的方差已经不再受控；另外，特别是对于刚开始的几层，方差上稍微的变化，都会在forward prop时逐级放大的传递下去。
作业中只是三五层的小网络，要是几十上百层的网络，可以想象学习几乎是不可能的。

既然每一层输入的方差会产生如此多的问题，这就产生了第一个想法，何不将每一层的输入直接标准化为0均值单位方差。由于NN的train多是基于mini-batch的，所以这里标准化也是基于mini-batch。

输入x是包含N个sample的mini-batch，每个sample有D个feature。对每个feature进行标准化，即：

μ j σ 2 j = 1 N \sum i = 1 N x i, j = 1 N \sum i = 1 N (x i, j - μ j) 2

标准化后的输出为:

x^= x - μ j σ 2 j + ϵ - - - - - \sqrt

但是但是但是，这里武断的使输入均值为0，方差为1真的是最好的选择么？不一定。如果不是最好的选择，
设为多少是最好的选择呢？不知道。不知道的话怎么办呢?
那就让NN自己去学习一个最好的去呗。所以才有了下一步：

y = γ \cdot x^+ β

其中， γ 和 β 是要学习的参数，将输入的均值和方差从(0,1)又拉到了 (γ,β) 。

所以，通常说起来BN是一层，但是我认为，BN是两层：Normalization Layer和Shift Layer，这两层是紧密相连，不可分割的。其中，Normalization Layer将输入的均值和方差标准化为(0,1)，Shift Layer又将其拉到 (γ,β) 。这里， (γ,β) 和其他的weight、bias一样，都是通过backprop算梯度，然后再用SGD等方法更新学习得到。

好，这里强调两个问题，也是我第一遍看paper时的疑惑，也是2017年视频中那位小姑娘讲课时犯的错误:

一提到BN层的作用，马上想到的是：将输入映射为0均值单位方差的高斯分布。错！首先它不一定是高斯分布，可以是任意的分布，BN仅仅改变均值方差，不改变分布。其次，均值方差不是(0,1)，而是 (γ,β) 。说(0, 1)的是忘记了shift这一层。
原文中有一句，还打了斜体:

To address this, we make sure that the transformation inserted in the network can represent the identity transform.

当时看的时候就不明白，既然费半天劲减均值除方差，怎么这里又要 “represent the identity transform”? 而且加上后边的

(γ,β) ( γ , β ) 操作，就更看不懂了。其实这里漏看了一个 “can” 。既然

(γ,β) ( γ , β ) 是学习来的，它们当然可以是原始输入的均值方差了，所以BN有表达一个identity transform的能力，而不是必须要表达一个identity transform。总结一下：

input:
      x: (N, D)
intermediates:
      mean: (1, D)  
          mean = np.mean(x, axis=0)
      var: (1, D)
          var = np.var(x, axis=0)
      xhat: (N, D)
          xhat = (x - mean) / (np.sqrt(var + eps))
learnable params:
      gamma: (1, D)
      beta: (1, D)
输出：
      y = gamma * xhat + beta

Test

在test时，就没有mini-batch可用来算

μ μ 和

σ2 σ 2 了，此时常用的方法是在train的过程中记录一个

μ μ 和

σ2 σ 2 的滑动均值在test的时候使用。 BN通常放在FC/Conv之后，ReLU之前。

Backprop

BN的backprop是这次作业的难点，还要用两种方法做，这里一步一步尽量详细地把推导过程写出来。

dβ

dβ d β 用维度分析法：

y = γ \cdot x^+ β

其中

y y 形如(N, D)，

γ γ 和

β β 形如(D,)，

x^ x ^ 形如(N, D)，所以

dβ d β 必然为：

dbeta = np.sum(dout, axis=0)

这里就不赘述了。

dγ

其实

dγ d γ 也可以用维度分析法得到，

dy d y 和

dx^ d x ^ 都形如(N, D)，而

dγ d γ 形如(D,)，显然

dγ d γ 应为：

dgamma = np.sum(xhat * dout, axis=0)

这里还是把过程写一下吧

⎡ ⎣ ⎢ ⎢ ⎢ y 11 y 21 y N 1 y 12 y 22 . . . y N 2 . . . . . . . . . . . . y 1 D y 2 D y N D ⎤ ⎦ ⎥ ⎥ ⎥ = [γ 1 γ 2 . . . γ D] \cdot ⎡ ⎣ ⎢ ⎢ ⎢ x 11 x 21 x N 1 x 12 x 22 . . . x N 2 . . . . . . . . . . . . x 1 D x 2 D x N D ⎤ ⎦ ⎥ ⎥ ⎥

展开可得：

y 11 = γ 1 \cdot x 11, y 21 = γ 1 \cdot x 21, y 12 = γ 2 \cdot x 12, y 22 = γ 1 \cdot x 22, . . . . . .

由此可得：

\partial L \partial γ q = \partial L \partial y \cdot \partial y \partial γ q = \sum i, j \partial L \partial y i j \cdot \partial y i j \partial γ q

而仅当

j=q j = q 时有

\partial y i j \partial γ q = x i q

其余均为0，故：

\partial L \partial γ q = \sum i = 1 N \partial L \partial y i q \cdot \partial y i q \partial γ q = \sum i = 1 N x i q \cdot d y i q

dx ：第一种方法

先画出forward和backward的计算图，如图所示。forward的代码如下：

x_mean = 1 / N * np.sum(x, axis=0)
x_mean_0 = x - x_mean
x_mean_0_sqr = x_mean_0 ** 2
x_var = 1 / N * np.sum(x_mean_0_sqr, axis=0)
x_std = np.sqrt(x_var + eps)
inv_x_std = 1 / x_std
x_hat = x_mean_0 * inv_x_std

out = gamma * x_hat + beta
cache = (x_mean, x_mean_0, x_mean_0_sqr, x_var, x_std, inv_x_std, x_hat, gamma, eps)

这里需要注意的是 1. 尽量将每一步化成最简单的加、乘操作，并且将每一步等号左边的项全部cache起来。这样做的目的是减少backprop时的计算量，但是相应的存贮量就会增加。所以说NN的内存需求要远远大于weights和bias的数目。 2. 计算mean是，用 1/N * np.sum()，不要用np.mean()，否则在backprop的时候会把 1/N 漏掉。如果forward的每一步计算分解的足够细的话，backprop可以很清楚：

# out = gamma * x_hat + beta
# (N,D) (D,)    (N,D)   (D,)
Dx_hat = dout * gamma

# x_hat = x_mean_0 * inv_x_std
# (N,D)   (N,D)      (D,)
Dx_mean_0 = Dx_hat * (inv_x_std)
Dinv_x_std = np.sum(Dx_hat * (x_mean_0), axis=0)

# inv_x_std = 1 / x_std
# (D,)            (D,)
Dx_std = Dinv_x_std * (- x_std ** (-2))

# x_std = np.sqrt(x_var + eps)
# (D,)           (D,)
Dx_var = Dx_std * (0.5 * (x_var + eps) ** (-0.5))

# x_var = 1 / N * np.sum(x_mean_0_sqr, axis=0)
# (D,)                   (N,D)
Dx_mean_0_sqr = Dx_var * (1 / N * np.ones_like(x_mean_0_sqr))

# x_mean_0_sqr = x_mean_0 ** 2
# (N,D)          (N,D)
Dx_mean_0 += Dx_mean_0_sqr * (2 * x_mean_0)

# x_mean_0 = x - x_mean
# (N,D)     (N,D) (D,)
Dx = Dx_mean_0 * (1)
Dx_mean = - np.sum(Dx_mean_0, axis=0)

# x_mean = 1 / N * np.sum(x, axis=0)
# (D,)                   (N,D)
Dx += Dx_mean * (1 / N * np.ones_like(x_hat))

dx = Dx

这里要注意的是： 1. 一定要把每一步计算中每一项的维度搞清楚写下来。注意这一步：

# x_hat = x_mean_0 * inv_x_std
# (N,D)   (N,D)      (D,)
Dx_mean_0 = Dx_hat * (inv_x_std)
Dinv_x_std = np.sum(Dx_hat * (x_mean_0), axis=0)

因为numpy在进行矩阵运算的时候会进行自动的broadcast，所以这里 inv_x_std 实际是形如 (D,)，但是计算是会broadcast成为(N, D)。仅从式子看的话，很容易误写为：

Dinv_x_std = Dx_hat * (x_mean_0)

这时如果进行一下维度分析，会发现 Dinv_x_std 显然要形如 (D,)，但是右侧点积的结果形如 (N, D)，显然要对 axis=0 进行 sum。同理还有这一行：

# x_mean_0 = x - x_mean
# (N,D)     (N,D) (D,)
Dx = Dx_mean_0 * (1)
Dx_mean = np.sum(Dx_mean_0 * (-1), axis=0)

对 y=∑ixi 的求导，这里
$y = x = [y 1, y 2, . . ., y D] ⎡ ⎣ ⎢ ⎢ ⎢ x 11 x 21 x N 1 x 12 x 22 . . . x N 2 . . . . . . . . . . . . x 1 D x 2 D x N D ⎤ ⎦ ⎥ ⎥ ⎥$
其中
$y 1 y 2 = 1 N (x 11 + x 21 + . . . + x N 1) = 1 N (x 12 + x 22 + . . . + x N 2) . . .$
所以
$d x 11 = \partial L \partial y \cdot \partial y \partial x 11 = \sum i \partial L \partial y i \cdot \partial y i \partial x 11 = \partial L \partial y 1 \cdot \partial y 1 \partial x 11 = d y 1 \cdot 1 N$
综上：
$d x = 1 N \cdot ⎡ ⎣ ⎢ ⎢ ⎢ d y 1 d y 1 d y 1 d y 2 d y 2 . . . d y 2 . . . . . . . . . . . . d y D d y D d y D ⎤ ⎦ ⎥ ⎥ ⎥ = 1 N \cdot d y \cdot ⎡ ⎣ ⎢ ⎢ ⎢ 111 11 . . . 1 . . . . . . . . . . . . 111 ⎤ ⎦ ⎥ ⎥ ⎥ N \times D$

# x_mean = 1 / N * np.sum(x, axis=0)
# (D,)                   (N,D)
Dx += Dx_mean * (1 / N * np.ones_like(x_hat))

注意到backprop时 Dx_mean_0 两次出现在等式左边，这说明在计算图中有两条路径通向 Dx_mean_0，这两条路径的结果要相加，所以第二次出现时要用 +=:

Dx_mean_0 = Dx_hat * (inv_x_std)
Dx_mean_0 += Dx_mean_0_sqr * (2 * x_mean_0)

dx ：第二种方法

第二种方法的公式推导实在是太繁了，我再也不想写第二遍了。先来个计算图：

x \to x^\to y \to L

中间参数分别为：

d o u t y x^μ σ 2 = \partial L \partial y = γ \cdot x^+ β = x - μ σ 2 + ϵ - - - - - \sqrt = 1 N \sum n = 1 N x n = 1 N \sum n = 1 N (x n - μ) 2

计算对

xij x i j 的导数：

\partial L \partial x i j = \sum n, d \partial L \partial y n d \cdot \partial y n d \partial x i j = \sum n, d \partial L \partial y n d \cdot \partial y n d \partial x n d ^\cdot \partial x n d ^ \partial x i j

其中：

y n d x n d^μ d σ 2 d \partial y n d \partial x n d ^= γ d \cdot x n d^+ β d = x n d - μ d σ 2 d + ϵ - - - - - \sqrt = 1 N \sum n = 1 N x n d = 1 N \sum n = 1 N (x n d - μ d) 2 = γ d

下面的工作就是要计算

∂xnd^∂xij ∂ x n d ^ ∂ x i j :

\partial x n d ^ \partial x i j = \partial \partial x i j ⎛ ⎝ ⎜ x n d - μ d σ 2 d + ϵ - - - - - \sqrt ⎞ ⎠ ⎟ = (σ 2 d + ϵ) - 1 2 \cdot \partial \partial x i j (x n d - μ d) + (x n d - μ d) \cdot \partial \partial x i j (σ 2 d + ϵ) - 1 2 = (σ 2 d + ϵ) - 1 2 \cdot \partial \partial x i j (x n d - μ d) - 1 2 (σ 2 d + ϵ) - 3 2 (x n d - μ d) \cdot \partial σ 2 d \partial x i j

下面分别计算，首先：

\partial \partial x i j (x n d - μ d) = \partial \partial x i j (x n d - 1 N \sum t = 1 N x t d) = \partial x n d \partial x i j - 1 N \partial \partial x i j (\sum t = 1 N x t d)

第一项，当且仅当

n=i n = i ,

d=j d = j 时不为0，第二项中仅有

d=j d = j 项不为0，故：

\partial \partial x i j (x n d - μ d) = δ n, i \cdot δ d, j - 1 N δ d, j

接着计算：

\partial σ 2 d \partial x i j = \partial \partial x i j (1 N \sum n = 1 N (x n d - μ d) 2) = 1 N \sum n = 1 N \partial \partial x i j ((x n d - μ d) 2) = 2 N \sum n = 1 N (x n d - μ d) \partial \partial x i j (x n d - μ d) = 2 N \sum n = 1 N (x n d - μ d) \cdot (δ n, i \cdot δ d, j - 1 N δ d, j) = 2 N \sum n = 1 N (x n d - μ d) \cdot δ n, i \cdot δ d, j - 2 N 2 \sum n = 1 N (x n d - μ d) \cdot δ d, j

第一项中，仅有

n=i n = i 一项不为0：

\sum n = 1 N (x n d - μ d) \cdot δ n, i \cdot δ d, j = (x i d - μ d) \cdot δ d, j

第二项：

\sum n = 1 N (x n d - μ d) = \sum n = 1 N x n d - N \cdot μ d

而

μd=1N∑Nn=1xnd μ d = 1 N ∑ n = 1 N x n d ，因此上式为0。
所以：

\partial σ 2 d \partial x i j = 2 N (x i d - μ d) \cdot δ d, j

综上:

\partial x n d ^ \partial x i j = (σ 2 d + ϵ) - 1 2 \cdot \partial \partial x i j (x n d - μ d) - 1 2 (σ 2 d + ϵ) - 3 2 (x n d - μ d) \cdot \partial σ 2 d \partial x i j = (σ 2 d + ϵ) - 1 2 \cdot (δ n, i \cdot δ d, j - 1 N δ d, j) - 1 N (σ 2 d + ϵ) - 3 2 (x n d - μ d) (x i d - μ d) \cdot δ d, j

最后，计算对

xij x i j 的导数

\partial L \partial x i j = \sum n, d \partial L \partial y n d \cdot γ d \cdot \partial x n d ^ \partial x i j = \sum n, d γ d \cdot \partial L \partial y n d \cdot (σ 2 d + ϵ) - 1 2 \cdot (δ n, i \cdot δ d, j - 1 N δ d, j) - 1 N \sum n, d γ d \cdot \partial L \partial y n d \cdot (σ 2 d + ϵ) - 3 2 (x n d - μ d) (x i d - μ d) \cdot δ d, j

第一项

\sum n, d γ d \cdot \partial L \partial y n d \cdot (σ 2 d + ϵ) - 1 2 \cdot (δ n, i \cdot δ d, j - 1 N δ d, j) = \sum n γ j \cdot \partial L \partial y n j \cdot (σ 2 j + ϵ) - 1 2 \cdot (δ n, i - 1 N) = γ j \cdot \partial L \partial y i j \cdot (σ 2 j + ϵ) - 1 2 - 1 N \sum n γ j \cdot \partial L \partial y n j \cdot (σ 2 j + ϵ) - 1 2 = γ j \cdot (σ 2 j + ϵ) - 1 2 (\partial L \partial y i j - 1 N \sum n \partial L \partial y n j)

第二项

- 1 N \sum n, d γ d \cdot \partial L \partial y n d \cdot (σ 2 d + ϵ) - 3 2 (x n d - μ d) (x i d - μ d) \cdot δ d, j = - 1 N \sum n γ j \cdot \partial L \partial y n j \cdot (σ 2 j + ϵ) - 3 2 (x n j - μ j) (x i j - μ j) = - 1 N γ j (σ 2 j + ϵ) - 3 2 (x i j - μ j) \sum n \partial L \partial y n j (x n j - μ j)

最后的结果为

\partial L \partial x = γ N (σ 2 + ϵ) - 1 2 (N \partial L \partial y - \sum n \partial L \partial y n - (σ 2 + ϵ) - 1 (x - μ) \sum n \partial L \partial y n (x n - μ))

代码如下

first_part = gamma * inv_x_std / N
second_part = N * dout
third_part = np.sum(dout, axis=0)
forth_part = inv_x_std ** 2 * x_mean_0 * np.sum(dout * x_mean_0, axis=0)

dx = first_part * (second_part - third_part - forth_part)

Inline Question 1:

Describe the results of this experiment. How does the scale of weight initialization affect models with/without batch normalization differently, and why?

BN层的加入，大大降低了训练过程对weight初始化的依赖。

Inline Question 2:

Describe the results of this experiment. What does this imply about the relationship between batch normalization and batch size? Why is this relationship observed?

BN层的加入使得训练收敛的更快，acc更高，但是对test影响不是很大。
另外，如果batch size太小，反而不如没有BN。

Inline Question 3:

Which of these data preprocessing steps is analogous to batch normalization, and which is analogous to layer normalization?
1. Scaling each image in the dataset, so that the RGB channels for each row of pixels within an image sums up to 1.
2. Scaling each image in the dataset, so that the RGB channels for all pixels within an image sums up to 1.
3. Subtracting the mean image of the dataset from each image in the dataset.
4. Setting all RGB values to either 0 or 1 depending on a given threshold.

1、2类似于layer norm，3类似于batch norm。

Layer normalization

Layer norm 和 batch norm 很像，都是用在FC层，只不过 batch norm 在 X 的 sample 方向取均值和方差，即将形如 (N, D) 的 X 取为形如 (1, D) 的均值和方差；而 layer norm 是在 X 的feature方向取均值和方差，即将形如 (N, D) 的 X 取为形如 (N, 1) 的均值和方差。因此，方便记忆的话，可以将 batch norm 记为 N norm 或者 axis=0 norm，将 layer norm 记为 D norm 或者 axis=1 norm。

另外，layer norm 在 train 和 test 时计算方法均相同，而不用像 batch norm 那样需要记录一个 running mean 和 running var。

这里还要特别注意的一点是，两者的 gamma 和 beta 都是形如 (1, D) 的。

Layer norm 的实现同 batch norm 相似，只需要将输入转置，就可调用 batch norm 来实现。

Inline Question 4:

When is layer normalization likely to not work well, and why?
1. Using it in a very deep network
2. Having a very small dimension of features
3. Having a high regularization term

从结果看，layer norm 的效果不是很好，特别是当 batch size 很小时。
但是对深层NN来说，layer norm 可以加快训练速度。
注意，reg只是施加于 weights 上的，并不施加于 norm 的参数 gamma 和 beta。如果 reg 很大的话，那么 affine 层的 weights 会被拉向0，输出值的大小也会减小，因此会减小 norm 层的作用。

Spatial batch Normalization

这里所谓的 spatial batch Normalization ，实际上就是 BN 的CNN banben版本。只不过 BN 是将形如 (N, D) 的 X 取为形如 (1, D) 的均值和方差；而 SBN 是将形如 (N, C, H, W) 的 X 取形如 (1, C, 1, 1) 的均值和方差，需要训练的 gamma 和 beta 也是形如 (1, C, 1, 1) 的。

作业里的 SBN，只需要将输入形如 (N, C, H, W) 的 X，首先转置为 (N, H, W, C)，然后 reshape 为 (N * H * W, C)，调用 BN 的 forward 和 backward 进行计算，最后将结果再转置会原来的形状即可。

Instance Normalization

Instance normalization 是将形如 (N, C, H, W) 的 X 取形如 (N, C, 1, 1) 的均值和方差，需要训练的 gamma 和 beta 也是形如 (1, C, 1, 1) 的。

Group Normalization

Group Normalization 是 layer normalization 在 CNN 中的改进版本。
Layer normalization 据说在 CNN 中的效果不是很好，所以要加以改进。在 CNN 中，layer normalization 是一次对所有的 C 取均值和方差，而 group normalization 是将 C 分为几组，每次仅在组内取均值和方差。
需要训练的 gamma 和 beta 也是形如 (1, C, 1, 1) 的。

作业中的也没什么好说的，只要把输入适当的 split 就可以了。

end

学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
我的烦恼余建梅
我的烦恼。女儿问我：“你给学生布置什么作文题目？”“《我的烦恼》。”“他们都这么大了，你觉得他们还有烦恼吗？”“有啊！每个人都会有自己烦恼。”“我不相信，大人是没有烦恼的，如果说一定有的话，你的烦恼和我写作业有关，而且是小烦恼。不像我，天天被你说，有这样的妈妈，烦恼是没完没了。”女儿愤愤不平。每个人都会有自己的烦恼，处在上有老下有小的年纪，烦恼多的数不完。想干好工作带好孩子，想孝顺父母又想经营好自
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
2022-04-18 Apbenz
语重心长的和我说，不要老是说不行，人至而立之年危机四伏，内在的，外在的，感觉就是心力憔悴，让人无所适从。面对职场的无情，突然好羡慕干体力劳动的外卖小哥。难道命运是想让我去送外卖了吗？干体力活才能让我活下去？fastadmin打卡成功,淘宝金币任务完成。ㅏㅓㅗㅜㅡㅣㅐㅔㅑㅕㅛㅠㅢㅒㅖY行。야자여자요리우유의사얘기예
《小满细雨轻湿尘》快乐的人ZZM
图片发自App《小满细雨轻湿尘》文/快乐的人zzm小满细雨轻湿尘石榴花开落纷纷落红不是无情物坠入泥土育养根2018-5-23
网易严选官方旗舰店，优质商品，卓越服务高省_飞智666600
网易严选官方旗舰店是网易旗下的一家电商平台，以提供优质商品和卓越服务而闻名。作为一名SEO优化师，我将为您详细介绍网易严选官方旗舰店，并重点强调其特点和优势。大家好！我是高省APP最大团队&联合创始人飞智导师。相较于其他返利app，高省APP的佣金更高，模式更好，最重要的是，终端用户不会流失！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
感赏日志133 马姐读书
图片发自App感赏自己今天买个扫地机，以后可以解放出来多看点书，让这个智能小机器人替我工作了。感赏孩子最近进步很大，每天按时上学，认真听课，认真背书，主动认真完成老师布置的作业。感赏自己明白自己容易受到某人的影响，心情不好，每当此刻我就会舒缓，感赏，让自己尽快抽离，想好的一面。感赏儿子今天在我提醒他事情时，告诉我谢谢妈妈对我的提醒我明白了，而不是说我啰嗦，管事情，孩子更懂事了，懂得感恩了。投射父母
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
2018/02/12 Tracy_zhang
人生并不在于获取，更在于放得下。放下一粒种子，收获一棵大树;放下一处烦恼，收获一个惊喜;放下一种偏见，收获一种幸福;放下一种执著，收获一种自在。放下既是一种理性抉择，也是一种豁达美。只要看得开放得下，何愁没有快乐的春莺在啼鸣，何愁没有快乐的泉溪在歌唱，何愁没有快乐的鲜花绽放!
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
398顺境，逆境戴骁勇
2018.11.27周二雾霾最近儿子进入了一段顺境期，今天表现尤其不错。今天的数学测试成绩喜人，没有出现以往的计算错误，整个卷面书写工整，附加题也在规定时间内完成且做对。为迎接体育测试的锻炼有了质的飞跃。坐位体前屈成绩突飞猛进，估测成绩能达到12cm，这和上次测试的零分来比，简直是逆袭。儿子还在不断锻炼和提升，唯恐到时候掉链子。跑步姿势在我的调教下，逐渐正规起来，速度随之也有了提升。今晚测试的50
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
利用Requests Toolkit轻松完成HTTP请求 nseejrukjhad http 网络协议网络 python
RequestsToolkit的力量：轻松构建HTTP请求Agent在现代软件开发中，API请求是与外部服务交互的核心。RequestsToolkit提供了一种便捷的方式，帮助开发者构建自动化的HTTP请求Agent。本文旨在详细介绍RequestsToolkit的设置、使用和潜在挑战。引言RequestsToolkit是一个强大的工具包，可用于构建执行HTTP请求的智能代理。这对于想要自动化与外
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
春季养肝正当时 dxn悟
重温快乐2023年2月4日立春。春天来了，春暖花开，小鸟欢唱，那在这样的季节我们如何养肝呢？自然界的春季对应中医五行的木，人体五脏肝属木，“木曰曲直”，是以树干曲曲直直地向上、向外伸长舒展的生发姿态，来形容具有生长、升发、条达、舒畅等特征的食物及现象。根据中医天人相应的理念，肝五行属木，喜条达，主疏泄，与春天相应，所以春天最适合养肝。养肝首先要少生气，因为肝喜条达恶抑郁。人体五志肝为怒，生气发怒最
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
读书||陶新华《教育中的积极心理学》1—28 流水淙淙2022
读一本好书，尤如和一位高尚者对话，亦能对人的精神进行洗礼。但是若不能和实践结合起来，也只能落到空读书的状态。读书摘要与感想1、塞利格曼在《持续的幸福》一书中提出了幸福2.0理论，提出幸福由5个元素决定——积极情绪、投入的工作和生活、目标和意义、和谐的人际关系、成就感。2、人的大脑皮层在进行智力活动时，都伴有皮下中枢活动，对这些活动进行体验请假，并由此产生了情感解读。人的情绪情感体验总是优先于大脑的
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持