csdn_csdn__AI

一文详解循环神经网络的基本概念（代码版）

作者 | 李理

目前就职于环信，即时通讯云平台和全媒体智能客服平台，在环信从事智能客服和智能机器人相关工作，致力于用深度学习来提高智能机器人的性能。

写在前面

由于工作太忙，这个系列文章有一年多没有更新了。最近在整理资料时用到了里面的一些内容，觉得做事情应该有始有终，所以打算把它继续完成。下面的系列文章会首先会介绍 vanilla RNN 的代码，希望读者能够通过代码更加深入的了解RNN的原理。代码会着重于 forward 的介绍，而对 BPTT 一带而过。之前的文章为了让读者了解原理，我们都是自己来实现梯度的计算和各种优化算法。但是在实际的工作中，我们一般使用一些成熟的深度学习框架。因为框架把常用的算法都做了封装，我们的代码会更加简单而不易出错；此外框架的实现效率一般会比我们的更高，会利用 GPU 来加速训练。

我们之前在 CNN 的地方介绍了 theano，但是深度学习的发展变化也很快，theano目前已是一个死掉的项目。目前用户最多的深度学习框架是TensorFlow，但是在 RNN 方面，基于动态图的 PyTorch 更加方便，所以这个系列文章会使用 PyTorch。因此介绍过 vanilla RNN 之后会简单的介绍一下 PyTorch，尤其是 PyTorch 在 RNN 方面相关模块。然后会介绍一些 PyTorch 的例子，接下来会介绍 seq2seq(encoder-decoder) 模型和注意力机制，包括它在机器翻译里的应用，我们会自己实现一个简单的汉语-英语的翻译系统。

最后一部分就是我们的主题—— Image Caption Generation，有了前面 CNN 和 RNN 的基础，实现它就非常轻松了。

本章会介绍循环神经网络的基本概念。

基本概念

▌RNN

RNN 的特点是利用序列的信息。之前我们介绍的神经网络假设所有的输入是相互独立的。但是对于许多任务来说这不是一个好的假设。如果你想预测一个句子的下一个词，知道之前的词是有帮助的。RNN 被成为递归的 (recurrent) 原因就是它会对一个序列的每一个元素执行同样的操作，并且之后的输出依赖于之前的计算。另外一种看待 RNN 的方法是可以认为它有一些“记忆”能捕获之前计算过的一些信息。理论上 RNN 能够利用任意长序列的信息，但是实际中它能记忆的长度是有限的。

图5.1显示了怎么把一个 RNN 展开成一个完整的网络。比如我们考虑一个包含5个词的句子，我们可以把它展开成 5 层的神经网络，每个词是一层。RNN 的计算公式如下：

1. 是 t 时刻的输入。

2. 是 t 时刻的隐状态。

它是网络的“记忆”。的计算依赖于前一个时刻的状态和当前时刻的输入：

。函数 f 通常是诸如 tanh 或者 ReLU 的非线性函数。，这是用来计算第一个隐状态，通常我们可以初始化成0。

图5.1: RNN 展开图

3. 是 t 时刻的输出。

有一些事情值得注意：

1. 你可以把看成是网络的“记忆”。

捕获了从开始到前一个时刻的所有(感兴趣) 的信息。输出只基于当前时刻的记忆。不过实际应用中很难记住很久以前的信息。

2. 参数共享

和传统的深度神经网络不同，这些传统的网络每层使用不同的参数，RNN 的参数(上文的 U, V, W ) 是在所有时刻共享(一样) 的。这反映这样一个事实：我们每一步都在执行同样的操作，只不过输入不同而已。这种结构极大的减少了我们需要学习的参数【同时也让信息得以共享，是的训练变得可能】

3. 每一个时刻都有输出

上图每一个时刻都有输出，但我们不一定都要使用。比如我们预测一个句子的情感倾向是我们只关注最后的输出，而不是每一个词的情感。类似的，我们也不一定每个时刻都有输入。RNN 最主要的特点是它有隐状态(记忆)，它能捕获一个序列的信息。

▌RNN 的扩展

1. 双向 RNN (Bidirectional RNNs)

它的思想是 t 时刻的输出不但依赖于之前的元素，而且还依赖之后的元素。比如，我们做完形填空，在句子中“挖”掉一个词，我们想预测这个词，我们不但会看之前的词，也会分析之后的词。双向 RNN 很简单，它就是两个 RNN 堆叠在一起。输出依赖两个 RNN 的隐状态。

2. 深度(双向) RNN (Deep (Bidirectional) RNNs)

和双向 RNN 类似，不过多加几层。当然它的表示能力更强，需要的训练数据也更多。

▌RNN 代码示例

接下来我们通过简单的代码来演示的 RNN，用 RNN 来实现一个简单的 Char RNN 语言模型。为了让读者了解 RNN 的一些细节，本示例会使用 numpy 来实现 forward 和 backprop 的计算。RNN 的反向传播算法一般采用 BPTT，如果读者不太明白也不要紧，但是 forward 的计算一定要清楚。本章后续的内容会使用 PyTorch 来实现更复杂的 seq2seq 模型、注意力机制来做机器翻译以及 Image Caption Generation。这个 RNN 代码来自 karpathy 的 blog 文章《The Unreasonable Effectiveness of Recurrent Neural Networks》附带的代码：

https://gist.github.com/karpathy/d4dee566867f8291f086

代码总共一百来行，我们下面逐段来阅读。

图5.2: 双向RNN

数据预处理

data = open('../data/tiny-shakespeare.txt', 'r').read() # should be simple
plain text file
chars = list(set(data))
data_size, vocab_size = len(data), len(chars)
print('data has %d characters, %d unique.' % (data_size, vocab_size))
char_to_ix = {ch: i for i, ch in enumerate(chars)}
ix_to_char = {i: ch for i, ch in enumerate(chars)}

上面的代码读取莎士比亚的文字到字符串 data 里，通过 set() 得到所有的字符并放到 chars 这个 list 里。然后得到 char_to_ix 和 ix_to_char 两个 dict，分别表示字符到 id 的映射和 id 到字符的映射( id 从零开始)

模型超参数和参数定义

# 超参数
hidden_size = 100 # 隐藏层神经元的个数
seq_length = 25 # BPTT时最多的unroll的步数
learning_rate = 1e-1

图5.3: 多层双向RNN

模型参数

# 模型参数
Wxh = np.random.randn(hidden_size, vocab_size) * 0.01 # 输入-隐藏层参数
Whh = np.random.randn(hidden_size, hidden_size) * 0.01 # 隐藏层-隐藏层参数
Why = np.random.randn(vocab_size, hidden_size) * 0.01 # 隐藏层-输出层参数
bh = np.zeros((hidden_size, 1)) # 隐藏层bias
by = np.zeros((vocab_size, 1)) # 输出层bias

上面的代码定义超参数 hidden_size，seq_length 和 learning_rate，以及模型的参数 Wxh, Whh 和 Why。

lossFun

def lossFun(inputs, targets, hprev):
"""
inputs,targets都是整数的list
hprev是Hx1的数组，是隐状态的初始值
返回loss，梯度和最后一个时刻的隐状态
"""
xs, hs, ys, ps = {}, {}, {}, {}
hs[-1] = np.copy(hprev)
loss = 0
# forward pass
for t in xrange(len(inputs)):
xs[t] = np.zeros((vocab_size, 1)) # encode in 1-of-k representation
xs[t][inputs[t]] = 1
hs[t] = np.tanh(np.dot(Wxh, xs[t]) + np.dot(Whh, hs[t - 1]) + bh) #
hidden state
ys[t] = np.dot(Why, hs[t]) + by # unnormalized log probabilities for
next chars
ps[t] = np.exp(ys[t]) / np.sum(np.exp(ys[t])) # probabilities for next
chars
loss += -np.log(ps[t][targets[t], 0]) # softmax (cross-entropy loss)
# backward pass: compute gradients going backwards
dWxh, dWhh, dWhy = np.zeros_like(Wxh), np.zeros_like(Whh),
np.zeros_like(Why)
dbh, dby = np.zeros_like(bh), np.zeros_like(by)
dhnext = np.zeros_like(hs[0])
for t in reversed(xrange(len(inputs))):
dy = np.copy(ps[t])
dy[targets[t]] -= 1 # backprop into y. see
http://cs231n.github.io/neural-networks-case-study/#grad if
confused here
dWhy += np.dot(dy, hs[t].T)
dby += dy
dh = np.dot(Why.T, dy) + dhnext # backprop into h
dhraw = (1 - hs[t] * hs[t]) * dh # backprop through tanh nonlinearity
dbh += dhraw
dWxh += np.dot(dhraw, xs[t].T)
dWhh += np.dot(dhraw, hs[t - 1].T)
dhnext = np.dot(Whh.T, dhraw)
for dparam in [dWxh, dWhh, dWhy, dbh, dby]:
np.clip(dparam, -5, 5, out=dparam) # clip to mitigate exploding
gradients
return loss, dWxh, dWhh, dWhy, dbh, dby, hs[len(inputs) - 1]

我们这里只阅读一下 forward 的代码，对 backward 代码感兴趣的读者请参考：

https://github.com/pangolulu/rnn-from-scratch

# forward pass
for t in xrange(len(inputs)):
xs[t] = np.zeros((vocab_size, 1)) # encode in 1-of-k representation
xs[t][inputs[t]] = 1
hs[t] = np.tanh(np.dot(Wxh, xs[t]) + np.dot(Whh, hs[t - 1]) + bh) #
hidden state
ys[t] = np.dot(Why, hs[t]) + by # unnormalized log probabilities for
next chars
ps[t] = np.exp(ys[t]) / np.sum(np.exp(ys[t])) # probabilities for next
chars
loss += -np.log(ps[t][targets[t], 0]) # softmax (cross-entropy loss)

上面的代码变量每一个时刻 t，首先把字母的 id 变成 one-hot 的表示，然后计算 hs[t]，计算方法是：hs[t] = np.tanh(np.dot(Wxh, xs[t]) + np.dot(Whh, hs[t - 1]) +bh)。也就是根据当前输入 xs[t] 和上一个状态 hs[t-1] 计算当前新的状态 hs[t]，注意如果 t=0 的时候 hs[t-1] = hs[-1] = np.copy(hprev)，也就是函数参数传入的隐状态的初始值 hprev。接着计算 ys[t] = np.dot(Why, hs[t]) + by。然后用softmax 把它变成概率：ps[t] = np.exp(ys[t]) / np.sum(np.exp(ys[t]))。最后计算交叉熵的损失：loss +=-np.log(ps[t][targets[t], 0])。注意：ps[t] 的 shape 是 [vocab_size,1]

sample 函数

这个函数随机的生成一个句子（字符串）。

def sample(h, seed_ix, n):
"""
使用rnn模型生成一个长度为n的字符串
h是初始隐状态，seed_ix是第一个字符
"""
x = np.zeros((vocab_size, 1))
x[seed_ix] = 1
ixes = []
for t in xrange(n):
h = np.tanh(np.dot(Wxh, x) + np.dot(Whh, h) + bh)
y = np.dot(Why, h) + by
p = np.exp(y) / np.sum(np.exp(y))
ix = np.random.choice(range(vocab_size), p=p.ravel())
x = np.zeros((vocab_size, 1))
x[ix] = 1
ixes.append(ix)
return ixes

sample 函数会生成长度为n 的字符串。一开始 x 设置为 seed_idx：x[seed_idx]=1 (这是one-hot 表示)，然后和 forward 类似计算输出下一个字符的概率分布 p。然后根据这个分布随机采样一个字符 (id) ix，把 ix 加到结果 ixes 里，最后用这个ix 作为下一个时刻的输入：x[ix]=1

训练

n, p = 0, 0
mWxh, mWhh, mWhy = np.zeros_like(Wxh), np.zeros_like(Whh), np.zeros_like(Why)
mbh, mby = np.zeros_like(bh), np.zeros_like(by) # memory variables for
Adagrad
smooth_loss = -np.log(1.0 / vocab_size) * seq_length # loss at iteration 0
while True:
# prepare inputs (we're sweeping from left to right in steps seq_length
long)
if p + seq_length + 1 >= len(data) or n == 0:
hprev = np.zeros((hidden_size, 1)) # reset RNN memory
p = 0 # go from start of data
inputs = [char_to_ix[ch] for ch in data[p:p + seq_length]]
targets = [char_to_ix[ch] for ch in data[p + 1:p + seq_length + 1]]

# sample from the model now and then
if n % 1000 == 0:
sample_ix = sample(hprev, inputs[0], 200)
txt = ''.join(ix_to_char[ix] for ix in sample_ix)
print('----\n %s \n----' % (txt,))

# forward seq_length characters through the net and fetch gradient
loss, dWxh, dWhh, dWhy, dbh, dby, hprev = lossFun(inputs, targets, hprev)
smooth_loss = smooth_loss * 0.999 + loss * 0.001
if n % 1000 == 0:
print('iter %d, loss: %f' % (n, smooth_loss)) # print progress

# perform parameter update with Adagrad
for param, dparam, mem in zip([Wxh, Whh, Why, bh, by],
[dWxh, dWhh, dWhy, dbh, dby],
[mWxh, mWhh, mWhy, mbh, mby]):
mem += dparam * dparam
param += -learning_rate * dparam / np.sqrt(mem + 1e-8) # adagrad update

p += seq_length # move data pointer
n += 1 # iteration counter

上面是训练的代码，首先初始化 mWxh, mWhh, mWhy。因为这里实现的是Adgrad，所以需要这些变量来记录每个变量的“delta”，有兴趣的读者可以参考：

http://cs231n.github.io/neural-networks-3/#ada

接下来是一个无限循环来不断的训练，首先是得到一个训练数据，输入是data[p:p + seq_length]，而输出是data[p+1:p +seq_length+1]。然后是lossFun 计算这个样本的 loss，梯度和最后一个时刻的隐状态（用于下一个时刻的隐状态的初始值），然后用梯度更新参数。每 1000 次训练之后会用sample 函数生成一下句子，可以通过它来了解目前模型生成的效果。

完整代码：

https://github.com/fancyerii/deep_learning_theory_and_practice/blob/master/codes/ch05/rnn.py

▌LSTM/GRU

长距离依赖(Long Term Dependency) 问题

RNN 最有用的地方在于它(可能) 能够把之前的信息传递到当前时刻，比如在理解一个视频的当前帧时利用之前的帧是非常有用的。如果 RNN 可以做到这一点，那么它会非常有用。但是它能够实现这个目标吗？

图5.4: RNN 的短距离依赖

图5.5: RNN 的长距离依赖

有的时候，我们只需要最近的一些信息就可以很好的预测当前的任务。比如在语言模型里，我们需要预测“the clouds are in the ?”的下一个单词，我们很容易根据之前的这几个此就可以预测最可能的词是“sky”。如图 5.4 所示，我们要预测的需要的信息距离不是太远。

但是有的时候我们需要更多的上下文信息来预测。比如“I grew up in France…Ispeak fluent ?”。最近的信息“I speak fluent” 暗示后面很可能是一种语言，但是我们无法确定是哪种语言，除非我们有更久之前的上下文“I grew up in France”。因此为了准确的预测，我们可能需要依赖很长距离的上下文。如图 5.5 所示，为了预测，我们需要很远的。理论上，如果我们的参数学得足够好，RNN 是可以学习到这种长距离依赖关系的。但是很不幸的是，在实际应用中 RNN 很难学到。

接下来会介绍的 LSTM 就是试图解决这个问题。

图5.6: RNN 的结构

图5.7: LSTM

Long Short Term Memory(LSTM) 网络基本概念

本节内容主要来自Colah 的博客：

http://colah.github.io/posts/2015-08-Understanding-LSTMs/

LSTM 是一种特殊的RNN 网络，它使用门(Gate) 的机制来解决长距离依赖的问题。

回顾一下，所有的RNN 都是如图 5.6 的结构，把 RNN 看成一个黑盒子的话，它会有一个“隐状态”来“记忆”一些重要的信息。当前时刻的输出除了受当前输入影响之外，也受这个“隐状态”影响。并且在这个时刻结束时，除了输出之外，这个“隐状态”的内容也会发生变化——可能“记忆”了新的信息同时有“遗忘”了一些旧的信息。

LSTM 也是这样的结果，只不过相比于原始的 RNN，它的内部结构更加复杂。

普通的 RNN 就是一个全连接的层，而 LSTM 有四个用于控制”记忆“和运算的门，如图5.7所示。

这个图初看比较复杂，我们后面会详细解释里面的细节。在介绍之前，我们首先来熟悉图中的一下部件，如图 5.8 所示。

图5.8: LSTM 示意图的组件

图5.9: LSTM Cell State 的通道

在图 5.8 中，每条有向边代表向量，黄色的方框代表神经网络层，粉色的圆圈代表逐点运算(Pointwise Operation)。两条边的合并代表向量的拼接(concatenation)，边的分叉代表把一个向量复制到两个地方。

LSTM 核心思想

LSTM 除了有普通 RNN 的隐状态之外还有一个叫 Cell State 的 Cell 状态，它基本是从上一个时刻直接通到下一个时刻的（后面会介绍修改它的操作），所以以前的重要”记忆“理论上可以很容易保存下来，如图 5.9 所示，图上从到存在直接的通道。

当然如果 LSTM 只是原封不动的保存之前的”记忆“，那就没有太多价值，它还必须根据需要，能够增加新的记忆同时擦除旧的无用的记忆。LSTM 是通过一种叫作门的机制来控制怎么擦除旧记忆写入新记忆的，下面我们逐步来介绍它的这种机制。

如图 5.10 所示，门可以用来控制信息是否能够通过，它一般是一个激活函数是sigmoid 的层，0 表示阻止任何信息通过，1 表示所有信息通过，而0-1 直接的值表示部分通过。

LSTM 门的细节

首先我们来了解 LSTM 的遗忘门(Forget Gate)，它会决定遗忘多少之前的记忆。它的输入是上一个时刻的隐状态和当前时刻的输入，它的输出是 0-1 直接的数，0 表示完全遗忘之前的记忆，而 1 表示完全保留原来的记忆。

图5.10: LSTM 的Gate

图5.11: LSTM 的Forget Gate

图5.12: LSTM 的Input Gate

如图 5.11 所示：

这个乘以就表示上一个时刻的需要遗忘多少信息。

接下来LSTM 有一个输入门，它用来控制输入的信息多少可以进入LSTM。t 时刻的输入候选，注意的激活函数是 tanh，因为输入的范围我们不能限制，因此用 (-1,1) 的 tanh；而门我们要求它的范围是 (0,1)，因此门用 sigmoid 激活。然后把输入门和输入候选点乘起来，表示当前时刻有多少信息应该进入 Cell State，如图 5.12 所示。

接着把上一个时刻未遗忘的信息和当前时刻候选累加得到新的，如图 5.13 所示：

最后我们需要计算当前时刻的输出 (它就是隐状态)，它是使用当前的使用 tanh 计算后再通过一个输出门(Output Gate) 得到，如图 5.14 所示。

图5.13: LSTM 计算t 时刻的Ct

图5.14: ot 的计算

LSTM 的变种

下面介绍一些常见的 LSTM 变种，包括很流行的 GRU(Gated Recurrent Unit)。第一种变体是计算三个门时不只利用和，还使用，也就是从有一个 peephole 的边，如图 5.15 所示。

第二种变体就是遗忘门不但决定遗忘多少的信息，而且会乘以中用于控制多少新的信息进入，如图 5.16 所示。

第三种就是 GRU，它把遗忘门和输入门合并成一个更新门(Update Gate)，并且

图5.15: 有peephole 连接的LSTM

5.16: LSTM 变种2

图5.17: GRU

把 Cell State 和 Hidden State 也合并成一个 Hidden State，它的计算如图 5.17 所示。

和 LSTM 不同，在计算的时候会用乘以，类似与 LSTM 的遗忘门。而在计算新的时，表示从里保留的信息比例，而表示从里更新的信息比例。

下节预告：PyTorch 教程（敬请关注）

扫描二维码，关注「人工智能头条」

回复“技术路线图”获取 AI 技术人才成长路线图

点击 | 阅读原文 | 查看更多干货内容

你可能感兴趣的:(一文详解循环神经网络的基本概念（代码版）)

pagefile.sys weixin_33971205 操作系统运维游戏
pagefile.sys即安装过程中创建的虚拟内存页面文件。这个文件的大小是自己系统虚拟内存设置的最小值的大小。假如虚拟内存的设置为800MB－1600MB那么你在自己的设定驱动盘下面就可看到大小为800MB的pagefile.sys文件如果计算机在较低的RAM下运行，并且立即需要更多RAM，则Windows会用硬盘空间来模拟系统RAM。这叫做虚拟内存，通常称为页面文件。也就由于虚拟内存的设定产生
2020-02-10 南窗竹
昨天老公去商场买菜时，听说村子都封村了。老公说返工又延期了。是呀！在这节骨眼上，企业主真的不敢擅自开工。我希望老公能在这种日子里养胖几斤。这些年他一直都很操劳，又经历太多事太多变故了，身材一直保持着，瘦瘦的。我知道他胖起来肯定很帅，我也不用被别人说结婚这么多年，没能把他养胖一些。六点半，两贝就起床了。大贝要开始上课，小贝被我昨天骗着说今天需要网课，她也起床了。两个妞都有过来房间看我。只是当我说帮我
2019.3.5 一直向上的小呆萌
OK，又是新的一天。依旧该干嘛干嘛。今天上班，整个公司的节奏比较快，比较热闹，也有工作的动力了！昨晚做梦梦到又到考研的时候了！今天早上起床就在想：万一今年考不上会怎么样呢？这样又浪费了一年的时间，为什么那时没有那么坚决的换工作呢？想，想有什么用呢？今年要考上，今年要考上，今年一定要考上！！！要争气！昨晚看了《人世间》第二集，我开始思考繁衍这个事！为了孕育一个生命，而丢掉另外一个生命，真的值得吗？拥
西游记花上的露珠
孙悟空是石猴出世的，在它出生时，把玉皇大帝都惊动了，它又当上了美猴王。它出门求学，要学一个长生不老之术，它在班里面不安静，师傅敲了三下，三更半夜跑到师傅那，师傅教了它七十二变。因悟空卖弄被师傅赶出家门。图片发自百度悟空去龙王那里索取兵器。龙王不好推辞就给了他一把大刀，悟空不会使刀，又给了一个九股叉来，悟空觉得特别轻，不要。又给了一个方天戟，悟空觉得不趁手，又不要，又给了金箍棒，悟空才要。图片发自A
3.5增值税｜纳税人划分标准一缕雨露
一般规定:年应征增值税销售额500万元及以下为小规模纳税人，其余则为增值税一般纳税人。特殊规定:1、超过标准的其他个人按小规模纳税人纳税；2、超过标准但不经常发生应税行为的单位和个体工商户，以及非企业性单位、不经常发生应税行为的企业，可以选择按照小规模纳税人纳税。这条规定里面，不经常发生应税行为的单位指哪些单位呢？感觉这个分类有重合的纳税人，按说法律应该是很严密的，肯定不会出现这么低级的错误。即使
外卖优惠券推广如何赚钱？氧惠APP创始邀请码000068赚钱攻略详解！浮沉导师
随着外卖行业的快速发展，外卖优惠券成为吸引用户和推广平台的重要利器。而氧惠APP作为一款提供优惠券和折扣信息的应用，在大众中备受关注。那么，外卖优惠券推广是否真的能赚钱？本文将通过对氧惠APP的创始邀请码000068赚钱机制进行详细解读，探讨外卖优惠券推广的赚钱可能性。一、外卖优惠券推广赚钱原理外卖平台通常会推出优惠券活动，吸引用户下单消费。通过在氧惠APP上获取外卖优惠券，并分享给新用户注册下单
C++中vector和list的优缺点对比以及deque WangJiaLeLeLeLe c++开发语言数据结构
两者基本上优缺点互补vector：优点：1、尾插尾删效率不错，支持高效下标随机访问2、物理空间连续，所以告诉缓存利用效率高缺点：1、空间需要扩容，扩容有代价2、头部和中间插入删除效率低list优点：1、按需申请释放空间，不需要扩容2、任意位置插入删除缺点：1、不支持下标的随机访问vector和list的缝合怪——deque开辟若干个数组（buff），还有一个中控数（是一个指针数组ptr），会试图把
工厂经营日记7月9日吴桂昌专注阀片定制30年
7月9日非常感恩，感谢。各位伙伴，各位神灵的庇佑。经营企业的一天都有各方面不同的事情发生。非常感恩。我们可以每一天。看到新的一天的变化。阿昌是一个非常乐观的人，这时候有感而出，肯定有经历过很多事情。在。经营人生的道路上，我相信也是一样的道路。一帆风顺。就代表有挫折，有成功，有喜悦。这样才是完整的人生。企业同样如此。感恩遇见，加油！
2022-09-08 d17210c81c28
Sfbt将赞美和重新建构合称为正向眼光重新建构是xsFTP，一个很重要的技巧与精神，重新建构指的是我们机遇事情，不会只有一个面向，从不同看待事情的眼光看到当事人的特质优点，动机，努力引导他看见事情的其他面向，进而拓展当事人的思考，引发不同的行动，重新建构的另外一个意义是我们了解孩子描述的事情并重新诠释后，赋予相同的时间不同，且正向的意义，看到了事件本身所带来的正面价值，进而形成新的解决方案或是行动
假如我是地主 leizw
假如我是地主，我最大的资源就是有地，我要如何做好一个地主？怎么用好这一片地？没有炒房团，房子的投资收效甚微，且风险较大，就先不想了。养羊不错，只要一块地就好，把羊一放，自己去吃，羊养大了，有羊奶喝，有羊肉吃。既然是地主了，当然得雇用一个羊倌但羊倌必须保证，带出去多少只羊，给我带回来多少只羊。不允许羊倌让羊群部分走失，或者被狼吃了。如果还没有数字与进制，要如何确定羊群离开时和回来时之间的大小关系呢，
奥运会观后感刘博文123456
今天我们看了奥运会，看了我们有很多感想，想说我们中国是最强的，但是我们在跑步和跨栏上有点落后，因为美国人是黑色的人种的爆发力很强，所以我们中国人也要加油，以后一定要要超过美国人奥运会，每次都拿第一，我看了一下北京奥运会，那是一个恐怖呀，那有什么鬼呀，我办的台上一个人也没有，只有几个人，然后下面还有表现的很恐怖的人，我看的毛骨悚然的，现在晚上我都不敢睡觉了，再想想我们中国的奥运会，那是一个精彩烟花，
C语言易错点（二） WangJiaLeLeLeLe c语言开发语言
目录一、两个转义字符二、除法和取模操作符三、大小端字节序四、printf的传参五、位段六、枚举八、预处理、编译、链接九、写一个宏，交换一个数二进制位的奇偶位十、offsetof宏的实现——计算某结构体相对于首地址的偏移量十一、C语言头文件中的ifndef/define/endif的作用？十二、动态内存错误一、两个转义字符1、/060，‘/’跟三位数字表示将这个数字转为八进制数字，其对应ASCII码
vector各种接口的模拟实现 WangJiaLeLeLeLe 前端 c++c语言 vector
写在前面：其实相比string，vector的接口就要简单许多而且更加规范清晰，但是这里也有我们需要注意的问题，一个是浅拷贝的问题，另一个就是迭代器失效首先是浅拷贝，这里最容易给自己挖坑的就是在reserve（）函数的时候，直接用memcpy（）去一个字节一个字节的拷贝，一但调用时使用的是自定义类型，就会因为浅拷贝崩溃（例如vector）；其次是迭代器失效，一个是insert，一个是erase，i
风雪夜归人叶枫82
2022年2月16日晚，农历正月十六。我在店里值班到8:30，听着店外房檐下滴滴答答落下的水声，越来越急，越来越大。街上的行人打着伞，急匆匆赶路。已经一个多小时没人进店了，看着实在没人进店，便提前下了班。走在路上，看着路面湿漉漉的，初以为是下雨。抬头一看，在昏黄的路灯周围，雪花在漫天飞舞，风带着雪花从空中纷纷扬扬的落下来，有大片的，有小块的，飞来飞去，到了地上便化成了水。这才知道，在这苍茫的夜幕下
他2 cccxccc
但是现在呢？他完全变了。他长成了一个矮个子的青年，棱角分明的一圈发际线之上是一头茂盛的黑发，身上还没来得及长一块赘肉，抬起胳膊洗头时，肩膀和胳膊上都显出鼓鼓的肌肉，白白的。他的样貌没什么大变化，只是眉毛加深了。唯一让人看了觉得别扭的是他的鼻子。薄薄的两片小鼻翼，鼻尖下方往外伸得很长，像用刀不小心削多了之后安上的。他的再也不上天入地了，只是遗留了离群索居的毛病。除此之外他简直是一无可奇之处。老邻居跟
人人皆有神功：AI如何改变程序员的江湖地位？ nbsaas-boot 人工智能大数据
在人类的历史中，每一次技术革命都重新洗牌了社会的力量结构：工业革命带来机器力量的爆发，信息时代成就了程序员的黄金时代。而如今，随着通用人工智能（AGI）和大模型技术的突飞猛进，我们正在步入一个**“人人皆有神功”的AI江湖时代**。当AI成为每个人的智能助手，编程是否还重要？程序员将何去何从？本文将以“武林江湖”的隐喻，探索AI时代的技术平权与社会重构。一、技术平权真的来了吗？过去，程序员之所以被
SQL 常用版本语法概览：标准演进与关键语法分析
一、引言SQL（StructuredQueryLanguage，结构化查询语言）是关系型数据库系统的核心语言，自1986年成为ANSI和ISO标准以来，经历了多次版本演进，不断增强语义表达能力以适应复杂的企业数据需求。随着数据库技术的不断发展，各大数据库厂商（如Oracle、SQLServer、PostgreSQL、MySQL等）在实现标准的基础上扩展了大量方言语法，使得掌握SQL的标准语法版本成
二维码在教学中的应用小尘老师
7月7日，阅读《现代极简教育技术》P174-180模块二主要是将二维码在教学中的灵活应用。二维码在生活中非常常见，大部分人看到都知道那是二维码。但真要问什么是二维码，应该有很多人跟我一样是有点懵的。没想到二维码背后还有这么多的知识。真的是长见识了。关于教师如何设计二维码，黎教授也分成5个小点教大家。主要是网页，PPT，word文件，图片音视频，其他二维码。黎教授介绍的方法中，草料二维码我用的是最多
缘万里长征
听说城里来了个年轻的道士，背着一把桃木剑，手持幡旗，上面写着知阴阳晓八卦，算命测祸福；上天地改生死，号称陈半仙。他算卦有一个规矩，那就是每天只算三副卦，每卦只收五文钱，而且是他主动算别人，算完即止马上收摊。因为其卦象极为灵验，因此前来求卦的人络绎不绝。那天我走在街上，突然被他叫住。“小姐，算一卦吧！”我看了看四周，此时只有我一个人，我不敢相信自己的耳朵，指了指自己：“先生是在说我吗？”“是的，要是
小架构step系列14：白盒集成测试原理秋千码途集成测试 java 架构
1概述这里的白盒测试是指开发编写测试代码来进行测试，集成测试是指从Controller开始对http接口调用的整个流程进行测试。这个流程就是对一个http请求的响应流程，正常运行的时候是通过springboot内嵌的tomcat来启动一个webserver来监听http请求，然后响应该http请求。在测试的时候，如果也需要启动一个webserver来监听请求，那么测试就更加困难了一些。还好spri
户外作业旺旺_2298
初秋，仍然没有一丝凉意。租金，每个月还得支付。汗水已渗透了我衣服，也合许身上的水份流失过多，部分Na一K丢失，于是手腿部分肌肉发生挛，为了完全任务，克服重重困难，终于战胜了自已。
Redis面试精讲 Day 3：Redis持久化机制详解在未来等你 Redis面试专栏 Redis 面试题持久化 RDB AOF 数据库缓存
【Redis面试精讲Day3】Redis持久化机制详解文章标签Redis,面试题,持久化,RDB,AOF,数据库,缓存,后端开发,分布式系统文章简述本文是"Redis面试精讲"系列第3天内容，深入解析Redis持久化机制这一面试高频考点。文章从基础概念出发，详细剖析RDB和AOF两种持久化方式的实现原理、触发机制和优缺点对比，提供多语言客户端操作示例和性能测试数据。针对"如何选择持久化策略"、"A
《金字塔原理》读后感 shuaigefeng
这本书对于那些考虑问题经常一团乱，做事情想到哪做到哪儿经常出现返工的人来说非常值得一看，这本书分别从表达、思考、解决问题以及演示四个方面帮读者建立逻辑思维，本书里面提到的逻辑性的做法乍一看觉得很简单，好像自己平时做事就是按照这个方式来的，但是实际上在一个陌生的行业或者处理一个不熟悉的事情，思考以及处事的方式经常会按照自己一种想当然的方式就开始，这个时候就经常会出现很多时候感觉大脑是糊的，事情也要一
淘宝搜同款商品怎么操作？同款产品如何搜索？氧惠导师
在淘宝这个平台上面，大家可以购买商品，而且后续的方式有很多种，大家在街上看到一件商品自己喜欢，可以拍下照片直接去淘宝搜同款，淘宝搜同款怎么操作?➤推荐网购薅羊毛app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！）➤由于信息差的关系，很
找到自己的闪光点糖果书屋
每个人都有自己的长处和短板，我们只要挖掘出自己的闪光点，辛勤耕种，总有一天会成长为参天大树。以前看见过一个故事，一个年轻小伙子，去面试工作时，什么都不感兴趣，都没有兴趣，但是却写了一手好字，就因为主管发现了他的好字，提醒他，从此他充分发挥他自己的优势，苦心专研，开拓了文学领域，最终成为一个大文豪。想想我们自己也应该有自己的长处，如果想改变，就要充分的发挥自己的长处，并加以改进，给自已找一个榜样，树
C ++ 中的指针和引用的区别 ice.Ynov23 C++学习笔记 c语言 c++算法
目录C++中的指针和引用的区别1.定义与初始化2.内存与地址3.操作灵活性4.使用场景5.语法对比6.代码示例7.关键区别总结C++中的指针和引用的区别1.定义与初始化指针：可以声明时不初始化（但建议初始化为nullptr避免野指针）可以指向不同的对象（重新赋值）使用*声明和解引用 intx=10; int*p=&X; p=nullptr;引用：必须初始化，且一旦绑定到一个对象后不能更改（不可重新
函数接口设计：为什么需要封装数据结构？ ice.Ynov23 数据结构 C++学习笔记算法开发语言
文章目录背景1.提高代码可读性和可维护性问题表现解决方案2.减少参数传递的复杂性问题表现解决方案3.便于扩展和修改问题表现解决方案4.增强数据完整性问题表现解决方案5.降低耦合性6.提高性能（间接优化）何时选择封装数据结构？不适合封装的场景总结对比最佳实践背景在函数接口设计中，我们会面临传递大量参数的场景，此时你是会选择传递多个单独的参数？还是选择封装数据结构（如结构体、类或对象）？1.提高代码可
桌面问题 —— 解决 Windows 桌面部分快捷方式图标变为空白的问题 ice.Ynov23 Windows Solutions windows
解决Windows桌面部分快捷方式图标变为空白的问题第一种文件没有消失的情况打开本地应用数据存储位置（C:\Users\用户名\AppData\Local）快捷打开方式：按下Windows+R键，在弹出的运行对话框中输入%localappdata%，回车确定。在打开的本地应用数据存储窗口中，找到并删除Iconcache.db文件。打开任务管理器，找到Windows资源管理器。右键单击Windows
淘宝在哪领券？淘宝的品类福利券怎么领？氧惠购物达人
淘宝领券的步骤如下：领购物大额优惠券、赚返利佣金用氧惠~氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万单）氧惠是公认的返利最好用的软件。注册即可享受高补贴+0撸+捡漏等带货新体验。氧惠邀请码888999，送万元推广大礼包，教你如何1年做到百万团队。打开淘宝APP，进入首页。在首页
LED显示屏尺寸规格及计算方法 BinaryStarXin 网络工程师提升计划3 信号处理信息与通信网络协议 wireshark 网络安全弱电工程
led屏幕在生活中，随处可见，显示屏、广播屏等等，但是led尺寸怎么计算的，你知道吗？今天我们一起了解一下led屏幕尺寸的计算方法。一、点间距的计算1、各单元板常见型号及尺寸LED屏普遍是用单元板做的。LED单元板常见型号及尺寸（mm）对应如下：不同的牌子可能会存稍微的差异。2、那么它是如何计算出来的呢？这里面就以p10与p16来举例，因为他们最常见。PH16单个单元板尺寸以P16型号，一般模组的
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc