林书芹

理解RNN和LSTM

- 1. RNN
- - 1.1 RNN结构
  - 1.2 模块 $A$ 的内部结构
  - 1.3 标准RNN的前向传播过程
  - 1.4 RNN的训练方法——BPTT
  - - 1.4.1 chain rule 回顾
    - 1.4.2 BPTT
- 2. LSTM
- - 2.1 Why LSTM
  - 2.2 LSTM结构
  - - forget gate
    - input gate
    - output gate
- 3. pytorch中的RNN 和 LSTM module
- - 3.1 torch.nn.RNN()
  - 3.2 torch.nn.LSTM()
- 4. Reference

本文是台大李宏毅教授ML2020课程笔记。同时参考了其他博客。

网上关于RNN和LSTM的blogs太多了，本文只是摘抄+笔记。

1. RNN

RNN（Recurrent Neural Network）是一类用于处理序列数据的神经网络。所谓序列，通常除了数据维度以外，还存在广义的时间维度，即序列是有顺序的，反应了数据随着时间的变化状态，例如，一串语音信号、一段文本或者一段视频都是序列。

1.1 RNN结构

传统的前馈神经网络包含输入层、输出层和隐藏层，通过激活函数控制输出，层与层之间通过权值相连。神经网络训练的过程即是学习这些权重向量。
与基础的NN不同，RNN不仅有多层，且也有激活函数和权值向量，其最大的区别在于，RNN在同一层的神经元之间也存在权值连接，如下图：

在上面的图中，神经网络的模块， $A$ ，正在读取某个输入 $x_i$ ，并输出一个值 $h_i$ 。循环可以使得数据可以从当前步传递到下一步。
在时间维度上将上图展开：

RNN 可以被看做是同一神经网络的多次复制，每个神经网络模块会把消息传递给下一个。特别注意上述并不是传统NN的多个神经元，而是同一个神经元在时间维度上的展开，其本质还是一个神经元。
RNN的基本结构便是这样，我们可以通过堆叠多个模块 $A$ (其实就是权值矩阵)来实现多层RNN网络。
为了说明方便，我们设定一个slot filling问题，要求给定一句话，如

I would like to arrive Taipei on November 2nd.

机器能够分别出句子中的信息：

Destination:Taipei
time of arrival:November 2nd

据此构建的RNN网络如下：

图中，当 $x^1$ arrive 输入后，模块 $A$ 返回 $a^1$ 并存储在 $A$ 中，当序列的下一个数据 $x^2$ Taipei到达时，模块 $A$ 根据上一次的结果 $a^1$ 和当前的输入 $x^2$ 来决定当前的输出 $a^2$ 和 $y^2$ （ $y^2$ 是根据 $a^2$ 得到的）。

1.2 模块 $A$ 的内部结构

为了更深入理解RNN的具体工作原理以及后面back-propagation 的推导，有必要从数学上知道整个RNN的工作过程。我们将上图RNN的结构更详细的表示成：

这是一个标准的RNN结构图，图中每个箭头代表做一次变换，和之前一样，左侧是折叠起来的样子，右侧是展开的样子。我们可以很清楚的知道模块 $A$ 包含了哪些结构。图中， $x$ 代表输入向量， $U 、 V 、 W$ 代表将要学习的权值矩阵， $o$ 代表输出， $y$ 代表样本给出的确定值（即标签），元素右上角带的 $t$ 代表 $t$ 时刻的状态（或者说，序列中的第 $t$ 个元素）， $L$ 代表损失函数，我们可以看到，损失也是随着序列的推进而不断积累的。

1.3 标准RNN的前向传播过程

有了以上结构，RNN的 feed-forward过程如下。对于 $t$ 时刻，有：
$h^{(t)}=\phi\left(U x^{(t)}+W h^{(t-1)}+b\right)$

这里的 $h^{(t)}$ 和前文例子中的 $a^t$ 一样，只不过来自于不同的资料，数学符号表示不同。

其中 $\phi()$ 为激活函数，一般来说会选择 tanh 函数， $b$ 为偏置。
显然， $t$ 时刻的输出如下：
$o^{(t)}=V h^{(t)}+c$
最终模型的预测输出为：
$\widehat{y}^{(t)}=\sigma\left(o^{(t)}\right)$
其中 $\sigma()$ 为激活函数，通常RNN用于分类，故这里一般用 softmax 函数。

1.4 RNN的训练方法——BPTT

BPTT（back-propagation through time）算法是常用的训练RNN的方法，其实本质还是BP算法，只不过RNN处理时间序列数据，所以要基于时间反向传播，故叫随时间反向传播。BPTT的中心思想和BP算法相同，沿着需要优化的参数的负梯度方向不断寻找更优的点直至收敛，因此仍需要求各个参数的梯度。

1.4.1 chain rule 回顾

考虑函数 $z = f (x, y)$ , 其中 $x = g (t), y = h (t), g (t)$ 和 $h (t)$ 是可微函数, 那么:
$\frac{d z}{d t}=\frac{\partial z}{\partial x} \frac{d x}{d t}+\frac{\partial z}{\partial y} \frac{d y}{d t}$
假设 $\nu)$ 的每一个自变量都是二元函数, 也就是说, $\quad V=g(x, y)$ , 且这些函数都是可微的。那么, $z$ 的偏导数为:
$\begin{aligned} &\frac{\partial z}{\partial x}=\frac{\partial z}{\partial u} \frac{\partial u}{\partial x}+\frac{\partial z}{\partial v} \frac{\partial v}{\partial x} \\ &\frac{\partial z}{\partial y}=\frac{\partial z}{\partial u} \frac{\partial u}{\partial y}+\frac{\partial z}{\partial v} \frac{\partial v}{\partial y} \end{aligned}$

1.4.2 BPTT

观察 1.2 中的结构，需要寻优的参数有三个，分别是 $U 、 V 、 W$ 。与BP算法不同的是，其中 $W$ 和 $U$ 两个参数的寻优过程需要追溯之前的历史数据，参数 $V$ 相对简单只需关注目前，那么我们就来先求解参数 $V$ 的偏导数：
$\frac{\partial L^{(t)}}{\partial V}=\frac{\partial L^{(t)}}{\partial o^{(t)}} \cdot \frac{\partial o^{(t)}}{\partial V}$

因为 $V$ 是与时间无关的参数，所有没有角标 $t$ 。

其中， $L^{t}$ 代表了时刻 $t$ 的损失函数，而总的损失函数是所有时刻的损失函数求和：
$L=\sum_{t=1}^{n} L^{(t)}$
因此，最终损失函数 $L$ 对 $V$ 的梯度如下：
$\frac{\partial L}{\partial V}=\sum_{t=1}^{n} \frac{\partial L^{(t)}}{\partial o^{(t)}} \cdot \frac{\partial o^{(t)}}{\partial V}$
其中， $\frac{\partial L^{(t)}}{\partial o^{(t)}}$ 取决于损失函数的定义， $\frac{\partial o^{(t)}}{\partial V}=h^{(t)}$ 。 $W$ 和 $U$ 的偏导的求解由于需要涉及到历史数据，其偏导求起来相对复杂，我们先假设只有三个时刻，那么在第二个时刻 $L$ 对 $W$ 的偏导数为：
$\frac{\partial L^{(2)}}{\partial W}=\frac{\partial L^{(2)}}{\partial o^{(2)}} \frac{\partial o^{(2)}}{\partial h^{(2)}} \frac{\partial h^{(2)}}{\partial W}+\frac{\partial L^{(2)}}{\partial o^{(2)}} \frac{\partial o^{(2)}}{\partial h^{(2)}} \frac{\partial h^{(2)}}{\partial h^{(1)}} \frac{\partial h^{(1)}}{\partial W}$
同理，该时刻 $L$ 对 $U$ 的偏导数为：
$\frac{\partial L^{(2)}}{\partial U}=\frac{\partial L^{(2)}}{\partial o^{(2)}} \frac{\partial o^{(2)}}{\partial h^{(2)}} \frac{\partial h^{(2)}}{\partial U}+\frac{\partial L^{(2)}}{\partial o^{(2)}} \frac{\partial o^{(2)}}{\partial h^{(2)}} \frac{\partial h^{(2)}}{\partial h^{(1)}} \frac{\partial h^{(1)}}{\partial U}$
在第三个时刻，有：
$\frac{\partial L^{(3)}}{\partial W}=\frac{\partial L^{(3)}}{\partial o^{(3)}} \frac{\partial o^{(3)}}{\partial h^{(3)}} \frac{\partial h^{(3)}}{\partial W}+\frac{\partial L^{(3)}}{\partial o^{(3)}} \frac{\partial o^{(3)}}{\partial h^{(3)}} \frac{\partial h^{(3)}}{\partial h^{(2)}} \frac{\partial h^{(2)}}{\partial W}+\frac{\partial L^{(3)}}{\partial o^{(3)}} \frac{\partial o^{(3)}}{\partial h^{(3)}} \frac{\partial h^{(3)}}{\partial h^{(2)}} \frac{\partial h^{(2)}}{\partial h^{(1)}} \frac{\partial h^{(1)}}{\partial W}$
$\frac{\partial L^{(3)}}{\partial W}=\frac{\partial L^{(3)}}{\partial o^{(3)}} \frac{\partial o^{(3)}}{\partial h^{(3)}} \frac{\partial h^{(3)}}{\partial W}+\frac{\partial L^{(3)}}{\partial o^{(3)}} \frac{\partial o^{(3)}}{\partial h^{(3)}} \frac{\partial h^{(3)}}{\partial h^{(2)}} \frac{\partial h^{(2)}}{\partial W}+\frac{\partial L^{(3)}}{\partial o^{(3)}} \frac{\partial o^{(3)}}{\partial h^{(3)}} \frac{\partial h^{(3)}}{\partial h^{(2)}} \frac{\partial h^{(2)}}{\partial h^{(1)}} \frac{\partial h^{(1)}}{\partial W}$
而为了求出整个损失函数 $L$ 对 $W 、 U$ 的偏导数，我们需要对损失函数求和。观察上式，我们可以发现规律如下：
$\begin{aligned} &\frac{\partial L^{(t)}}{\partial W}=\sum_{k=1}^{t} \frac{\partial L^{(t)}}{\partial o^{(t)}} \frac{\partial o^{(t)}}{\partial h^{(t)}}\left(\prod_{j=k+1}^{t} \frac{\partial h^{(j)}}{\partial h^{(j-1)}}\right) \frac{\partial h^{(k)}}{\partial W} \\ &\frac{\partial L^{(t)}}{\partial U}=\sum_{k=1}^{t} \frac{\partial L^{(t)}}{\partial o^{(t)}} \frac{\partial o^{(t)}}{\partial h^{(t)}}\left(\prod_{j=k+1}^{t} \frac{\partial h^{(j)}}{\partial h^{(j-1)}}\right) \frac{\partial h^{(k)}}{\partial U} \end{aligned}$
其中， $\prod_{j=k+1}^{t}$ 当 $j = k + 1 > t$ 时值为1。
整体的偏导公式就是将其按时刻再一一加起来。可以看出，中间的累乘部分：
$\prod_{j=k+1}^{t} \frac{\partial h^{(j)}}{\partial h^{(j-1)}} = \prod_{j=k+1}^{t} f ^{\prime} \cdot W_{s}$
$f ()$ 代表激活函数，可选 $\tanh$ 或者 $s i g m o i d$ ，而由于这两个函数的导数都非常小（且小于 $1$ ），累乘之后将接近于 $0$ ，从而导致整个梯度接近于零，这种现象被称为梯度消失。
解决梯度消失是非常重要的，否则网络将收敛地很慢，常用的改善方法为：

选取更好的激活函数，例如 ReLU，该函数在大于零时的导数为 $1$ ，这就避免了小数的连乘，一定程度上改善了梯度消失。
改变传播结构。

2. LSTM

2.1 Why LSTM

RNN 的关键之一就是他们可以用来连接先前的信息到当前的任务上。例如，我们有一个语言模型用来基于先前的词来预测下一个词。如果我们试着预测 “the clouds are in the ____” 最后的词，我们并不需要任何其他的上下文 —— 因为下一个词很显然就应该是 sky。在这样的场景中，相关的信息和预测的词位置之间的间隔是非常小的，RNN 可以学会使用先前的信息。但是同样会有一些更加复杂的场景。假设我们试着去预测“I grew up in France… I speak fluent ____”最后的词（…表示中间还有一些其他的句子）。当前的信息建议下一个词可能是一种语言的名字，但是如果我们需要弄清楚是什么语言，我们是需要先前提到的离当前位置很远的 France 的上下文的。不幸的是，正如前文所言，在这个间隔不断增大时，RNN对远处信息的学习能力大幅下降。
因此，Hochreiter & Schmidhuber (1997) 等人于1997年就提出了LSTM 网络，并且在接下来的工作中被许多人改进和推广。LSTM 在各种各样的问题上表现非常出色，现在被广泛使用。它被明确设计用来避免长期依赖性问题。长时间记住信息实际上是 LSTM 的默认行为，而不是需要努力学习的东西。

2.2 LSTM结构

首先回顾一下在RNN的前向传播结构中，模块 $A$ 中的内容可以用数学公式表示为：
$h^{(t)}=\phi\left(U x^{(t)}+W h^{(t-1)}+b\right)$
即通过一个 tanh 层实现重复的模块：

LSTM 同样是这样的结构，但是重复的模块拥有一个不同的结构。不同于单一神经网络层，这里是有四个，以一种非常特殊的方式进行交互：

先来熟悉一下图中使用的各种元素的图标：

在上面的图例中，每一条黑线传输着一整个向量，从一个节点的输出到其他节点的输入。粉色的圈代表 pointwise （对应元素）的操作，而黄色的矩阵就是学习到的神经网络层。合在一起的线表示向量的连接，分开的线表示内容被复制，然后分发到不同的位置。
LSTM 内部的本质还是矩阵向量乘法和激活函数计算，为了方便理解，将 LSTM 的内部结构分成三个门（gate），分别是 input gate、forget gate 和 output gate。图中的 $\sigma()$ 都是指 sigmoid 函数，取值显然是 $0$ 到 $1$ ，用来表示该gate对数据的控制作用，0 代表“不许任何量通过”，1 就指“允许任意量通过”。

forget gate

LSTM 中，模块上方的水平线就代表了这个模块的 memory，即下图的 $C_{t-1}、C_t$ ：

forget gate用来决定上一时刻模块中的 memory 的保留程度

首先 sigmoid 函数的输出为：
$f_{t}=\sigma\left(W_{f} \cdot\left[h_{t-1}, x_{t}\right]+b_{f}\right)$
其中， $W_f、b_f$ 为forget gate 的权值矩阵和向量， $h_{t-1}$ 为上一时刻该模块（神经元）的输出， $x_t$ 为 $t$ 时刻输入。通过 sigmoid 函数的结果 $f_t$ 和上一时刻模块的 memory $C_{t-1}$ 相乘，决定我们会从模块中丢弃什么信息。例如，当我们看到一个长句子新的主语，我们希望忘记旧的主语。

input gate

下一步是确定什么样的新信息被存放在模块中。这里包含两个部分。第一，sigmoid 层决定什么值将要更新。然后，一个 tanh 层创建一个新的向量（memory）， $\tilde{C}_t$ ，会被加入到该模块中。下一步，将这两个信息来产生对状态的更新：
$\begin{aligned} i_{t} &=\sigma\left(W_{i} \cdot\left[h_{t-1}, x_{t}\right]+b_{i}\right) \\ \tilde{C}_{t} &=\tanh \left(W_{C} \cdot\left[h_{t-1}, x_{t}\right]+b_{C}\right) \end{aligned}$
此时输入数据以及处理完毕。这里的 $W 、 b$ 同样代表要被学习的权值矩阵和向量。

output gate

最后在 output gate 中，首先更新模块的 memory，并输出该模块该时刻最终的处理结果 $h_t$ ，：
$\begin{aligned} C_{t}^{\prime} &= i_{t} \cdot \tilde{C}_{t} \\ C_{t} &= C_{t}^{\prime} + f_t \cdot C_{t-1} = i_{t} \cdot \tilde{C}_{t} + f_t \cdot C_{t-1}\\ o_{t} &=\sigma\left(W_{o}\left[h_{t-1}, x_{t}\right]+b_{o}\right) \\ h_{t} &=o_{t} * \tanh \left(C_{t}\right) \end{aligned}$

通过一个 sigmoid 函数来决定该层的输入 $x_t$ 和上一层的输出 $h_{t-1}$ 对该层的输出的影响。而通过一个 tanh 函数对更新后的 memory 进行处理，得到一个在 $- 1$ 到 $1$ 之间的值，两者相乘得到最终的输出部分。

以上便完成了LSTM的cell的计算过程。

3. pytorch中的RNN 和 LSTM module

3.1 torch.nn.RNN()

pytorch中的RNN模块实现了一个多层的RNN结构，其数学表示如下：
$h_{t}=f \left(W_{i h} x_{t}+b_{i h}+W_{h h} h_{(t-1)}+b_{h h}\right)$
其中， $h_t$ 为 $t$ 时刻隐藏层的状态， $x_t$ 为 $t$ 时刻的输入， $f$ 只能是 $\tanh$ 或者 sigmoid 函数。其参数如下：

input_size - 输入 $x$ 中特征的数量，即向量 $x$ 的维度，并不是指序列的长度。必须给定

hidden_size - 隐藏状态 $h$ 的特征数，即隐藏层中节点的个数。必须给定

num_layers - 循环层数，即前文所述的模块 $A$ 向上堆叠的层数，必须给定

nonlinearity - 输出激活函数，可选’tanh’ 或 ‘relu’。默认: ‘tanh’

bias - 如果False，则该层不使用偏差权重 $b_{ih}$ 和 $b_{hh}$ 。默认：True

batch_first – 如果True，则输入和输出张量作为(batch, seq, feature)而不是(seq, batch, feature) 提供。默认：False

dropout - 如果非零，则在除最后一层之外的每个 RNN层的输出上引入一个Dropout层。默认值：0

bidirectional - 如果True，则是双向 RNN。默认：False

网络的输入数据解释如下：

input - 形如 $\left(L, N, H_{i n}\right)$ 的 Tensor 当 batch_first=False，或者 $\left(N,L, H_{i n}\right)$ 的 Tensor 当 batch_first=True.

h_0 - 形如 $num_layers , N , H out ) \left(D * \text{num\_layers}, N, H_{\text {out}}\right)$ 的 Tensor，给出隐藏层的初始状态。

其中：
$input_size H out = hidden_size \begin{aligned} N &=\text { batch size } \\ L &=\text { sequence length } \\ D &=2 \text { if bidirectional }=\text { True otherwise } 1 \\ H_{\text {in }} &=\text { input\_size } \\ H_{\text {out }} &=\text { hidden\_size } \end{aligned}$

网络的输出数据解释如下：

output - 形如 $\left(L, N, D * H_{\text {out }}\right)$ 的 Tensor 当 batch_first=False，或者 $\left(N,L, D * H_{\text {out }}\right)$ 的 Tensor 当 batch_first=True.

h_n - 形如 $num_layers , N , H out ) \left(D * \text{num\_layers}, N, H_{\text {out}}\right)$ 的 Tensor，给出隐藏层的最终状态。

用例：

rnn = nn.RNN(10, 20, 2) # input_size = 10; hidden_size = 20; num_layers = 2
input_ = torch.randn(5, 3, 10) # sequence length = 5; batch size = 3; input_size = 10;
h0 = torch.randn(2, 3, 20) # D = 1; D∗num_layers = 2; batch size = 3; hidden_size = 20;
output, hn = rnn(input_, h0)

最后，关于 input_size 、hidden_size 和 sequence length 这几个量，首先想象一个普通的神经网络如下图，

我们将这个图贴在xz平面，并且向y轴方向复制，那么复制的次数就是序列的长度 sequence length，此时相当于RNN沿着时间维度扩展（权值矩阵相同，因为是复制过去的），而 input_size 就是图中输入层节点的数量，或者说是输入向量 $x_i$ 的维度，hidden_size 就是隐藏节点的个数，例如，在下图中：

图被复制了三次，那么sequence length = 3，而显然 input_size = 3，hidden_size = 5。

3.2 torch.nn.LSTM()

lstm里，层与层之间传递的是输出 $h_t$ ，同一层内传递的细胞状态（即memory） $C_i$ ，导致它和RNN有一些区别。
同理，我们写出LSTM的运算过程如下：
$\begin{aligned} i_{t} &=\sigma\left(W_{i i} x_{t}+b_{i i}+W_{h i} h_{t-1}+b_{h i}\right) \\ f_{t} &=\sigma\left(W_{i f} x_{t}+b_{i f}+W_{h f} h_{t-1}+b_{h f}\right) \\ g_{t} &=\tanh \left(W_{i g} x_{t}+b_{i g}+W_{h g} h_{t-1}+b_{h g}\right) \\ o_{t} &=\sigma\left(W_{i o} x_{t}+b_{i o}+W_{h o} h_{t-1}+b_{h o}\right) \\ c_{t} &=f_{t} \odot c_{t-1}+i_{t} \odot g_{t} \\ h_{t} &=o_{t} \odot \tanh \left(c_{t}\right) \end{aligned}$
其中，各种变量和前文所述一样， $\odot$ 代表 element-wise product。网络的参数如下：

input_size - 输入 $x$ 中特征的数量，即向量 $x$ 的维度，并不是指序列的长度。必须给定

hidden_size - 隐藏状态 $h$ 的特征数，即隐藏层中节点的个数。必须给定

num_layers - 循环层数，即前文所述的模块 $A$ 向上堆叠的层数，必须给定

nonlinearity - 输出激活函数，可选’tanh’ 或 ‘relu’。默认: ‘tanh’

bias - 如果False，则该层不使用偏差权重 $b_{ih}$ 和 $b_{hh}$ 。默认：True

batch_first – 如果True，则输入和输出张量作为(batch, seq, feature)而不是(seq, batch, feature) 提供。默认：False

dropout - 如果非零，则在除最后一层之外的每个 RNN层的输出上引入一个Dropout层。默认值：0

bidirectional - 如果True，则是双向 RNN。默认：False

proj_size - 如果大于 0，将使用具有相应大小投影的LSTM。默认：0

网络的输入数据解释如下：

input - 形如 $\left(L, N, H_{i n}\right)$ 的 Tensor 当 batch_first=False，或者 $\left(N,L, H_{i n}\right)$ 的 Tensor 当 batch_first=True.

h_0 - 形如 $num_layers , N , H out ) \left(D * \text{num\_layers}, N, H_{\text {out}}\right)$ 的 Tensor，给出隐藏层的初始状态。

c_0 - 形如 $num_layers , N , H cell ) \left(D * \text{num\_layers}, N, H_{\text {cell}}\right)$ 的 Tensor，给出cell的初始状态（初始的memory）。

其中：
$input_size H cell = hidden_size H out = proj_size if proj_size > 0 otherwise hidden_size \begin{aligned} N &=\text { batch size } \\ L &=\text { sequence length } \\ D &=2 \text { if bidirectional }=\text { True otherwise } 1 \\ H_{\text {in }} &=\text { input\_size } \\ H_{\text {cell}} &=\text { hidden\_size } \\ H_{\text {out}} &= \text{proj\_size if proj\_size} > 0 \text{ otherwise hidden\_size} \end{aligned}$

网络的输出数据解释如下：

output - 形如 $\left(L, N, D * H_{\text {out }}\right)$ 的 Tensor 当 batch_first=False，或者 $\left(N,L, D * H_{\text {out }}\right)$ 的 Tensor 当 batch_first=True.

h_n - 形如 $num_layers , N , H out ) \left(D * \text{num\_layers}, N, H_{\text {out}}\right)$ 的 Tensor，给出隐藏层的最终状态。

c_n - 形如 $num_layers , N , H cell ) \left(D * \text{num\_layers}, N, H_{\text {cell}}\right)$ 的 Tensor，给出cell的最终状态（最终记忆的memory）。

用例：

rnn = nn.LSTM(10, 20, 2)
input_ = torch.randn(5, 3, 10)
h0 = torch.randn(2, 3, 20)
c0 = torch.randn(2, 3, 20)
output, (hn, cn) = rnn(input_, (h0, c0))

4. Reference

台大李宏毅ML2020课件-RNN (v2) Recurrent Neural Network
https://blog.csdn.net/zhaojc1995/article/details/80572098
链式法则
理解 LSTM 网络
http://deeplearning.net/tutorial/lstm.html
pytorch api
https://blog.csdn.net/lwgkzl/article/details/88717678

和李沐老师学深度学习--2.数据操作部分代码实现（学习笔记）
大家对代码有不懂地方都可以上网去查找，最好是有一定的数据分析基础比较容易理解，李沐老师课程视频链接我放在这里了大家有不懂都可以观看课程进行学习04数据操作+数据预处理【动手学深度学习v2】_哔哩哔哩_bilibili深度学习课程电子书：大家可以使用翻译插件观看书的内容Preface—DiveintoDeepLearning1.0.3documentation深度学习github项目：https:/
目标跟踪领域经典论文解析 ♢.＊目标跟踪人工智能计算机视觉
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！目标跟踪是计算机视觉领域的一个
【微信小程序】关于授权拒绝后处理
一般情况下，微信授权拒绝之后无法再次调用起授权弹框，所以可以通过调用设置权限按钮来打开权限信息下面代码以微信位置权限代码为例：//位置授权exportconstopenPosition=()=>{returnnewPromise((resolve,reject)=>{//获取位置信息scope.userLocation为位置授权属性，如需其他属性可直接替换wx.getSetting({succes
神经网络架构搜索 IJCAST主编进化计算神经网络架构人工智能
InternationalJournalofComplexityinAppliedScienceandTechnology，投稿网址:https://www.inderscience.com/jhome.php?jcode=ijcast,发表论文不收取任何费用，论文平均审稿25天内即可录用。1.神经网络架构搜索方法分类当前，神经网络架构搜索的方法主要可以归纳为以下三类：a.基于强化学习的NAS方法
【图像处理入门】12. 综合项目与进阶：超分辨率、医学分割与工业检测小米玄戒Andrew 图像处理：从入门到专家图像处理人工智能深度学习算法 python 计算机视觉 CV
摘要本周将聚焦三个高价值的综合项目，打通传统算法与深度学习的技术壁垒。通过图像超分辨率重建对比传统方法与深度学习方案，掌握医学图像分割的U-Net实现，设计工业缺陷检测的完整流水线。每个项目均包含原理解析、代码实现与性能优化，帮助读者从“技术应用”迈向“系统设计”。一、项目1：图像超分辨率重建（从模糊到清晰的跨越）1.技术背景与核心指标超分辨率（SR）是通过算法将低分辨率（LR）图像恢复为高分辨率
Densenet模型花卉图像分类深度学习乐园分类数据挖掘人工智能
项目源码获取方式见文章末尾！600多个深度学习项目资料，快来加入社群一起学习吧。《------往期经典推荐------》项目名称1.【基于CNN-RNN的影像报告生成】2.【卫星图像道路检测DeepLabV3Plus模型】3.【GAN模型实现二次元头像生成】4.【CNN模型实现mnist手写数字识别】5.【fasterRCNN模型实现飞机类目标检测】6.【CNN-LSTM住宅用电量预测】7.【VG
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
js递归性能优化啃火龙果的兔子开发DEMO javascript 开发语言 ecmascript
JavaScript递归性能优化递归是编程中强大的技术，但在JavaScript中如果不注意优化可能会导致性能问题甚至栈溢出。以下是几种优化递归性能的方法：1.尾调用优化(TailCallOptimization,TCO)ES6引入了尾调用优化，但只在严格模式下有效：'usestrict';//普通递归functionfactorial(n){if(n===1)return1;returnn*fa
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
memstr 从内存找字符串
#includechar*memstr(char*full_data,intfull_data_len,char*substr){if(full_data==NULL||full_data_len=sublen);if(memcmp(cur,substr,sublen)==0){//foundreturncur;}}cur++;}returnNULL;}intmain(){chara[26]={'
基于Python Anaconda环境，使用CNN-LSTM模型预测碳交易价格的完整技术方案神经网络15044 仿真模型算法机器学习 python cnn lstm
以下是一个基于PythonAnaconda环境，使用CNN-LSTM模型预测碳交易价格的完整技术方案。内容涵盖数据预处理、模型构建、训练优化、预测可视化和结果分析等核心环节，代码与文字说明共计超过6000字。基于CNN-LSTM的碳交易价格预测系统设计与实现一、项目背景与目标1.1碳交易市场概述碳交易作为应对气候变化的重要市场机制，其价格波动直接影响企业减排决策。准确预测碳价（CarbonEmis
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
MATLAB实现WOA-BP鲸鱼优化算法优化BP神经网络多输入单输出回归预测（含模型描述及示例代码） nantangyuxi MATLAB 含模型描述及示例代码算法 matlab 神经网络大数据人工智能深度学习机器学习
目录MATLAB实现WOA-BP鲸鱼优化算法优化BP神经网络多输入单输出回归预测（多指标，多图）1项目背景介绍...1项目目标与意义...2项目挑战...3项目特点与创新...5<
量子机器学习前沿：量子神经网络与混合量子-经典算法软考和人工智能学堂人工智能 #深度学习 Python开发经验量子计算
1.量子计算基础1.1量子比特与量子门importnumpyasnpfromqiskitimportQuantumCircuit,Aer,executefromqiskit.visualizationimportplot_histogram#单量子比特操作演示defsingle_qubit_demo():qc=QuantumCircuit(1)qc.h(0)#Hadamard门创建叠加态qc.rz
Pytorch模型安卓部署 python&java pytorch 人工智能 python
Pytorch是一种流行的深度学习框架，用于算法开发，而Android是一种广泛应用的操作系统，多应用于移动设备当中。目前多数的研究都是在于算法上，个人觉得把算法落地是一件很有意思的事情，因此本人准备分享一些模型落地的文章(后续可能分享微信小程序部署，PyQt部署以及exe打包，ncnn部署，tensorRT部署，MNN部署)。本篇文章主要分享Pytorch的Android端部署。看这篇文章的读者
人工智能-基础篇-5-建模方式（判别式模型和生成式模型）
机器学习包括了多种建模方式，其中判别式建模（DiscriminativeModel）和生成式建模是最常见的两种。这两种建模方式都可以通过深度学习技术来实现，并用于创建不同类型的模型。简单来说：想要创建一个模型，依赖需求需要合适的建模方式来创建这个模型。通常建模方式主要分为两大类。一类是判别式模型，针对输入数据给出特定的输出。如：判断一张图片是猫还是狗，直接学习“猫”和“狗”的特征差异（如耳朵形状、
PyTorch教程：LSTM语言模型的动态量化技术解析怀灏其Prudent
PyTorch教程：LSTM语言模型的动态量化技术解析tutorialsPyTorchtutorials.项目地址:https://gitcode.com/gh_mirrors/tuto/tutorials前言在深度学习模型部署过程中，模型大小和推理速度是两个至关重要的考量因素。PyTorch提供的动态量化技术能够在不显著影响模型准确率的前提下，有效减小模型体积并提升推理速度。本文将深入解析如何对
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
后端开发实习生简历迭代的5个版本，希望能帮你找到实习今天不coding 简历实习后端 Java 大厂暑期实习
后端开发实习生简历迭代的5个版本，希望能帮你找到实习1.0研究生开学时写的第一份简历，主要是对本科做的项目的一些总结。本科主要是以深度学习的项目为主+比赛，开发的技术学的比较少，后端的项目也没有做过。但是凭此找到了一份算法的实习。当时研一还是想走算法工程师的。后面觉得自己不适合，就放弃了。2.0经历过几个月的算法实习和论文折磨之后，决定走后端开发岗了，选择Java为主语言，在B站大学做了一个项目，
【机器学习实战】Datawhale夏令营2：深度学习回顾城主_全栈开发机器学习机器学习深度学习人工智能
#DataWhale夏令营#ai夏令营文章目录1.深度学习的定义1.1深度学习＆图神经网络1.2机器学习和深度学习的关系2.深度学习的训练流程2.1数学基础2.1.1梯度下降法基本原理数学表达步骤学习率α梯度下降的变体2.1.2神经网络与矩阵网络结构表示前向传播激活函数反向传播批处理卷积操作参数更新优化算法正则化初始化2.2激活函数Sigmoid函数:Tanh函数:ReLU函数(Rectified
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

理解RNN和LSTM