哈喽十八子

《word2vec Parameter Learning Explained》论文笔记

word2vec Parameter Learning Explained

Xin Rong([email protected])【致敬】
arXiv:1411.2738v4 [cs.CL] 5 Jun 2016

文章目录

word2vec Parameter Learning Explained
Abstract
1. Continuous Bag-of-Word Model
- 1.1 上下文为单个词 One-word context
- - （1）模型结构
  - （2）输入层 -> 隐藏层
  - （3）隐藏层 -> 输出层
  - （4）模型意义
  - （5）更新方程：隐藏层 -> 输出层
  - - 直观理解
  - （6）更新方程：输入层 -> 隐藏层
  - - 直观理解
- 1.2 上下文为多个词 Multi-word context
2. Skip-Gram Model
- - （1）模型结构
  - （2）输入层 -> 隐藏层
  - （3）隐藏层 -> 输出层
  - （4）损失函数E
  - （5）更新方程：隐藏层 -> 输出层
  - （6）更新方程：输入层 -> 隐藏层
3 Optimizing Computational Effciency
- 3.1 Hierarchical Softmax（Trick 1，分层softmax）
- - （1）模型结构
  - （2）模型理解
  - （3）损失函数
  - （4）梯度更新
- 3.2 Negative Sampling（Trick 2，负采样）
- - （1）损失函数
  - （2）梯度更新
  - （3）优势

Abstract

The word2vec model and application by Mikolov et al. have attracted a great amount of attention in recent two years. The vector representations of words learned by word2vec models have been shown to carry semantic meanings and are useful in various NLP tasks. As an increasing number of researchers would like to experiment with word2vec or similar techniques, I notice that there lacks a material that comprehensively explains the parameter learning process of word embedding models in details, thus preventing researchers that are non-experts in neural networks from understanding the working mechanism of such models.

Mikolov等人提出的word2vec模型及其应用，在近两年引起了广泛的关注。基于word2vec模型学到的单词向量表示，已经被证明具有语义意义，同时在各种NLP任务中也是有帮助的。越来越多的研究人员，希望使用word2vec或类似的技术，（但在同时）我注意到，目前缺乏一份材料，用于全面、详细地解释词Embedding模型的参数学习过程，（这）导致研究者们难以理解这种模型的工作机制，尤其对于不是神经网络专家的研究者。

This note provides detailed derivations and explanations of the parameter update equations of the word2vec models, including the original continuous bag-of-word (CBOW) and skip-gram (SG) models, as well as advanced optimization techniques, including hierarchical softmax and negative sampling. Intuitive interpretations of the gradient equations are also provided alongside mathematical derivations.

本文给出了word2vec模型的参数更新方程的详细推导和解释，包括原始的 连续词袋(CBOW)模型 和 跳跃图(skip-gram, SG)模型，以及先进的优化技术，包括 分层softmax 和负采样。同时提供了梯度方程的直观解释，以及数学推导。

In the appendix, a review on the basics of neuron networks and backpropagation is provided. I also created an interactive demo, wevi, to facilitate the intuitive understanding of the model.

在附录中，回顾了神经网络和反向传播相关基础，同时创建了一个交互式演示——wevi，便于模型的直观理解。

wevi
- http://bit.ly/wevi-online
- https://github.com/ronxin/wevi.git

1. Continuous Bag-of-Word Model

基本结构：

输入词：上下文
输出词：目标词（中心词）

1.1 上下文为单个词 One-word context

我们从Mikolov等人引入的连续词袋模型(CBOW)的最简单版本开始。
We start from the simplest version of the continuous bag-of-word model (CBOW) introduced in Mikolov et al. (2013a).

Mikolov, T., Chen, K., Corrado, G., and Dean, J. (2013a). Efficient estimation of word representations in vector space. arXiv preprint arXiv:1301.3781.

假设每个上下文只考虑一个单词，即给定一个上下文单词后，模型预测一个目标词，就像一个双词模型。
We assume that there is only one word considered per context, which means the model will predict one target word given one context word, which is like a bigram model.

（1）模型结构

$V$ ：输入层维度，单词总数量，单词one-hot编码维度
$N$ ：隐藏层维度，单词Embedding后表示向量的维度
$W$ ： $\times N$ 矩阵（ $V > > N$ ），表示输入层到隐藏层之间的全连接关系。
- 输入矩阵，高且窄
- 可视作查询词作为中心词时的Embedding查询表
$W^{'}$ ： $\times V$ 矩阵（ $N < < V$ ），表示隐藏层到输出层之间的全连接关系。
- 输出矩阵，矮且宽
- 可视作查询词作为上下文时的Embedding查询表

PS: $W^{'}$ 并不是 $W$ 的转置

（2）输入层 -> 隐藏层

对于第k个词，编码为ont-hot向量 $x$ ，即 $x$ 中第k个元素为1，其余元素为0。将其作为模型输入：

$W^T x = W^T_{(k, \cdot)} = W_{(k, \cdot)}^T := v_{w_I}^T \tag{1}$

即 $W$ 可作为（一种）word2vec查询表（Look-Up-Table）：第k个单词（输入词 $w_I$ ）的Embedding向量，就是矩阵 $W$ 的第k行（再转置） $v_{w_I}^T$ 。

其中， $v_{w_I}^T$ 被称为输入向量；可视作输入词作为中心词时候的Embedding。

$x$ 右乘 $W^T$ ，即对 $W^T$ 列变换，由于 $x$ 为one-hot编码（假设 $x_k=1$ ），即取 $W^T$ 某一列（第k列），等同于取 $W$ 某一行（第k行）。

（3）隐藏层 -> 输出层

对于输出层的第j个节点，输出的是一个分数值 $u_j$ ：

$u_j = {W'_{(:, j)}}^T h = :{v'_{w_j}}^T h \tag{2}$

其中 $v'_{w_j}$ 为 $W^{'}$ 的第j列，被称为输出向量；可视作输入词作为上下文时候的Embedding。

分数值 $u_j$ 表示输入词为 $w_I$ 时，其上下文为单词 $w_j$ 的分值，不具有概率意义，即和不为一：

$\sum_{j=1}^{N} u_j \neq 1$

因此，为使得模型输出具有概率意义，需要添加softmax函数，获得条件概率分布：

$prob(w_j|w_I) = \frac{exp(u_j)}{\sum_{l=1}^{V} exp(u_l)} := y_j \tag{3}$

相当于对输出层使用softmax激活函数。上面输入层到隐藏层相当于没有激活函数，为线性关系。

（4）模型意义

整合上面公式，得到条件概率分布：

$prob(w_j|w_I) = \frac{exp({v'_{w_j}}^T v_{w_I})}{\sum_{l=1}^{V} exp({v'_{w_l}}^T v_{w_I})} = y_j \tag{4}$

可理解为，word2vec模型维护了两套向量表示，分别为：

输入向量 —— $v_{w_I}^T$ ，输入词 $w_I$ 的一种向量表示，来源于 $W$ 的行向量；
输出向量 —— $v'_{w_j}$ ，输出词 $w_j$ 的一种向量表示，来源于 $W^{'}$ 的列向量；

从输入词到输出词的条件概率分布，被建模为：输入词的输入向量，与输出词的输出向量，两者之间计算内积，再softmax归一化。其中内积起到一种相似性度量的作用。

PS：可以类比Transformer的Multi-Head Attention中的Scaled Dot-Product Attention，每个单词拥有三套表示：Query, Key和Value.

（5）更新方程：隐藏层 -> 输出层

后面开始推导上述模型的参数更新方程。尽管实际的计算过程并不是按照本节的推导进行的，或者说本节的推导并不实用（具体原因后面会解释，见第3节，通过一些trick或近似，使得模型求解更加实用），但是依然想通过微分推导，获得对最原始模型（未使用trick）的直观理解。

根据Eq(5-7)，

$\Big[p(w_O|w_I)\Big] = log \sum_{l=1}^V exp(u_l) - u_{j*}$

关于 $u_j$ ，对 $E$ 的第1项求导，正好是 $y_j$ （参照Eq3中 $y_j$ 的定义）；对其第2项求导，是 $j = j *$ 的示性函数，于是有Eq8.

Eq9中第二项，参照Eq2中 $u_j$ 的定义和Eq1中 $v'_{w_j}$ 的定义.

于是，基于随机梯度下降，得到 隐藏层 -> 输出层的权重 $w'_{ij}$ 的更新公式Eq10，或表示为向量的形式，即Eq11.

Eq11中，所有词的输出向量都需要更新；对比后面的Eq16，只有输入词的输入向量需要更新。

直观理解

给定一个输入词后，从词表中遍历所有可能的输出词，例如词表中第j个词，检查模型对其概率密度估计 $y_j$ ，并与期望值 $t_j$ （即ground truch）比较。

如果 $y_j > t_j$ ，即估计过高（此处当且仅当 $t_j = 0$ ，即第j个词不是输出词的GT），则需要从 $v'_{w_j}$ 中减去一定比例（学习率）的 $h$ ，让输出词 $w_j$ 的输出向量表示 $v'_{w_j}$ ，远离输入词 $w_I$ 的输入向量表示 $v_{w_I}$ ；
如果 $y_j < t_j$ ，即估计过低（此处当且仅当 $t_j = 1$ ，即第j个词正好是输出词GT），则需要从 $v'_{w_j}$ 中加上一定比例（学习率）的 $h$ ，让输出词 $w_j$ 的输出向量表示 $v'_{w_j}$ ，靠近输入词 $w_I$ 的输入向量表示 $v_{w_I}$ ；
如果两者差不多，变动也相应很小。

再次指出，输入向量表示 $v_w$ 和输入向量表示 $v'_w$ ，是同一单词 $w$ 的两种不同表示方式。

（6）更新方程：输入层 -> 隐藏层

得到 $E$ 关于 $W^{'}$ 的更新公式之后，根据链式法则，后面继续推导 $E$ 关于 $W$ 的更新公式。

Eq12得到 $E$ 关于隐层节点 $h_i$ 的偏导，是预测误差 $e_j=y_j - t_j$ 根据 $w'_{ij}$ 加权求和后的结果，简记为 $EH_i$ .

$E$ 关于隐层所有节点 $h$ 的偏导，可简记为 $E H$ ，是一个N维（列）向量（对应N个隐层节点）。

Eq13为Eq1的另一种表示，便于Eq14的推导表示。

Eq14中，下角标k对应第k个输入词，i对应第i个隐层单元。Eq14可以表示为张量积的形式，得到Eq15.

Eq15中， $\frac{\partial E}{\partial W}$ 为V行N列，x为V行1列，EH为N行1列。

考虑到one-hot向量x的稀疏性（例如 $x_k=1$ ，即 $w_I = W_k$ ）， $\frac{\partial E}{\partial W}$ 中只有一行（第k行）是非零的。

x左乘 $EH^T$ 即对 $EH^T$ 行变换，取其一行，而 $EH^T$ 也只有一行。即创建一个V行N列的零矩阵，再将 $EH^T$ 复制到其第k行。

因此， $W$ 中仅有一行会被更新到，即第k行，即仅输入词 $w_I$ 对应的那一行会更新；更新方式为向负梯度方向移动，步长为一定比例（学习率）的 $x_k \cdot EH^T = EH^T$ 。于是有Eq16。

除了输入词 $w_I$ 之外，其他词 $\neq w_I$ 的输入向量 $v_w$ 不作更新。

对比前面的Eq11，所有词的输出向量都需要更新。

直观理解

直观的，向量 $E H$ 是词汇表中所有单词输出向量的加权和，权重系数为预测误差 $e_j=y_j - t_j$ ，于是Eq16可以被理解为，将词汇表中每个词的输出向量，按照一定比例，叠加到输入词的输入向量上。

如果词 $w_j$ 是输出词的概率被高估，即 $y_j > t_j \Rightarrow e_j > 0$ ，输入词 $w_I$ 的输入向量将趋向于远离词 $w_j$ 的输出向量；
如果词 $w_j$ 是输出词的概率被低估，即 $y_j < t_j \Rightarrow e_j < 0$ ：输入词 $w_I$ 的输入向量将趋向于靠近词 $w_j$ 的输出向量；
如果估计的差不多，即 $y_j \approx t_j$ ：输入词 $w_I$ 的输入向量变化很少，所受影响不大；
对于某个词 $w_j$ ，其估计误差 $e_j$ 越大，这个词对于上述输入词 $w_I$ 的输入向量的叠加效果，将起到越大的影响；

当我们使用训练语料库，生成 上下文-目标词对，迭代更新模型参数时，（上面提到的）向量之间的影响会逐渐累积。
As we iteratively update the model parameters by going through context-target word pairs generated from a training corpus, the effects on the vectors will accumulate.

可以想象，某个单词w的输出向量，被其 共现邻居 的输入向量前后拖动，就像有一条绳子一样，连接在单词w和它的相邻词的表示向量中间。
We can imagine that the output vector of a word w is dragged" back-and-forth by the input vectors of w’s co-occurring neighbors, as if there are physical strings between the vector of w and the vectors of its neighbors.

类似地，输入向量也可以被认为是被许多输出向量拖动的。
Similarly, an input vector can also be considered as being dragged by many output vectors.

这种解释可以让我们想起重力或者受力分析图。
This interpretation can remind us of gravity, or force-directed graph layout.

每条虚拟绳子的平衡长度，与关联词对之间的共现强度有关，也与学习率有关。

The equilibrium length of each imaginary string is related to the strength of cooccurrence between the associated pair of words, as well as the learning rate.

经过多次迭代，输入向量和输出向量之间的相对位置，最终将达到稳定。
After many iterations, the relative positions of the input and output vectors will eventually stabilize.

1.2 上下文为多个词 Multi-word context

CBOW模型：多个输入词，如Fig2。

隐层单元：不再是直接从输入词的输入向量中复制（参照Eq1中，ont-hot编码的x右乘矩阵 $W$ ），而是对C个输入词的输入向量计算平均值，于是得到Eq(17-18)。

损失函数：Eq21，与Eq7基本相同。Eq21对Eq7中的 $u_j$ 项进行了展开，便于说明隐层单元 $h$ 的计算存在区别。

更新方程：

Eq22: 隐藏层 -> 输出层，和Eq11保持一致。输出矩阵 $W^{'}$ 的每一个元素都要更新。
Eq23：输入层 -> 隐藏层，和Eq16相似，区别是需要将梯度平均分配到C个输入词的输入向量上。

2. Skip-Gram Model

和CBOW相反，基本结构：

输入词：目标词（中心词）
输出词：上下文

（1）模型结构

（2）输入层 -> 隐藏层

Eq24: 和CBOW相同，对比Eq1；

（3）隐藏层 -> 输出层

Eq25: C个多项式分布。和CBOW相似，对比Eq3；
Eq26: Softmax之前的输出节点（分值），对比CBOW的Eq2;

（4）损失函数E

Eq29: 可视作按照Eq7对多个输出词 $w_c$ 分别计算损失 $E_c$ ，再累加求和，对比CBOW的Eq7（单词上下文）和Eq21（多词上下文）；
Eq30：由于Eq29中最终是求和关系，于是 $\frac{\partial E}{\partial u_{c,j}} = \frac{\partial E_c}{\partial u_{c,j}}$ ，与CBOW的Eq8相同。
Eq31: 定义V维向量 $E I$ ，作为 c个输出词上的总误差，便于后续表示；

便于理解的，Skip-Gram中的 $EI_j$ ，对应CBOW中的 $e_j$ ；

相当于Skip-Gram的每个输出节点（例如第j个节点），有C个输出误差 $e_{c,j}$ ， $EH_j$ 对其无差别求和，从C维向量压缩到了1维标量；

（5）更新方程：隐藏层 -> 输出层

Eq(32-34)，依次类比CBOW的Eq(9-11)；其中Eq11(单词上下文)和Eq22(多词上下文)基本一致。

便于理解的，Skip-Gram中的 $EI_j$ ，对应CBOW中的 $e_j$ ；

（6）更新方程：输入层 -> 隐藏层

Eq35，类比CBOW的Eq(12-16)的推导过程;
Eq36，类比CBOE的Eq12中对 $EH_i$ 的定义。

便于理解的，Skip-Gram中的 $EI_j$ ，对应CBOW中的 $e_j$ ；

3 Optimizing Computational Effciency

到目前为止，我们讨论的模型(“bigram”模型、CBOW和skip-gram)都是原始形式，没有应用任何优化技巧，来提高训练效率。
So far the models we have discussed (“bigram” model, CBOW and skip-gram) are both in their original forms, without any effciency optimization tricks being applied.

对于所有这些模型，词汇表中的每个单词都有两个向量表示：输入向量 $v_w$ 和输出向量 $v_w$ 。
For all these models, there exist two vector representations for each word in the vocabulary: the input vector $v_w$ , and the output vector $v_w$ .

学习输入向量很方便，但是学习输出向量（的代价）是非常昂贵的。
**Learning the input vectors is cheap; but learning the output vectors is very expensive. **

从更新方程(22)和(33/34)，我们可以发现,为了更新 $v'_w$ ,对于每个训练实例,我们必须遍历词汇表中的每个单词 $w_j$ ，计算净输入 $u_j$ （打分分值），概率预测值 $y_j$ （或者 $y_{c,j}$ ，对于skip-gram），其预测误差 $e_j$ （或者 $EI_j$ ，对于skip-gram)，最后利用其预测误差，更新其输出向量 $v'_j$ 。

From the update equations (22) and (33), we can find that, in order to update $v'_w$ , for each training instance, we have to iterate through every word $w_j$ in the vocabulary, compute their net input $u_j$ , probability prediction $y_j$ (or $y_{c,j}$ for skip-gram), their prediction error $e_j$ (or $EI_j$ for skip-gram), and finally use their prediction error to update their output vector $v'_j$ .

为每个训练实例的所有单词，进行这样的计算是非常昂贵的，导致其很难适用于 大型词汇表 或 大型训练语料库 的情况。
Doing such computations for all words for every training instance is very expensive, making it impractical to scale up to large vocabularies or large training corpora.

为了解决这个问题，直觉上，对于每个训练实例，应该限制必须更新的输出向量的数量。
To solve this problem, an intuition is to limit the number of output vectors that must be updated per training instance.

为了实现这一目标，一种优雅的方法是分层softmax；另一种方法是通过采样，这将在下一节中讨论。
One elegant approach to achieving this is hierarchical softmax; another approach is through sampling, which will be discussed in the next section.

这两种技巧，都只优化了输出向量更新的计算方式。在我们的推导过程中，我们关心三个值:
Both tricks optimize only the computation of the updates for output vectors. In our derivations, we care about three values:

$E$ ：新的目标方程（损失函数）—— the new objective function;
$\frac{\partial E}{\partial v'_w}$ ： 输出向量的新的更新方程 ——the new update equation for the output vectors; and
$\frac{\partial E}{\partial h}$ ：预测误差的加权和（参照Eq12），用于（将梯度）反向传播更新输入向量——
the weighted sum of predictions errors to be backpropagated for updating input vectors.

3.1 Hierarchical Softmax（Trick 1，分层softmax）

（1）模型结构

分层Softmax是一种高效的计算softmax的方式(Morin and Bengio, 2005; Mnih and Hinton, 2009).

Mnih, A. and Hinton, G. E. (2009). A scalable hierarchical distributed language model.
Morin, F. and Bengio, Y. (2005). Hierarchical probabilistic neural network language model.

用二叉树来示词汇表中的所有单词；
每个单词一定是树的叶节点，共V个单词（即V个叶节点）；
内部点共V - 1个；
对于每一个叶节点，存在唯一一条从根节点到该叶节点的路径，这条路径用来估计叶节点对应单词（为输出词）的概率。

分层softmax模型中，并没有为每个单词维护一个输出向量，而是为每个内节点维护一个输出向量 $v'_{n(w, j)}$

便于理解的，借助树的结构，将每个单词建模为不同尺度的表示的逐级叠加，粗粒度的表示（靠近根节点）被多个单词共用。

输出词的概率分布被建模为Eq37：

其中，

$L (w)$ ：【标量】从单词w对应的叶节点，到根节点的路径长度，例如Fig4中 $L(w_2) = 4$
$n (w, j)$ ：【节点】从根节点，到单词w对应的叶节点，这条路径上的第j个节点（路径唯一）；
$c h (n)$ ：【节点】节点 $n$ 的左孩子节点；
$v'_{n(w,j)}$ ：【Embedding向量】内节点 $n (w, j)$ 的Embedding表示（输出向量）；
$h$ ：隐层节点输出，参照Eq1, Eq13, Eq18
$\llbracket x \rrbracket$ ：x为真/假的示性函数，真为1，假为-1，；参照Eq38;

（2）模型理解

例如，想要计算输出词是 $w_2$ 的概率分布，于是从根节点开始，向叶节点方向进行随机游走（以某种概率策略）。对于每一个内部节点，有两种选择：

移动向左孩子节点，对应概率为Eq39;
移动向右孩子节点，对应概率为Eq40;

PS：不是所有的二叉树，都能保证每个内节点都有两个子节点，但霍夫曼二叉树（binary Huffman tree）能够保证；
理论上，所有类型的二叉树都能用于分层Softmax，但word2vec为了快速训练，还是选用了霍夫曼二叉树（binary Huffman tree）。

参照Fig4，最终能够到达 $w_2$ 对应的叶节点的概率为：Eq(41, 42)；可作为Eq37的一个示例。

同时不难证明，所有词的概率之和为1，即Eq43.

实际上，树的结构，实现了概率“1”的多级拆分，但总量保持不变。

（3）损失函数

以CBOW模型为例，对于Skip-Gram只需简单修改。

为便于表示，对符号进行简化：Eq44, Eq45
对于一个训练实例，损失函数：Eq46.（不难理解，参考Eq7, Eq19, Eq27）

（4）梯度更新

推导不难理解。

Eq51中， $\sigma({v'_j}^T)-t_j$ 可视作内节点 $n (w, j)$ 上的预测误差。

训练过程可理解为，从树结构的不同层次上，训练内节点的输出向量，使之逐渐拥有判断向左（孩子节点）还是向右（孩子节点）移动的能力。

对于Skip-Gram，需要稍作修改：将C个单词的损失（Eq46）和梯度（Eq50）进行叠加，参考Eq29, Eq32.

梯度反向传播：

基于更新方程，可以看到分层softmax（第一个trick）的改进和优势：

对于每一个训练样例（中心词），计算复杂度从 $O (V)$ 降低到了 $O\Big(log(V)\Big)$ ，可以显著加快训练速度；
同时，模型参数却基本保持一致，输出向量个数仅从V减少到了V-1（即模型容量，或拟合复杂函数的能力，基本没有降低）；

个人理解：分层softmax采用分而治之的思想。对于每个内节点 $n$ ，以其输出向量 $v'_n$ 为法线的超平面，将Embedding所在的N维空间切分为两个子空间。从根节点到某叶子结点的唯一一条路径上，有L个节点，表示对整个输出向量空间依次进行L次切分，相当于通过二分法逐步完善概率空间。

一个疑问：类比决策树，基于多种“纯度”指标，对子节点进行分裂，从而同一子树上的节点，具有一定相似性。但对于本文分层softmax 中使用的二叉树，单词和叶节点的对应关系，是否在训练过程中会被调整和优化？或者说，同一子树上的节点对应的单词，是否具有相似性？相似性是如何保证的？可能需要再看下参考文献、霍夫曼二叉树等相关资料。

3.2 Negative Sampling（Trick 2，负采样）

相比于分层softmax，负采样思想的对问题的处理，更加简单直接：

既然问题的难点是，每一轮迭代中，有太多输出向量需要更新，那么就对之简化，只更新一部分（一个采样）就可以了。

显然，真正的输出词（Ground Truth, 正样本）肯定需要被采样到，并被更新到；于是，只需要再采样少量的负样本就可以了。

（负样本）采样的概率分布，可以被根据经验，随机选取，称作噪声分布，记作 $P_n(w)$ 。

（1）损失函数

word2vec中，相比于“使用一种负采样方式，使之完美地契合（训练样本的）后验多项式分布”的方式，作者提出使用Eq55中简化的训练目标，同样可以产生高质量的词表示向量.

其中，第1项对应正样本，第2项对应负样本的采样。

对比Eq21，第1项相同，均为正样本；第2项对应全量的样本（自然包括全量的负样本）。

（2）梯度更新

基于Eq55中简化的优化目标，可推导得到相应的梯度和更新方程 Eq(56-61)：

其中，对更新方程Eq59的直观理解，和Eq11相同。

（3）优势

每轮迭代中，仅采样出少量的负样本进行更新，而未被采样到的负样本则忽略不更新，这减少了大量计算量。
相比于分层softmax，简单粗暴，且效果不差。

你可能感兴趣的:(NLP,论文,深度学习,word2vec,自然语言处理,深度学习)

高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
基于Python的Google Scholar学术论文爬虫实战：最新技术与完整代码解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言学习 scrapy
摘要本文详细介绍如何使用Python构建一个高效的GoogleScholar爬虫系统，包括代理设置、反反爬策略、数据解析与存储等核心技术。文章涵盖最新Python爬虫技术栈（如Playwright、异步IO等），提供完整可运行的代码示例，并讨论学术爬虫的伦理与法律问题。通过本教程，读者将掌握从GoogleScholar批量获取学术论文信息的高级爬虫技术。关键词：Python爬虫、GoogleSch
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
Python爬虫实战：使用最新技术爬取新华网新闻数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 音视频
一、前言在当今信息爆炸的时代，网络爬虫技术已经成为获取互联网数据的重要手段。作为国内权威新闻媒体，新华网每天发布大量高质量的新闻内容，这些数据对于舆情分析、市场研究、自然语言处理等领域具有重要价值。本文将详细介绍如何使用Python最新技术构建一个高效、稳定的新华网新闻爬虫系统。二、爬虫技术选型2.1技术栈选择在构建新华网爬虫时，我们选择了以下技术栈：请求库：httpx（支持HTTP/2，异步请求
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
python+springboot+vue的音乐系统 QQ_511008285 python spring boot vue.js django flask node.js php
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
基于 Python 的图书管理系统（源码）
摘要：本论文详细阐述了利用Python语言开发一个简易图书管理系统的过程。该系统具备图书信息录入、删除、修改、查询以及借阅管理等核心功能，可有效提升图书管理的效率与便捷性。通过阐述系统的需求分析、设计思路、代码实现及测试过程，展示了Python在小型管理系统开发中的应用潜力，为相关领域的软件开发提供了有益参考。关键词：Python编程；图书管理系统；数据结构；代码实现一、引言（一）研究背景随着数字
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四） Superstarimage 文献随笔材质神经网络人工智能扩散模型
AnevaluationofSVBRDFPredictionfromGenerativeImageModelsforAppearanceModelingof3DScenes输入3D场景的几何和一张参考图像，通过扩散模型和SVBRDF预测器获取多视角的材质maps，这些maps最终合并成场景的纹理地图集，并支持在任意视角、任意光照条件下进行重新渲染。样例图如下：在当前时代的技术背景下，生成与几何匹配
超越RAG的搜索革命！分层框架让AI像专家团队一样深度思考 Python_金钱豹人工智能深度学习网络知识图谱大数据
❝一句话概括：与其训练一个越来越大的“六边形战士”AI，不如组建一个各有所长的“复仇者联盟”，这篇论文就是那本“联盟组建手册”。（原论文题目见文末，点击阅读原文可直接跳转至原文链接，Publishedonarxivon03Jul2025,byRenminUniversityofChina）*第一阶段：核心思想概览**论文的动机*在面对“未来的家庭娱乐会是什么样？”或“结合最新的财报和市场趋势，分析
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
SPGAN: Siamese projection Generative Adversarial Networks 这张生成的图像能检测吗优质GAN模型训练自己的数据集人工智能生成对抗网络计算机视觉深度学习神经网络算法
简介简介：该论文针对传统GANs中鉴别器采用硬边际分类导致的误分类问题，提出了基于Siameseprojection网络的SPGAN方法。主要创新点包括：（1）设计Siameseprojection网络来测量特征相似性；（2）提出相似特征对抗学习框架，将相似性测量融入生成器和鉴别器的损失函数；（3）通过相似特征对抗学习，鉴别器能最大化真实图像和生成图像特征的差异性，生成器能合成包含更多真实图像特征
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 人工智能 tensorflow pytorch 神经网络机器学习
在实践中发现和修正RNN训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题，导致数值不稳定。当网络
【深度学习实战】当前三个最佳图像分类模型的代码详解云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习人工智能分类模型机器学习 Transformer EfficientNet ConvNeXt
下面给出三个在当前图像分类任务中精度表现突出的模型示例，分别基于SwinTransformer、EfficientNet与ConvNeXt。每个模型均包含：训练代码（使用PyTorch）从预训练权重开始微调（也可注释掉预训练选项，从头训练）数据集目录结构：└──dataset_root├──buy#第一类图像└──nobuy#第二类图像随机拆分：80%训练，20%验证每个Epoch输出一次loss
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name