liuy9803

深度学习之词向量

一、词向量

自上世纪90年代开始，特征空间模型就应用于分布式语言理解中，在当时许多模型用连续性的表征来表示词语，包括潜在语义分析LSA、隐含狄利克雷分布LDA主题模型。Bengio et al.在2003年首先提出了词向量的概念，当时是将其与语言模型的参数一并训练得到的。Collobert和Weston则第一次正式使用预训练的词向量，不仅将词向量方法作为处理下游任务的有效工具，还引入了神经网络模型结构，为目前许多方法的改进和提升奠定了基础。

词向量（word embedding）又称词嵌入，是自然语言处理NLP中一组语言建模和特征学习的统称，将词汇表的字或词从每个一维的高维空间映射到较低维连续空间，以便计算机进行处理及建模。

词向量是无监督学习少数几个成功的应用之一，优势在于不需要人工标注语料，直接使用未标注的文本训练集作为输入，输出的词向量可以用于下游业务的处理。

词向量用于迁移学习：

（1）使用大的语料库训练词向量（或网上下载预训练好的词向量）；

（2）将词向量模型迁移到只有少量标注的训练集任务中；

（3）用新的数据微调词向量（如果新的数据集不大，则这一步不是必须的）。

最早的词向量使用one-hot representation，词向量的维数为整个词汇表的长度，对于每个词，将其对应词汇表中的位置置为1，其余维度都置为0。这种方法的缺点是：维度非常高，编码过于稀疏，易出现维数灾难问题；不能体现词与词之间的相似性，每个词都是孤立的，泛化能力差。

针对one-hot的两个问题，Hilton 1986年提出Distributed Representation，通过矩阵乘法或神经网络降维，将每个词映射为低维的密集词向量dense vector，把语义分散存储到向量的各个维度中。

神经网络将词汇表中的词作为输入，输出一个低维的向量表示，然后使用BP优化参数。生成词向量的神经网络模型分为两种：一种的目的是训练可以表示语义关系的词向量，能被用于后续任务中，如word2vec；另一种是将词向量作为副产品产生，根据特定任务需要训练得到词向量，如fastText。

矩阵乘法是，将待学习的特征矩阵 $E\in R^{300*10000}$ 乘以词汇表（10000个）中每个词的one-hot编码，如词Man $o^{5391}\in R^{10000*1}$ ，得到词向量 $e^{5391}\in R^{300*1}$ （一般不能像下图那样对词向量每个维度的含义做出解释）。

词向量可以捕捉单词的特征表示，从而实现类比推理 analogy reasoning，如 $e_{man}-e_{woman}\approx e_{king}-e_{queen}$ 。

计算向量相似度可以使用余弦相似度 $sim(u,v) = \frac{u^{T}v}{||u||_{2}||v||_{2}}$ ，或者用欧氏距离（较少），二者的区别在于normalize方式不同。使用t-SNE降维算法将高维数据300维非线性变换为2维从而实现可视化。

词向量类似人脸识别网络最后面的softmax层的特征 face encoding，区别在于图片的数据集可能是海量的，且可以识别未出现过的人脸；而词汇表是固定的，词嵌入也是固定的，未知的词用代替。

注意：虽然词向量是神经网络的输入，但并非第一层输入。第一层是词的one-hot编码，乘以一个权重矩阵后得到才是词向量化表示，而权重在模型训练阶段是可以更新的。从记忆的角度来看，神经网络的连接权值更新是长时记忆，因此词向量的学习可以认为是一种长时学习。

二、语言模型

神经网络语言模型NNLM是统计学意义上的模型，需要求句子的联合概率，模型参数使用极大似然估计得到：对于某个语料库，估计哪个语言模型（什么样的参数）最有可能产生这个语料库，将这个问题分解成许多个小的概率计算的问题，对语料库中所有的词做相同的计数和除法，解出需要的参数，即可得到这个语料库的语言模型。

语言模型在NLP中有重要的地位，在语音识别、机器翻译、自动分词和句法分析等方面有广泛的应用，因为这些模型都会有噪声、有不同的选择，这时就需要知道每种结果的概率，从而做出正确的选择。

词向量模型与语言模型的关系密切，语言模型质量的评估基于其对词概率分布的表征能力。语言模型可以计算任何句子/序列的概率，对于一个合理的句子，语言模型能够给出一个较大的概率；对于一个不合理的句子则给出较小的概率。对于一个有m个词的句子，其联合概率为：

$P(w_{1}, w_{2}, ..., w_{m})=P(w_{1})P(w_{2}|w_{1})...P({w_{m}|w_{1}, w_{2}, ..., w_{m-1})$

直接计算条件概率面临2个重要的问题：参数空间过大、数据过于稀疏，因此引入马尔科夫假设。设语料库中总字数为M， $c(w_{1}, w_{2}, ..., w_{m})$ 为n-gram $w_{1}, w_{2}, ..., w_{m}$ 在语料库中出现的次数，对于n元语言模型n-gram model，根据一个词前面的n-1个词，计算这个词的条件概率：

$P(w_{i}|w_{1}, w_{2}, ..., w_{i-1})=P({w_{i}|w_{i-n+1}, ..., w_{i-1})$

n=1，unigram model：

$P(w_{1}, w_{2}, ..., w_{m})=\prod_{i=1}^{m}P(w_{i})$ $P(w_{i})=\frac{C(w_{i})}{M}$

n=2，bigram model：

$P(w_{1}, w_{2}, ..., w_{m})=\prod_{i=1}^{m}P(w_{i}|w_{i-1})$ $P(w_{i}|w_{i-1})=\frac{C(w_{i},w_{i-1})}{C(w_{i-1})}$

n=3，trigram model：

$P(w_{1}, w_{2}, ..., w_{m})=\prod_{i=1}^{m}P(w_{i}|w_{i-1}, w_{i-2})$ $P(w_{i}|w_{i-1},w_{i-2})=\frac{C(w_{i},w_{i-1},w_{i-2})}{C(w_{i-1},w_{i-2})}$

假设对一个语料库统计，得到下面若干词出现的次数为

基于bigram模型计数得到表格，并根据上面统计得到下表

标准化后得到频率分布

假设已知概率 P(i|~~)=0.25，P(~~|food)=0.6，那么就可以计算句子~~i want chinese food~~的概率为：

为了避免数据溢出、提高性能，通常会对概率取对数后使用加法运算替代乘法运算。

如何选择依赖词的个数n？

更大的n：对下一个词出现的约束信息更多，具有更大的辨别力；

更小的n：在训练语料库中出现的次数更多，具有更可靠的统计信息，具有更高的可靠性。

理论上，n越大越好；经验上，trigram用的最多。尽管如此，原则上能用bigram解决的问题，绝不用trigram（很多词的条件概率为0，数据过于稀疏）。

语言模型评价方法：preplexity（迷惑度/困惑度/混乱度），基本思想是给测试集赋予较高概率值的语言模型较好，迷惑度越小、句子概率越大，语言模型越好。

$PP(W)=P(w_{1}, w_{2}, ..., w_{m})^{-\frac{1}{m}}$

$\mathrm{Chain \: rule:}\; \; PP(W)=\sqrt[m]{\prod_{i=1}^{m}\frac{1}{P(w_{i}|w_{1}, w_{2}, ..., w_{i-1})}}$

NNLM结构：

（1）输入层，使用特征矩阵获得每一个词的分布式表示；

（2）投影层，将n-1个上下文的词向量拼接；

（3）隐藏层，即全连接层；

（4）输出层，使用softmax对P(wi|context)进行分类，类别是所有词的id。

BP时不仅更新输出层、隐藏层的权重，还需要词向量。

优点：使用NNLM模型生成的词向量是可以自定义维度的，维度并不会因为新扩展词而发生改变，而且这里生成的词向量能够很好的根据特征距离度量词与词之间的相似性。

缺点：计算复杂度过大，参数较多。

三、CBOW、Skip-gram

词向量的真正推广源于Google在2013年推出的word2vec工具，可以比之前的方法更快地训练词向量模型。word2vec是一种将词表征为实数值向量的高效算法模型，利用深度学习的思想，使用Distributed Representation的词向量表示方式，通过训练将文本处理为 K 维空间中的向量，向量的相似度可以表示文本语义的相似度。

word2vec模型有两种实现方式

（1）CBOW（Continuous Bag of Words）：以一个词的上下文作为输入，预测这个词本身。

输入层：输入词w的上下文；

投影层：将输入的向量进行求和；

输出层：为Huffman树，以语料中出现过的词作为叶子结点，以各词在语料中出现的次数为权重。假设词汇表V中的词有N个，则树中有叶子结点N个，非叶子结点N-1个（黄色结点）。

目标函数： $L=\sum_{w \in V}\log P(w|Context(w))$

（2）Skip-gram：以一个词作为输入，预测它的上下文。

结构类似CBOW，其中投影层可有可无，因为词w在投影层的加和仍是它本身。

目标函数： $L=\sum_{w \in V}\log P(Context(w)|w)$

对于句子 Hangzhou is a nice city 构造语境与目标词汇的映射关系，即input与label的关系，假设滑动窗口尺寸为1

CBOW的映射关系为：[Hangzhou,a]—>is，[is,nice]—>a，[a,city]—>nice

Skip-Gram的映射关系为：(is,Hangzhou)，(is,a)，(a,is)， (a,nice)，(nice,a)，(nice,city)

这两个模型互为镜像，CBOW适合小型语料，而Skip-Gram在大型语料中表现更好。

对比神经概率语言模型NNLM，二者区别在于：

a. NNLM拼接输入的词向量，word2vec求和后取平均；

b. NNLM有一个隐藏层，word2vec变为投影层；

c. NNLM输出层为线性结构，word2vec为树形结构。

由对比可知，word2vec针对NNLM隐藏层输出层之间的矩阵运算、以及输出层的softmax运算这些计算密集的地方进行了改变，输出层改用Huffman树，根据词频使用Huffman编码，使得出现频率越高的词激活的隐藏层数越少，这样可以有效降低计算复杂度，从而为利用Hierarchical softmax技术奠定了基础。

Huffman树、Huffman编码

Huffman树又称最优二叉树（有序），是带权路径最短的树，权值（词频）较大的结点离根结点较近。带权路径长度，指树中所有叶结点权值乘以其到根结点的路径长度。

假设有n个权值w1, w2, ..., wn，构造有n个叶子结点、n-1个非叶子结点的Huffman树：

（1）将w1, w2, ..., wn 看成是有n棵树的森林（每棵树仅有一个结点）；

（2）将两棵权值最小的树，作为左右子树合并成一棵新树，新树的根结点权值为左右子树的权值和；

（3）从森林中删除上一步选择的两棵树，将合成的新树加入森林；

（4）重复上面两步，直到森林中只剩一棵树为止，即可得到Huffman树。

Huffman编码使用变长编码表对字符进行编码，出现几率高的字符使用较短的编码，反之使用较长的编码。为了使不等长编码为前缀编码，即要求一个字符的编码不能是另一个字符编码的前缀，用每个字符作为叶子结点生成一棵Huffman树，字符出现的频率作为结点权值。Huffman编码后的字符串平均长度最短，可以无损压缩数据。

假设约定词频较大的左结点编码为1，词频较小的右结点编码为0，则：我、喜欢、观看、巴西、足球、世界杯这6个词的Huffman编码分别为：0、111、110、101、1001、1000

Hierarchical Softmax

Huffman树的根结点对应投影层的词向量，内部结点类似神经网络隐藏层的神经元，叶子结点类似softmax输出层的神经元，个数等于词汇表的总词数。由于从投影层到输出层的softmax映射是沿着Huffman树一步步完成的，因此称为 Hierarchical Softmax。

word2vec使用sigmoid函数判别正类或负类，规定左子树为负类（编码1），右子树为正类（编码0）。在某一个内部结点，判断路径是沿左子树还是右子树走的标准就是看哪一边的概率更大，影响因素为输入词向量和当前结点的参数θ。

对于词汇表中任意词w，Huffman树中必定存在唯一条从根结点到词w对应叶子结点的路径 $p_{w}$ ，该路径上有 $l_{w}-1$ 个分支；w经过输入层求和平均后得到根结点词向量 $x_{w}$ ，第j个结点对应的Huffman编码为 $d_{j}^{w} \in \left \{ 0,1 \right \}$ ， $j=2,3,...,l_{w}$ ，对应的参数（不包含叶结点）为 $\theta _{j}^{w}$ ， $j=1,2,...,l_{w}-1$ 。

定义w经过结点j的逻辑回归概率为：

$P(d_{j}^{w}|x_{w},\theta_{j-1}^{w})=\left\{\begin{matrix} \sigma (x_{w}^{T}\theta_{j-1}^{w}) & d_{j}^{w}=0 \\\\ 1-\sigma (x_{w}^{T}\theta_{j-1}^{w}) & d_{j}^{w}=1 \end{matrix}\right.$

$P(d_{j}^{w}|x_{w},\theta_{j-1}^{w})=\sigma (x_{w}^{T}\theta_{j-1}^{w}) ^{1-d_{j}^{w}}\cdot (1-\sigma (x_{w}^{T}\theta_{j-1}^{w}) ) ^{d_{j}^{w}}$

对于某一个目标输出词w，其对数似然为：

$L(w,j)=\log \prod _{j=2}^{l_{w}} P(d_{j}^{w}|x_{w},\theta_{j-1}^{w})$

$=\sum _{j=2}^{l_{w}} [(1-d_{j}^{w})\log \sigma (x_{w}^{T}\theta_{j-1}^{w}) +d_{j}^{w}\log(1-\sigma (x_{w}^{T}\theta_{j-1}^{w}) ) ]$

word2vec使用随机梯度上升方法，每次只用一个样本(Context(w),w)更新梯度，即似然L分别对 $x_{w}$ 和 $\theta _{j}^{w}$ 求导：

$\frac{\partial L(w,j)}{\partial \theta _{j-1}^{w}}\\\\=\frac{\partial }{\partial \theta _{j-1}^{w}} [(1-d_{j}^{w})\log \sigma (x_{w}^{T}\theta_{j-1}^{w}) +d_{j}^{w}\log(1-\sigma (x_{w}^{T}\theta_{j-1}^{w}) ) ]\\\\=(1-d_{j}^{w})[1-\sigma (x_{w}^{T}\theta_{j-1}^{w})]x_{w}-d_{j}^{w}\sigma (x_{w}^{T}\theta_{j-1}^{w})x_{w}\\\\=[1-d_{j}^{w}-\sigma (x_{w}^{T}\theta_{j-1}^{w})]x_{w}$

$\frac{\partial L(w,j)}{\partial x_{w}}=[1-d_{j}^{w}-\sigma (x_{w}^{T}\theta_{j-1}^{w})]\theta _{j-1}^{w}$

使用梯度表达式，通过梯度上升方法更新 $x_{w}$ 和 $\theta _{j}^{w}$ ， $\eta$ 为学习率。由于CBOW模型的投影层是对w周围2c个词向量求和取平均，梯度更新完毕后会用梯度项直接更新原始的各个 $x_{i}$ ，i=1, 2, ..., 2c：

$\theta _{j-1}^{w}:=\theta _{j-1}^{w}+\eta[1-d_{j}^{w}-\sigma (x_{w}^{T}\theta_{j-1}^{w})]x_{w}$

$x_{i}:=x_{i}+\eta\sum_{j=2}^{l_{w}}[1-d_{j}^{w}-\sigma (x_{w}^{T}\theta_{j-1}^{w})]\theta _{j-1}^{w}$

基于Hierarchical Softmax的CBOW / Skip-gram模型伪代码

　　输入：基于CBOW / Skip-gram的语料训练样本，词向量的维度，上下文大小2c，学习率η。

　　输出：Huffman树的内部节点模型参数θ，所有的词向量w。

　　a. 基于语料训练样本建立Huffman树；

　　b. 随机初始化所有的模型参数θ、所有的词向量w；

　　c. 随机梯度上升迭代，对训练集中的每一个样本(context(w),w) / (w, context(w)) 做如下处理：

注意：3和4不能交换顺序，即θ应等贡献到e后再做更新。

Negative Sampling （NEG）

一种更简单的word2vec求解方式，能够提高训练速度并改善所得词向量的质量，是NCE（Noise Contrastive Estimation）的简化版。NEG不再使用Huffman树，而是使用随机负采样方法，假设中心词 $w_{0}$ 及其周围上下文 $context(w_{0})$ 作为正例（ $y_{0}$ =1），通过负采样得到neg个和 $w_{0}$ 不同的中心词 $w_{i}$ , （ $y_{i}$ =0, i=1, 2, .., neg），这样 $context(w_{0})$ 和 $w_{i}$ 就组成了neg个负例。使用这个正例和neg个负例进行二元逻辑回归，更新每个词 $w_{i}$ 对应的模型参数以及词向量。

$P(context(w_{0}),w_{i})=\left\{\begin{matrix} \sigma (x_{w0}^{T}\theta^{wi}), & y_{i}=1,i=0 \\\\ 1-\sigma (x_{w0}^{T}\theta^{wi}), & y_{i}=0,i=1,2,...,neg \end{matrix}\right.$

为了增大正例的概率同时减小负例的概率，需要最大化对数似然函数：

$L=\sum_{i=0}^{neg} [y_{i}\log \sigma (x_{w0}^{T}\theta^{wi})+(1-y_{i})\log(1-\sigma (x_{w0}^{T}\theta^{wi}))]$

类似Hierarchical Softmax使用随机梯度上升法，每次只用一个样本更新梯度，迭代更新 $x_{w0}$ ， $\theta ^{wi}$ ：

$\frac{\partial L}{\partial \theta ^{wi}}=y_{i}(1-\sigma (x_{w0}^{T}\theta^{wi}))x_{w0}-(1-y_{i})\sigma (x_{w0}^{T}\theta^{wi})x_{w0}=(y_{i}-\sigma (x_{w0}^{T}\theta^{wi}))x_{w0}$

$\frac{\partial L}{\partial x_{w0}}=\sum_{i=0}^{neg}(y_{i}-\sigma (x_{w0}^{T}\theta^{wi}))\theta^{wi}$

负采样算法

为了得到neg个负例，需要进行带权采样。设词汇表的大小为V，将一段长度为1的单位线段分成V份，每份对应词汇表中的一个词，高频词对应的线段长，低频词对应的线段短。词汇表中每个词的线段长度为其在语料库中出现的次数，与词汇表中所有词在语料库中出现的次数总和之比：

$\mathrm{len} (w)=\frac{\mathrm{count}(w)}{\sum_{u \in V}\mathrm{count}(u)}$

在word2vec中，分子和分母都取了3/4次幂，这是考虑到既不让经常出现的高频词权重过大，也不让低频词权重过小。neg的取值范围与数据集的大小有关，对于较大的数据集，neg的范围为2~5；对于较小的数据集，范围为5~20。

$\mathrm{len} (w)=\frac{\mathrm{count}(w)^{\frac{3}{4}}}{\sum_{u \in V}\mathrm{count}(u)^{\frac{3}{4}}}$

将长度为1的线段划分成M等份，这里M>>V（M默认值为10^8），这样每个词对应的线段都会划分成对应的小块。在采样时只需要从M个位置中采样出neg个位置，得到的每一个位置对应线段所属的词就是负例词。

基于Negative Sampling的CBOW / Skip-gram模型伪代码

若干源码细节

1）sigmoid函数近似计算

由sigmoid的图形可知，函数在x=0附近y值变化较大，而在x<-6或x>6以外的区域y值基本不变，前者趋于0，后者趋于1。因此在对精度要求不高的情况下，可以使用近似计算的方法，将区间[-6, 6]等分为K份，剖分节点为 $x_{0},x_{1},...,x_{K}$ ，其中 $x_{0}=-6$ ， $x_{i}=x_{0}+ih$ ，步长h=12/K

事先将K个sigmoid函数的值计算好并保存起来，使用sigmoid函数时，采用如下近似公式：

其中k=(x-x0)/h，向上或向下取整均可， $x_{k}$ 表示与x距离最近的剖分节点。

2）词汇表的存储

词汇表通过哈希技术存储，首先设一个长度为vocab_hash_size（默认值为3*10^7）的整型数组，vocab_hash，并将每个分量初始化为-1，然后为词汇表中的词建立如下映射：

$\mathrm{vocab\_hash}[\mathrm{hv}(w_{j})]=j$

其中 $\mathrm{hv}(w_{j})$ 表示词 $w_{j}$ 根据某个公式计算得到的哈希值，当出现 $\mathrm{hv}(w_{i})=\mathrm{hv}(w_{j}),\; \; i\neq j$ 时，采用线性探测的开放定址法来解决冲突，顺序往下查找，直到找到一个未被占用的位置（若已到数组末尾，则从头开始查找）。

3）低频词处理

使用语料库建立词汇表时，并不是每个出现过的词都能被收录到词汇表中。代码中引入了阈值参数min_count（默认值为5），若某个词在语料库中出现的次数小于阈值，则将其从词汇表中删除。

为了提高效率，根据词汇表当前的规模来决定是否需要对低频词进行清理，做法是：预先设定阈值参数min_reduce（默认值为1），如果当前词汇表的规模满足 $\left | V_{\mathrm{current}} \right |>0.7*\mathrm{vocab\_hash\_size}$ ，则从词汇表中删除所有出现次数小于等于min_reduce的词。

4）高频词处理

对于常见的且提供有用信息很少词，如“的”，“了”等，使用subsampling技巧提高训练速度及词向量精度，做法是：给定一个词频阈值参数t，词w将以prob的概率被舍弃，f(w)为w的频率。

$\mathrm{prob}(w)=1-\sqrt{\frac{t}{f(w)}}$

$f(w)=\frac{\mathrm{counter}(w)}{\sum _{u \in V}\mathrm{counter}(u)},w \in V$

word2vec源码中实际使用的公式是：

$\mathrm{prob}(w)=1-\left (\sqrt{\frac{t}{f(w)}}+\frac{t}{f(w)} \right )$

5）窗口及上下文

word2vec中事先设置一个窗口阈值参数window（默认值为5），每次构建context(w)前，先生成一个区间[1, window]上的随机整数c，然后取w前后各c个词即可构成context(w)。

6）自适应学习率

设初始学习率 $\eta _{0}$ （默认值为0.025），每处理10000个词（个数可根据经验调整）后调整学习率：

$\eta =\eta_{0}\left (1-\frac{\mathrm{word\_count\_actual}}{\mathrm{train\_words}+1} \right )$ $\mathrm{train\_words}=\sum_{w \in V}\mathrm{counter}(w)$

其中word_count_actual表示当前已处理过的词个数，+1是为了防止分母为零。此外为了防止学习率过小，设置阈值学习率 $\eta_{min}(=10^{-4}*\eta_{0})$ ，一旦 $\eta$ 小于阈值，则固定学习率为阈值学习率。

7）参数初始化与训练

模型训练采用随机梯度上升法，且只对语料遍历一次，这也是其高效的原因之一。

模型需要训练的参数包括逻辑回归对应的参数向量，以及词汇表中每个词的词向量；前者采用全零初始化，后者采用[-0.5/m, 0.5/m]区间上的随机初始化，m为词向量的长度，具体公式为：

$\frac{(\mathrm{rand}()/\mathrm{RAND\_MAX})-0.5}{m}$

word2vec源码中syn0，syn1和syn1neg这三个一维数组，分布对应Huffman树中所有叶子结点的词向量，非叶子结点的参数向量，以及基于负采样模型中与词相关的参数向量。

四、Glove

GloVe是基于全局词频统计（count-based & overall statistics）的词表征工具，不同于局部上下文建模的word2vec、文档和词共现矩阵分解的LSA，Glove计算简单，认为相比单词同时出现的概率，单词同时出现的概率的比率能够更好地区分单词。

Glove的目标函数为加权最小二乘回归模型，输入为词-上下文同时出现频次矩阵，Xij为词i在词j上下文中出现的次数，如果目标词和上下文是定义在左右各c个词以内的范围，则Xij=Xji；如果定义上下文总是在目标词前一个，则Xij和Xji就不是对称的。当Xij=0时权值函数f(Xij)=0（约定0log0=0），f(Xij)能对不太常见的词进行有意义的运算，也能给出现频繁的词较大但不至于过分的权重。

$L=\sum_{i,j=1}^{V}f(X_{ij})(w_{i}^{T}\tilde{w}_{j}+b_{i}+\tilde{b}_{j}-\log X_{ij})^{2}$

$w_{i}^{T}\tilde{w}_{j}$ 相当于之前的 $\theta$ 和e，且它们是对称的。因此一种训练方法可以是，一致地初始化二者，梯度下降训练后最终的词向量取它们的平均和。

在某些场景下，Glove的表现优于Word2Vec。

参考资料

吴恩达序列模型

https://blog.csdn.net/yaoweijiao/article/details/52945186

https://www.cnblogs.com/peghoty/p/3857839.html

https://www.cnblogs.com/pinard/p/7243513.html

http://www.fanyeong.com/2018/02/19/glove-in-detail/

你可能感兴趣的:(深度学习,NLP)

Python 在 AI 领域的应用：从零构建你的第一个 AI 模型嵌入式Jerry Python python 人工智能开发语言嵌入式硬件 windows ubuntu
引言人工智能（AI）已经成为现代科技的核心，而Python是AI领域最受欢迎的编程语言之一。其强大的库和框架，如TensorFlow、PyTorch、scikit-learn，使AI开发变得更加简单高效。本文将带你深入理解Python在AI中的应用，并通过机器学习（MachineLearning）和深度学习（DeepLearning）的实际示例，讲解如何构建一个AI模型。1.Python为什么适合
深度学习篇---Opencv中的机器学习和深度学习 Ronin-Lotus 深度学习篇图像处理篇深度学习 opencv 机器学习 python
文章目录前言一、OpenCV中的机器学习1.概述2.使用步骤步骤1：准备数据步骤2：创建模型步骤3：训练模型步骤4：预测3.优点简单易用轻量级实时性4.缺点特征依赖性能有限二、OpenCV中的深度学习1.概述图像分类（如ResNet、MobileNet）目标检测（如YOLO、SSD）语义分割（如DeepLab）人脸检测（如OpenFace）2.使用步骤步骤1：加载模型步骤2：准备输入数据步骤3：推
【深度学习模型高效部署】tensorRT_Pro深度解读：部署深度学习模型的高效方案云博士的AI课堂深度学习哈佛博后带你玩转机器学习深度学习人工智能 tensorRT_Pro TensorRT 高性能推理机器学习模型部署
以下内容将对tensorRT_Pro项目做一个系统的介绍，包括其核心价值、主要功能、应用案例以及关键的示例代码（附详细解释），帮助你快速了解并上手如何基于TensorRT在NVIDIAGPU上实现高性能推理。一、项目概述GitHub-shouxieai/tensorRT_Pro:C++librarybasedontensorrtintegrationtensorRT_Pro是由开发者shouxie
Python 自然语言处理实战： NLTK 与 spaCy，文本分析的左右护法清水白石008 python Python题库 python 自然语言处理 easyui
Python自然语言处理实战：NLTK与spaCy，文本分析的左右护法引言在信息爆炸的时代，文本数据以前所未有的速度增长，蕴藏着巨大的信息和价值。从社交媒体的评论，到浩如烟海的文档，文本数据无处不在，成为了解用户意图、挖掘商业情报、洞察社会趋势的关键来源。然而，文本数据本质上是非结构化的，计算机难以直接理解和处理。自然语言处理(NaturalLanguageProcessing,NLP)技术应运而
基于YOLOv5的无人机农田监测系统实现与UI界面设计深度学习&目标检测实战项目 YOLO 无人机 ui 深度学习分类目标检测
一、引言随着无人机技术和深度学习算法的快速发展，农业领域逐渐引入了智能化监测手段。无人机农田监测结合了无人机的高空拍摄能力和计算机视觉技术，能够实时获取农田的图像数据，并对作物生长状态、病虫害检测、土地使用情况等进行智能分析。深度学习中的目标检测技术，如YOLOv5，能够帮助实现精准的农田监测，提供自动化的解决方案。在这篇博客中，我们将介绍如何利用YOLOv5进行无人机农田监测，如何使用图形用户界
Keras深度学习实战——手写文字识别鱼弦机器学习设计类系统深度学习 keras 人工智能
鱼弦：公众号【红尘灯塔】，CSDN博客专家、内容合伙人、新星导师、全栈领域优质创作者、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）Keras深度学习实战——手写文字识别1.介绍本教程将介绍如何使用Keras深度学习框架进行手写文字识别。手写文字识别是指将手写文字转换为相应的文本，该文本可
深度学习笔记——神经网络肆—— 深度学习深度学习笔记神经网络人工智能 python
本文为在拓尔思智能举办的训练营中学习内容的总结，部分内容摘自百度百科个人在这里推荐一个好用的软件，Trae，主要是免费。人工神经元是人工神经网络的基本单元。模拟生物神经元，人工神经元有1个或者多个输入（模拟多个树突或者多个神经元向该神经元传递神经冲动）；对输入进行加权求和（模拟细胞体将神经信号进行积累和树突强度不同）；对输入之和使用激活函数计算活性值（模拟细胞体产生兴奋或者抑制）；输出活性值并传递
【Hugging Face】datasets 库：加载、处理和分享大规模数据集彬彬侠大模型 datasets Hugging Face
HuggingFaceDatasets库HuggingFace的datasets库是一个轻量级、高性能的库，用于加载、处理和分享大规模数据集，特别适用于自然语言处理（NLP）、计算机视觉（CV）和语音任务。1.为什么使用Datasets？在深度学习中，处理大规模数据集通常面临以下挑战：数据集太大，无法一次性加载到内存不同任务的数据格式不统一数据预处理和转换较慢需要快速流式加载数据datasets库
【深度学习】服务器常见命令红烧白开水。服务器运维
1、虚拟环境的安装位置先进入虚拟环境whichpython2、升序查看文件内容ls-ltr3、查看服务器主机空间使用情况df-hdf-h.4、查看本地空间使用情况du-sh./*du-sh*|sort-nr5、查找并删除进程#查找psaux#删除kill-KILLpid6、查看服务器配置lscpuuname-alsb_release-acat/etc/*release7、文件和目录操作ls：列出目
自然语言处理（NLP）领域大语言模型学习目录大全彬彬侠大模型自然语言处理 NLP 大模型 LLM GPT BERT GLM
本文主要收集了自然语言处理（NLP）领域的大语言模型，可以可以通过点击标题链接查看具体的详情。GPT系列GPT-1（GenerativePre-trainedTransformer1）模型GPT-1（GenerativePre-trainedTransformer1）是OpenAI在2018年6月提出的第一代GPT模型，也是第一个基于Transformer结构的自回归（Autoregressive
DeepSeek时代：AI如何重塑软件开发的每个阶段，效率提升全解析阿三0404 人工智能
在软件开发领域，时间就是竞争力。传统的瀑布模型和敏捷开发流程中，需求偏差、重复编码、测试遗漏等问题不断消耗团队精力。随着以DeepSeek为代表的AI技术突破，从需求分析到运维监控的每个环节都在发生效率革命。本文将深入解析AI在开发全流程中的具体应用，并通过真实数据揭示其带来的效率跃升。一、需求分析阶段：从模糊需求到精准拆解（效率提升65%）AI工具：自然语言处理（NLP）、需求图谱生成应用场景：
DeepSeek：如何通过自然语言生成HTML文件与原型图？阿三0404 ai 人工智能 html 机器学习深度学习
在当今快节奏的开发与设计环境中，快速生成HTML文件或原型图是每个开发者与设计师的迫切需求。虽然DeepSeek无法直接生成图片，但它却能够通过自然语言生成流程图、原型图以及交互式页面，甚至可以直接输出HTML代码。本文将详细介绍如何与DeepSeek高效交流，生成你想要的HTML文件或原型图，并分享一些实用技巧。1.DeepSeek的核心功能与优势DeepSeek是一款基于自然语言处理（NLP）
DeepSeek这么火，一文教你本地部署DeepSeek! 入职啦 python python deepseek 部署持续部署 AI 人工智能
要说年假最火的是什么，DeepSeek绝对在话题榜上，公众号几乎都是关于他的，今天入职啦也来和大家聊一聊我们AI领域的新星–DeepSeek，顺便也教大家部署一套属于自己的本地搜索服务。为什么DeepSeek这么火？一、技术架构优势DeepSeek采用创新的混合模型架构，将传统机器学习与深度学习有机结合。这种架构既保留了传统方法的可解释性，又具备深度学习的强大表征能力。通过自适应学习机制，Deep
【Java】已解决java.lang.NoClassDefFoundError异常屿小夏 java 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
介绍 TensorFlow 的基本概念和使用场景。大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
TensorFlow是一个由谷歌开发的开源机器学习框架，广泛应用于深度学习领域。它提供了一个灵活的平台，可以用于构建各种机器学习模型，包括神经网络。TensorFlow的基本概念和使用场景如下：张量（Tensor）：TensorFlow中的基本数据结构就是张量，可以简单理解为多维数组。张量可以是标量（0维张量）、向量（1维张量）、矩阵（2维张量）等。在TensorFlow中，所有数据都以张量的形式
深度学习中N维数组的介绍帅维维深度学习深度学习人工智能
N维数组是机器学习和神经网络的主要数据结构。下面是N维数组的实例：0维数组（标量）：通常表示一个类别。1维数组（向量）：通常表示一个特征向量。二维数组（矩阵）：通常表示一个样本--特征矩阵。三维矩阵：通常表示RGB图片（宽*高*通道）。四维矩阵：通常表示一个RGB图片批量（批量大小*宽*高*通道）。五维矩阵：通常表示一个视频批量（批量大小*时间*宽*高*通道）。
机器学习在地图制图学中的应用地图模型炼丹师机器学习人工智能
原文链接：https://www.tandfonline.com/doi/full/10.1080/15230406.2023.2295948#abstractCSDN/2025/Machinelearningincartography.pdfatmain·keykeywu2048/CSDN·GitHub核心内容本文是《制图学与地理信息科学》特刊的扩展评论，系统探讨了机器学习（尤其是深度学习）在制
机器学习大纲总结 excellent121 机器学习人工智能
一、概念1.人工智能人工智能包含机器学习，机器学习包含深度学习2.机器学习机器学习是实现人工智能的一种途径机器学习=传统机器学习+深度学习3.深度学习深度学习是由机器学习的一种方法发展而来4.发展三要素数据、算法、算力5.发展史5.1符号主义（20世纪50-70）：专家系统占主导1950年：图灵设计国际象棋程序1962年：IBMArthurSamuel的跳棋程序战胜人类高手（人工智能第一次浪潮）5
人工智能与深度学习的应用案例：从技术原理到实践创新 accurater 人工智能深度学习科技
第一章引言人工智能（AI）作为21世纪最具变革性的技术之一，正通过深度学习（DeepLearning）等核心技术推动各行业的智能化进程。从计算机视觉到自然语言处理，从医疗诊断到工业制造，深度学习通过模拟人脑神经网络的层次化学习机制，实现了对复杂数据的高效分析与决策。本文结合前沿技术框架与行业应用案例，探讨深度学习的核心原理及其在多个领域的实践路径，并附代码实例以增强技术理解。第二章深度学习的技术基
深度学习模型：原理、应用与代码实践 accurater c++算法笔记人工智能深度学习
引言深度学习作为人工智能的核心技术，已在图像识别、自然语言处理、代码生成等领域取得突破性进展。其核心在于通过多层神经网络自动提取数据特征，解决复杂任务。本文将从基础理论、模型架构、优化策略、应用场景及挑战等多个维度展开，结合代码示例，系统解析深度学习模型的技术脉络与实践方法。一、深度学习基础理论神经网络基本原理神经网络由输入层、隐藏层和输出层构成，通过反向传播算法调整权重。以全连接网络为例，前向传
svn 通过127.0.01能访问但通过公网IP不能访问，这是什么原因？行思理运维 Linux svn linux 防火墙
连接失败的提示如下1、SVN的启动方法方法一：svnserve-d-r/mnt/svn方法二：svnserve-d--listen-port3690-r/mnt/svn方法三：svnserve-d-r/mnt/svn--listen-host0.0.0.02、首先检查svn服务器是否启动方法一：netstat-tunlp|grepsvn演示如下如上状态，说明已启动方法二：svnserve--ver
【TVM 教程】使用元组输入（Tuple Inputs）进行计算和归约编译器编程后端人工智能深度学习
ApacheTVM是一个端到端的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：ZihengJiang若要在单个循环中计算具有相同shape的多个输出，或执行多个值的归约，例如argmax。这些问题可以通过元组输入来解决。本教程介绍了TVM中元组输入的用法。from__future__importabsolut
深度解构：DeepSeek大模型架构与前沿应用的未来探秘威哥说编程架构 ai
随着人工智能（AI）领域的快速发展，深度学习模型逐渐向着更加复杂和强大的方向演进。在这一波技术浪潮中，DeepSeek大模型作为一个重要代表，凭借其卓越的表现和广泛的应用，正在重新定义我们对AI的认知和期待。本篇文章将从架构到应用，全面解析DeepSeek大模型的技术特点，探索其在未来可能带来的创新与变革。1.DeepSeek大模型的架构设计DeepSeek大模型采用的是基于Transformer
深度学习系列71：表格检测和识别 IE06 深度学习系列深度学习人工智能
1.pdf处理如果是可编辑的pdf格式，那么可以直接用pdfplumber进行处理：importpdfplumberimportpandasaspdwithpdfplumber.open("中新科技：2015年年度报告摘要.PDF")aspdf:page=pdf.pages[1]#第一页的信息text=page.extract_text()print(text)table=page.extract
【实战项目】Python 手撕一个基于最新端到端大模型的语音聊天系统 kakaZhui 解码前沿多模态大模型：认知分析和工业级实战 python 开发语言 AIGC 人工智能 chatgpt
写在前面：为什么需要端到端语音交互近年来，随着深度学习技术的飞速发展，语音交互技术取得了显著的进步。从智能音箱到虚拟助手，语音交互已经渗透到我们生活的方方面面。然而，传统的语音交互系统往往采用“语音识别（ASR）-自然语言理解（NLU）-对话管理（DM）-自然语言生成（NLG）-语音合成（TTS）”的级联式架构，这种架构存在着诸多弊端，如：错误累积：每个模块的错误都会传递到下一个模块，导致最终结果
体育数据分析：竞技表现优化与商业价值挖掘的技术范式 Tina0898 数据分析数据挖掘
体育数据分析作为一门交叉学科，正在重塑现代体育产业的发展轨迹。通过多源数据采集、机器学习建模和商业智能分析，体育数据分析已经形成了完整的技术体系和应用生态。本文将深入探讨体育数据分析的技术架构、应用场景和商业价值。一、数据采集与处理技术架构现代体育数据采集系统采用分布式架构，集成了计算机视觉、惯性测量单元(IMU)和生物电传感器等多模态数据源。计算机视觉系统通过高速摄像机和深度学习算法，可实现运动
PyTorch 深度学习快速入门教程有人给我介绍对象吗 AI论文写作深度学习 pytorch 人工智能
PyTorch深度学习快速入门教程PyTorch是一个灵活且易用的深度学习框架，支持动态图计算，广泛用于学术研究和工业应用。本教程将带你快速掌握PyTorch的基本用法，涵盖张量（Tensor）操作、自动求导（Autograd）、构建神经网络以及模型训练。1.安装PyTorch在终端或命令行中运行以下命令安装PyTorch：pipinstalltorchtorchvisiontorchaudio安
第0节机器学习与深度学习介绍汉堡go 李哥深度学习专栏人工智能机器学习神经网络
人工智能：能够感知、推理、行动和适应的程序机器学习：能够随着数据量的增加而不断改进性能的算法（数学上的可解释性但准确率不是百分百，灵活度不高）深度学习：机器学习的一个子集：利用多层神经网络从大量数据中进行学习（设计一个很深的网络架构让机器自己学）（深度学习就是找一个函数f）机器学习算法简介（狭义）一般是基于数学，或者统计学的方法，具有很强的可解释性经典传统机器学习算法：KNN、决策树、朴素贝叶斯一
基于YOLOv5深度学习的田间杂草检测系统：UI界面 + YOLOv5 + 数据集详细教程深度学习&目标检测实战项目 YOLO 深度学习 ui YOLOv5 人工智能计算机视觉
引言随着农业科技的进步，智能化农业越来越受到重视，尤其是通过计算机视觉技术对作物进行监测和管理。在农业生产中，杂草的生长对作物的生长产生了负面影响，因此准确地检测和识别田间杂草至关重要。本文将详细介绍如何构建一个基于深度学习的田间杂草检测系统，使用YOLOv5模型进行目标检测，并提供一个用户友好的界面。我们将分步骤进行，包括环境配置、数据集准备、模型训练、实时杂草检测系统的实现等内容。目录引言目录
人工智能与深度学习的应用案例解析及代码实现 accurater 人工智能深度学习科技机器人
引言人工智能（AI）与深度学习（DeepLearning）作为21世纪最具变革性的技术之一，已渗透到医疗、金融、交通、制造等各个领域。深度学习通过多层神经网络模拟人类认知过程，显著提升了复杂任务的自动化水平。本文将从技术原理、核心应用案例及代码实现三个维度，系统解析其实际应用，并探讨未来挑战与发展方向。一、深度学习技术概述1.1核心技术框架深度学习基于深度神经网络（DNN），其核心在于通过多层非线
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S