jessie_weiqing

【笔记3-7】CS224N课程笔记 - 神经网络机器翻译seq2seq注意力机制

CS224N（七）Neural Machine Translation, Seq2seq and Attention

seq2seq神经网络机器翻译

历史方法
seq2seq基础
seq2seq - 编码部分
seq2seq - 解码部分
NMT示例
双向RNN

注意力机制

提出的动机
Bahdanau et al. NMT
翻译对齐
模型在长句上的表现

其他模型

Huong et al. NMT
Google’s new NMT
更多使用注意力机制的文章

序列模型解码器
机器翻译系统评估

人工评估
与其他任务的对比评估
BLEU（Bilingual Evaluation Understudy）

大规模输出词汇处理

scaling softmax
减少词汇
处理未知词汇

基于单词和字符的模型

词汇分割
基于字符的模型
混合NMT

【笔记3-1】CS224N课程笔记 - 深度自然语言处理
【笔记3-2】CS224N课程笔记 - 词向量表示 word2vec
【笔记3-3】CS224N课程笔记 - 高级词向量表示
【笔记3-4】CS224N课程笔记 - 分类与神经网络
【笔记3-5】CS224N课程笔记 - 依存分析
【笔记3-6】CS224N课程笔记 - RNN和语言模型
【笔记3-8】CS224N课程笔记 - 卷积神经网络

CS224n：深度学习的自然语言处理（2017年冬季）1080p https://www.bilibili.com/video/av28030942/

关键词：seq2seq，注意力机制，神经网络机器翻译，语音处理

seq2seq神经网络机器翻译

前面已经讲解过预测单个输出的问题，比如一个单词的NER标签，给定过去几个单词预测最有可能出现的下一个单词。还有一些NLP任务依赖于顺序输出，或者是长度可变的序列。比如

翻译：用一种语言输入一个句子，然后用另一种语言输出相同的句子。
对话：把一个陈述或问题作为输入并做出回应。
摘要：将大量文本作为输入并输出摘要。

本章将关注seq2seq模型，一个用于处理上述问题的基于深度学习的框架。

历史方法

在过去，翻译系统是基于以下概率模型构建的：

翻译模型，源语言中的句子/短语最可能翻译成什么
语言模型，一个给定的句子/短语整体的可能性。

这些组件用于构建基于单词或短语的翻译系统。但一个简单的基于单词的系统不能捕捉语言之间排序的差异(例如否定词的位置、句子中主语和动词的位置，等等)。在Seq2Seq之前，基于短语的翻译系统可以根据短语序列考虑输入和输出，并且可以处理比基于单词的系统更复杂的语法。然而，长期依赖关系仍然很难在基于短语的系统中捕获。

Seq2Seq的优势，尤其是使用LSTM，是现代翻译系统能够生成的看到整个输入后的任意输出序列。甚至可以自动关注输入的特定部分来提供帮助生成有用的翻译。

seq2seq基础

seq2seq模型是由两个递归神经网络组成的端到端模型：

编码器，将模型的输入序列作为输入，并将其编码为固定大小的“上下文向量”
解码器，它使用上面的上下文向量作为“种子”，从中生成输出序列。

因此，Seq2Seq模型通常被称为“编解码器模型”。

seq2seq - 编码部分

编码器将输入序列读入Seq2Seq模型，并为序列生成一个固定维上下文向量C。

为此，编码器使用一个RNN单元(通常是LSTM)一次读取一个输入标记。最后隐藏状态的细胞将成为C。由于压缩一个任意长度的向量序列成固定大小较为困难(尤其是翻译等困难的任务)，编码器通常由堆叠LSTM组成，即一系列LSTM层，每一层的输出是下一层的输入。最后一层的LSTM隐藏状态将作为C使用。

Seq2Seq编码器经常反向处理输入序列，这样编码器看到的最后一件事大致对应于模型输出的第一个东西；这使解码器更容易“开始”输出，更容易生成正确的输出语句。在翻译中，要让网络尽快翻译输入的头几个单词，一旦头几个单词翻译正确，继续构造一个正确的句子要容易得多。

seq2seq - 解码部分

解码器也是LSTM网络，但比编码器稍复杂一些。本质上，希望将其用作一种语言模型，能够利用到目前为止生成的单词和输入。保留编码器的堆叠LSTM结构，使用上下文向量初始化第一层的隐藏状态；使用输入的上下文来生成输出。

解码器与上下文设置好后，传递一个特殊的标志来表示输出生成的开始，通常是一个附加到输入末尾的 $< E O S >$ (在输出末尾也有一个)。然后运行所有LSTM层，一个接着一个，在最后一层的输出上使用softmax生成第一个输出单词。然后将该单词传递到第一层，并重复生成。这就是LSTM充当语言模型的方法。

有了输出序列就使用相同的学习策略，定义损失为预测序列上的交叉熵，并用梯度下降和反向传播将其最小化。编码解码器同时训练，因此都学习相同的上下文向量表示。

NMT示例

注意输入和输出的长度之间没有联系，任何长度的输入都可以传入，任何长度的输出都可以生成。由于LSTM的实际限制，Seq2Seq模型在很长的输入时间内会失效。

考虑Seq2Seq模型如何将“what is your name”翻译成“comment t 'appelles tu”。

首先，从输入四个独热向量开始（这些输入可能嵌入到密集的向量表示中，也可能不嵌入）然后一个堆叠的LSTM网络反向读取序列并将其编码到一个上下文向量中（这个上下文向量是一个向量空间，表示询问某人姓名的概念）用于初始化另一个堆叠LSTM的第一层。对网络的每一层运行一个步骤，对最后一层的输出执行softmax，选择第一个输出单词，这个单词被反馈回网络作为输入。

在反向传播过程中，编码器的LSTM权值被更新，以便更好地学习句子的向量空间表示，解码器的LSTM权值被训练，使其生成与上下文向量相关的语法正确的句子。

双向RNN

句子中的依赖关系并不只在一个方向上起作用，一个单词可以依赖于之前或之后的另一个单词。到目前为止的Seq2Seq并不能解释这一点。在任何时候，我们只考虑当前单词之前单词的信息(通过LSTM隐藏状态)。对于NMT，我们需要能够有效地编码任何输入，而不管输入中的依赖关系方向如何。

双向RNNs通过在两个方向遍历一个序列并连接结果输出(cell输出和最终隐藏状态)来解决这个问题。对于每个RNN单元，只是简单地添加另一个单元，但以相反的方向提供输入。与第t个单词对应的输出 $o_t$ 是连接的向量 $o_t^{(f)} o_t^{(b)}]$ ，其中 $o_t^{(f)}$ 为正向RNN对单词t的输出， $^{(b)} _t$ 为反向RNN的相应输出。同理，最终隐藏状态 $h=[h^{(f)} h^{(b)}]$ ，其中 $h^{(f)}$ 为正向RNN的最终隐藏状态， $h^{(b)}$ 为反向RNN的最终隐藏状态。

注意力机制

提出的动机

人们在听到一句话时，会重点关注被认为重要的某些单词。类似地，Bahdanau等人注意到使用最终的RNN隐藏状态作为seq2seq模型的上下文向量的缺陷：通常，输入的不同部分具有不同的重要性级别。此外，输出的不同部分甚至可能认为输入的不同部分“重要”。例如在翻译中，输出的第一个单词通常基于输入的前几个单词，最后一个单词很可能基于输入的最后几个单词。

注意力机制利用这一观察结果，为解码器网络提供了在每个解码步骤查看整个输入序列的功能，然后解码器可以在任何时间点决定哪些输入单词是重要的。

Bahdanau et al. NMT

前面说过，seq2seq模型由两个部分组成，一个是编码输入语句的编码器，另一个是利用解码器提取的信息生成翻译后的句子的解码器。
基本上，输入是一个要翻译的单词序列 $x_1,...,x_n$ ，目标句子是一系列单词 $y_1,....,y_m$

encoder：
设 $h_1,…, h_n)$ 为表示输入语句的隐藏向量。例如，这些向量是bi-LSTM的输出，包含有句子中每个单词的上下文表示。
decoder：
解码器的隐藏状态 $s_i$ 使用递归公式 $s_i=f(s_{i-1},y_{i-1},c_i)$ 进行计算。其中 $s_{i-1}$ 为之前的隐藏向量， $y_{i-1}$ 是上一步生成的词， $c_i$ 是上下文向量，包含有解码器时间步i中来自原句子的上下文相关信息。
上下文向量 $c_i$ 捕获第i个解码时间步的相关信息(不像标准的Seq2Seq只有一个上下文向量)。对于原始语句中的每个隐藏向量 $h_j$ ，计算一个分数 $e_{i,j}=a(s_{i-1},h_j)$ 其中a是实数域上的函数，例如单层全连接神经网络。然后得到一个标量值序列 $e_{i,1},… ,e_{i, n}$ 使用softmax层 $\alpha_{i,j}=\frac{exp(e_{i,j})}{\sum_{k=1}^{n}exp(e_{i,k})}$ 将这些分数标准化为向量 $\alpha_i = (\alpha_{i,1},…, a_{i,n})$
然后，用原句中隐藏向量的加权平均值 $c_i=\sum_{j=1}^{n}\alpha_{i,j}h_{j}$ 计算上下文向量 $c_i$ ，直观地说，这个向量为解码器第i步从原始语句中捕获的上下文信息。

翻译对齐

基于注意力的模型为输出的每个步骤分配输入的不同部分的重要性。在翻译中可以被理解为“对齐”。 $\alpha_{ij}$ 在解码第i步时的注意力得分表示源句中的单词与目标句中的单词i对齐。可以使用注意力评分来构建一个对齐表——基于Seq2Seq NMT系统中的编码器和解码器，将源句中的单词映射到目标语句中的对应单词。

模型在长句上的表现

基于注意力的模型的主要优势是它们能够有效地翻译长句。随着输入的大小增加，如果只使用最终表示，不使用注意力的模型将会失去信息和精度。

其他模型

Huong et al. NMT

全局注意力：运行Seq2Seq NMT，编码器给出的隐藏状态为 $h_1,…, h_n$ ，解码器的隐藏状态为 $\bar{h_1},…,\bar{h_n}$ 对于每个 $\bar{h_i}$ ，使用以下评分方式当中的一种计算编码器隐藏层上的注意力向量： $score(h_i,\bar{h_j})=\left\{\begin{matrix}h_i^T\bar{h_j}\\ h_i^TW\bar{h_j}\\ W[h_i,\bar{h_j}]\end{matrix}\right.\in \mathbb{R}$
得到分值之后，可以用上述类似的方法，利用分值进行softmax求出权重 $\alpha_{i,j}=\frac{exp(score(h_i,\bar{h_j}))}{\sum_{k=1}^{n}exp(score(h_k,\bar{h_j}))}$ ，然后用权重加权得到上下文向量 $c_i=\sum_{j=1}^{n}\alpha_{i,j}h_{j}$ 。结合上下文向量以及隐藏状态可以计算一个新的向量 $\tilde{h_i}=f([\bar{h_i},c_i])$ 并利用该新向量进行最终的预测。
局部注意力：该模型预测输入序列中的对齐位置。然后使用以该位置为中心的窗口计算上下文向量。此注意步骤的计算成本是恒定的，且不随句子长度而改变。

由此可见，注意力的计算方法有很多种。

Google’s new NMT

谷歌通过自己的翻译系统为NMT做出了重大突破。一般而言，对每对语言建立完整的Seq2Seq模型，要求对每一种语言进行单独训练，对数据和计算时间的要求很高，但是谷歌建立了一个可以在任何两种语言之间进行翻译的单一系统。这是一个Seq2Seq模型，以单词序列和指定要翻译成何种语言的标志作为输入，可以使用共享参数转换成任何目标语言。

新的多语言模型不仅提高了翻译性能，还实现了“zero-shot翻译”，即可以在没有训练数据的两种语言之间进行翻译。例如，只有日语-英语翻译和韩语-英语翻译的例子，基于这些数据的多语言NMT系统可以生成合理的日语-韩语翻译。也就是说解码过程不特定于语言，且模型实际上保持了输入/输出句子的内部表示，独立于所涉及的实际语言。

序列模型解码器

机器翻译的另一种方法来自统计机器翻译。考虑一个计算概率的模型 $P(\bar{s}|s)$ 用于将句子 $s$ 翻译成 $\bar{s}$ ，目的是选择最佳的 $\bar{s}^*$ 使得这一概率最大，即 $\bar{s}^*=argmax_{\bar{s}}P(\bar{s}|s)$
由于搜索空间可能很大，需要缩小它的大小。现列举一系列序列模型解码器(包括好解码器和坏解码器)。

穷举搜索：计算每个可能序列的概率，选择概率最高的序列。但由于搜索空间输入大小是指数级的，不能扩展到大的输出。此时解码是NP完全问题。
原始采样：在时间步t，根据过去的单词计算 $x_t$ 的条件概率 $x_t\sim P(x_t|x_1,...,x_n)$ 从理论上讲，这种方法有效且渐近精确，而实践中，可能性能较差且方差高。
贪婪搜索：在每一步选择最可能的token，即 $x_t = argmax_{\tilde{x_t} }P (\tilde{x_t}|x_1,...,x_n)$ 这是一种高效自然的方法，但只探索了搜索空间的一小部分，如果在某一步犯了错误，句子的其余部分可能会受到严重影响。
集束搜索：每次保留K个候选答案 $H_t = \{(x_1^1,…,x^1_t),…,(x_1^K,...,x_t^K)\}$ 通过展开 $H_t$ 并保留最佳的K个候选值来计算 $H_{t+1}$ 。即在选择最好的K个序列 $\tilde{H}_{t+1}=\bigcup_{k=1}^{K}H_{t+1}^{\tilde{k}}\\H_{t+1}^{\tilde{k}}=\{(x_1^k,…,x^k_t,v_1),…,(x_1^k,...,x_t^k,v_{|V|})\}$ 随着K的增加，得到更高的精度且渐近精确。然而进步不是单调的，可以设置一个综合合理性能和计算效率的K。集束搜索是NMT中最常用的方法。

机器翻译系统评估

前面已经了解了机器翻译的基本知识，现在讨论这些模型的评估方法。评价翻译的质量是一项棘手和带有主观意识的任务。给10个不同的译者一段文字会得到10个不同的翻译。他们关注不同的信息，强调不同的含义。一种翻译可以保留隐喻和长期思想的完整性，而另一种翻译可以更忠实地重构句法和风格，尝试逐字翻译。这种灵活性证明了语言的复杂性和我们解码和解释意思的能力。

这里需要区分模型的目标损失函数和评价方法。损失函数本质上是一个模型预测结果的求值函数，而评估指标提供了一个最终的、总结性的模型评估。没有哪种度量方式是优于其他所有度量方式的，尽管有些度量具有明显的优势以及为多数人所偏好。

评价机器学习翻译的质量已经成为了一个独立的研究领域，如TER, METEOR, MaxSim, SEPIA, RTE-MT。这里将重点介绍两种基线评估方法和BLEU。

人工评估

第一种方法是让人们手工评估系统的正确性、充分性和流畅性。但这种方法的一个明显问题是成本高且效率低，尽管它仍然是机器翻译的黄金标准。

与其他任务的对比评估

评估输出数据的有用表示(表示为翻译或摘要)的机器学习模型的一种常见方法是，如果预测对解决一些具有挑战性的任务有用，那么该模型必须在预测中编码相关信息。如，考虑把翻译预测（A翻译成B）训练成一个B语言的问答任务，即用系统的输出作为其他任务(问答)的输入。如果第二个任务在任务一得到的B语言以及格式良好的B语言数据上一样出色，这意味着输入具有满足任务需求的相关信息或模式。

这种方法的问题在于，第二个任务可能不受翻译细节的影响。例如，在检索任务上度量翻译质量(比如为搜索查询打开正确的页面)，会发现保留文档主题词但忽略语法的翻译仍然适合该任务，但这并不意味着翻译质量是准确的。因此，确定翻译模型的质量只是转换为确定任务本身的质量，这可能是一个好标准也可能不是。

BLEU（Bilingual Evaluation Understudy）

2002年，IBM研究人员开发了BLEU，是最受尊重和可靠的机器翻译方法之一。

BLEU算法对候选机器翻译与参考人工翻译的精度评分进行评估。参考人工翻译被假定为一个翻译的模型示例，使用n-gram matches作为衡量候选翻译与翻译相似程度的指标。考虑一个参考句a和候选译文B：

A：there are many ways to evaluate the quality of a translation, like comparing the number of n-grams between a candidate translation and reference.
B：the quality of a translation is evaluate of n-grams in a reference and with translation.

BLEU评分查找机器翻译中的n-gram是否也出现在参考翻译中。下面是一些不同大小的n-gram示例，它们在引用和候选翻译之间共享。

A：there are many ways to evaluate the quality of a translation, like comparing the number of n-grams between a candidate translation and reference.
B：the quality of a translation is evaluate of n-grams in a reference and with translation.

BLEU算法识别上述所有n-gram匹配，包括unigram匹配，并使用精度评分评估匹配的强度。精度分数是翻译中出现在参考文献中的n-gram的分数。

该算法还满足两个约束条件。

对于每个不同尺寸的n-gram，参考翻译中的一个gram不能在翻译结果中匹配超过一次。例如，unigram“a”在B中出现两次，但在a中只出现一次，就只能计数一次。
对句子的简洁性进行了限制，精度达到1.0(“完美”匹配)的非常小的句子并不被认为是好的翻译。例如，单个单词“there”可以达到1.0的精度匹配，但显然不是很好匹配。

下面讨论BLEU score的具体计算：

首先，k是我们要计算分数的最大n-gram。也就是说，如果k = 4，BLEU score只计算长度小于或等于4的n-gram。设尺寸为n的gram的精度得分 $p_n= \# matched \ n-grams / \# n-grams \ in \ candidate \ translation$ 设 $w_n = 1/2^n$ 为n-gram精度的几何权重。惩罚系数为 $\beta=e^{min(0,1-\frac{len_{ref}}{len_{MT}})}$ 则最终的BLEU score为 $BLEU=\beta\prod_{i=1}^{k}p_{n}^{w_n}$ 据称BLEU score与人类对优秀翻译的判断密切相关，是所有评估指标的基准。然而它存在很多限制，第一，它只在语料库级别上工作得很好，因为精度得分中的任何零都将使整个BLEU得分为零。第二，所给出的BLEU评分只将候选翻译与单个参考翻译进行比较，存在相关n-gram的噪声表示问题。

BLEU的变体修改了算法，将候选对象与多个参考示例进行比较。此外，BLEU score可能只是一个必要的，但并不足以通过一个良好的机器翻译系统的基准。许多研究人员优化了BLEU score，直到他们开始接近参考译文之间相同的BLEU score，但质量仍然远远低于人类译文。

大规模输出词汇处理

尽管现代的NMT取得了成功，但在处理大词汇量时却遇到了困难。具体来说，Seq2Seq模型使用softmax计算整个词汇表上的目标概率分布来预测下一个单词。事实证明，大型词汇表的softmax计算量巨大，且复杂性与词汇表大小成正比。下面讨论解决这个问题的一些方法。

scaling softmax

一个很自然的想法是找到更有效的方法来计算目标概率分布，在之前的笔记中提到过两种降低“softmax”复杂性的方法，即负采样（噪声对比评估）和分层softmax。详见【笔记3-2】CS224N课程笔记 - 词向量表示 word2vec 中的”skip-gram和CBOW的改进“部分，此处不再赘述。

这两种方法的一个限制是，它们只在训练步骤(当目标单词已知时)节约计算成本。在测试时，仍然需要计算词汇表中所有单词的概率才能做出预测。

减少词汇

除了优化“softmax”，还可以尝试减少有效词汇量，加快培训和测试。一种简单的方法是将词汇表的大小限制在很小的范围内，并用标记替换词汇表之外的单词。这一训练和测试时间都可以显著减少，但这并不是理想的，可能会生成大量输出。

On Using Very Large Target Vocabulary for Neural Machine Translation
https://arxiv.org/pdf/1412.2007.pdf
Sébastien Jean, Kyunghyun Cho, Roland Memisevic, Yoshua Bengio

有一个方法（Jean et al. 2015）可以维持一个恒定的词汇量大小 $∣ V^{'} ∣$ ，通过将训练数据划分成子集对应 $\tau$ 个独特的目标词，其中 $\tau = |V'|$ 一个子集可以通过顺序扫描原始数据集，直到检测到 $\tau$ 个独特的目标词。这个过程通过迭代整个数据集生成所有mini-batch子集。在实际应用中 $∣ V ∣ = 500 K, ∣ V^{'} ∣ = 30 K, 50 K$

这个概念与NCE（噪声对比评估）非常相似，对于任何给定的单词，输出词汇表包含目标单词和 $∣ V^{'} ∣ - 1$ 个负(噪声)样本。主要区别是，这些负样本是从每个子集 $V^{'}$ 的一个有偏分布Q中抽取的 $Q(y_t)=\left\{\begin{matrix}\frac{1}{|V'|},if \ y_t\in|V'|\\0, \ otherwise\end{matrix}\right.$ 在测试时，也可以从整个词汇表中选择一个子集(称为候选列表)来预测目标单词。难点在于正确的目标词是未知的，需要“猜测”目标词是什么。在文章中，作者提出用 $K$ 个最常见的单词(基于单字母概率)和 $K^{'}$ 个可能的目标单词为每个源句构建一个候选列表。如下图所示，其中 $K^{'}$ = 3，候选列表由紫色框中的所有单词组成。实践中可以选择 $K = 15 k, 30 k, 50 k, K^{'} = 10, 20$

处理未知词汇

当NMT系统使用上面提到的技术来减少词汇量时，某些单词可能被映射到。例如，当预测的单词(通常是罕见的单词)不在候选列表中，或者在测试时遇到未见过的单词时，就会发生这种情况。需要使用新的机制来解决罕见和未知单词的问题。

Gulcehre等人提出的一个解决方法是学习“复制”源文本。模型应用注意力分布 $l_t$ 决定源文本中的指向位置，并使用解码器隐藏状态 $S_t$ 预测二进制变量 $Z_t$ , $Z_t$ 决定何时从源文本中复制。最终的预测要么是候选表上通过softmax选择的单词 $y^w_t$ (与前面的方法一样)，要么是从源文本复制的 $y^l_t$ (取决于 $Z_t$ 的值)。这种方法可以提高机器翻译和文本摘要等任务的性能。

这种方法存在一定局限性。谷歌NMT的论文曾评价方法称，这种做法在规模方面不可靠，当网络较深时注意力机制不稳定；复制罕见字可能并不总是最好的策略，有时音译可能更合适。

基于单词和字符的模型

前面提到”复制”机制在处理罕见或未知的单词时仍然不够，解决的另一个方向是分词操作。一种趋势是使用相同的seq2seq架构，但在更小的单元上操作——基于字符的分词模型。另一个趋势是为单词和字符采用混合架构。

词汇分割

Sennrich等人提出了一种方法，通过将罕见的和未知的单词表示为一组子单词单元来实现开放词汇翻译。

这是通过采用一种称为字节对编码（Byte Pair Encoding）的压缩算法来实现的。其基本思想是从一个字符词汇表vocabulary开始，不断扩展数据集中n-gram对最频繁的词汇表。例如下图中，数据集包含4个单词，对应的频率在左边，即“low”出现5次。用(p, q, f)表示一个n-gram对p, q及其频率f。在图中，已经选择了最频繁的n-gram对(e,s,9)，现在正在添加当前最频繁的n-gram对(es,t,9)。重复此过程，直到选择所有的n-gram对或词汇表大小达到某个阈值。

可以选择为训练集和测试集构建单独的词汇表，或者联合构建一个词汇表。词汇表构建后可直接在这些词段上训练具有seq2seq体系结构的NMT系统。

基于字符的模型

Ling等人提出了一种基于字符的模型来支持开放词汇表的单词表示。对于每个包含m个字符的单词w，该模型不是存储一个嵌入的单词，而是遍历所有字符 $c_1,c_2,…,c_m$ 来查找字符嵌入 $e_1,e_2,...,e_m$ ，然后将这些字符feed到一个biLSTM中，分别得到正向和反向的最终隐藏状态 $h_f,h_b$ 。最终词嵌入由两种隐藏状态的仿射变换计算得到 $e_w=W_fH_f+W_bH_b+b$ 还有一系列基于CNN的字符模型将在之后的笔记中介绍。

混合NMT

Luong等人提出了一种混合词元模型来处理未知词。该系统主要在单词级进行翻译，并查询罕见单词的字符组成。在高层次上，字符级RNN计算源词表示，并在需要时恢复未知目标词。这种混合方法的双重优势是，比基于字符的方法更快、更容易训练，同时，它不像基于单词的模型那样生成未知单词。

基于单词的翻译主干。混合NMT的核心是一个深层的LSTM编码器-解码器，可以在单词级进行翻译。为每种语言保留一个大小为 $∣ V ∣$ 的词汇表，使用表示表外词汇。
基于源字符的表示。在一般的基于单词的NMT中，一个通用的嵌入用于表示所有表外单词。这种方法丢弃了关于源单词的有价值的信息。这里学习一个关于罕见字字符的深层LSTM，并使用LSTM的最终隐藏状态作为罕见字的表示。
目标字符级生成。一般基于单词的NMT允许在目标输出中生成。这里的目标是创建一个能处理不限输出词汇表的框架。解决方案是使用一个单独的深层LSTM，在给定当前单词级状态下进行字符级“翻译”。注意，当前单词上下文用于初始化字符级编码器。该系统经过这样的训练，每当单词级NMT产生时，就要求字符级解码器恢复未知目标单词的正确表面形式。

不可多得的风味小吃——读杨勇的《家园四书》（笔记4）潜2023
身为亳州人，谁不喜欢了解亳州事？读杨勇先生（雅不知）的《家园四书》，相当于走进了亳州，了解她的过去和现在。《家园四书》总共有四部分组成，每一部分都是一道亳州风味的小吃，让你了解亳州的同时，更能咀嚼出她的美。《历史书：明月前身》写了亳州诸多历史人物。写得厚重大气，篇篇有铮铮铁骨，文笔刚劲有力，也不乏诙谐，偶有文白相间之处，读来很有韵味，像作者的书法，需得细细地品。它是亳州的肉夹馍，咔吱一口咬下去，满
Matlab学习笔记：矩阵基础
MATLAB学习笔记：矩阵基础作为MATLAB的核心，矩阵是处理数据的基础工具。矩阵本质上是一个二维数组，由行和列组成，用于存储和操作数值数据。在本节中，我将详细讲解矩阵的所有知识点，包括创建、索引、运算、函数等，确保内容通俗易懂。我会在关键地方添加MATLAB代码示例，帮助你直观理解。最后，我会总结本课重点，并引出下一节“逻辑基础”的内容。一、什么是矩阵？在MATLAB中，矩阵是一个二维数组，元
ROS个人笔记
写在前面：由于个人原因距离上次学习ROS已经过去了2周时间，本以为时间不算长，但还是忘记了好多。因此写下这篇笔记，主要是记录学习过程中的概念性问题，程序代码可能会写，但是不是主要。1.ROS是什么：是一个生态系统，首先他是一个操作系统。统筹各种资源如通信，开发等。2.在以往开发时一旦工程庞大起来往往会对数据流通的耦合十分苦恼，因此ROS提供的通信方式为松耦合式的：节点Node。另外大工程时的另外一
20180818《遇见心想事成的自己》读书笔记苗苗聊成长
读书时间：20180813-20180818此书主要分为两部分，第一部分是心想事成的秘密，第二部分是秘密后的秘密。看到这两个主题就想起，曾经有些时候，也会期盼着能够心想事成，让自己在困境中突围，然而往往不管用，上天总是不会给到你想要的东西。看了此书才恍然大悟，原来心想事成也有方法，也讲套路。秘密后的秘密，才是核心。在这个快餐式的时代，很多时候我们只学一些表面上的术，就想达成所愿，化解一切难题，往往
HCIP第一、二章笔记整理 aaaBsBsBsB 笔记网络 tcp/ip
第一章：TCP协议的扩展一、面向连接点到点：TCP通讯中仅存在通讯双方，无第三方。连接性质：非物理链路上的连接，而是逻辑上的连接。二、TCP的报文结构核心字段：包括源端口号（16位）、目标端口号（16位）、序列号（32位）、确认应答号（32位）、首部长度（4位）、保留位（6位）、标记位（如SYN、ACK、RST等）、窗口大小（16位）、校验和（16位）、紧急指针（16位）、选项（可变长度）及数据。
HCIP第一天课程笔记整理搞IT的马哥 IP 网络网络协议 tcp/ip 服务器
HCIP----huawei认证高级工程师抽象语言先转化成编码编码一定要转化成二进制（为什么一定要转化成二进制？）二进制信号转化成电信号处理电信号（协议等同于标准，目的就是提升服务）（1876年电话诞生，1946年第一台电子计算机诞生）OSI参考模型---OSI/RM---ISO（国际标准化组织）---1979年颁布开放式系统互联参考模型（应表会传网数物）应用层---提供各种应用服务，将抽象语言转
小红书增加曝光率晓谈小红书_46f9
小红书目前来说的话，主要是依靠内容口碑模式，社群类型营销，笔记，类似于大众电商类型，但是我个人觉得小红书更有优势，以下是我发过的一些操作推广小技巧可以了解下。推广大致大家都大同小异，我只能给予一些适当帮助，如有推广业务需求可以随时私聊我。以下是我个人一些增加曝光率一些方式1：过硬的内容加上适当的曝光，点赞，评论，收藏，转发，等于文章的热度与曝光率2：内容过硬的同时，文章也需要注意一下排版，底色，文
CA复习功课陈小铃子 linux 运维服务器云原生
RHCSA复习笔记（完善版）一、文件管理创建文件/目录：touch[文件名]：创建空文件或更新现有文件时间戳。mkdir[目录名]：创建目录。常用选项：-p递归创建多级目录。查看文件/目录：ls[选项][文件/目录]：列出目录内容。常用选项：-l详细列表，-a显示隐藏文件，-h人性化大小显示。cat[文件名]：查看文件内容（小文件），无法翻页。less[文件名]：分页查看文件内容，支持搜索（/），
《自由人生》读书笔记 2 西红柿阿达
原文:问题：“人生有何意义？”其实这个问题是容易解答的。人生的意义全是各人自己寻出来，造出来的：高尚、卑劣、清贵、污浊、有用、无用……全靠自己的作为。生命本身不过是一件生物学的事实，有什么意义可说？生一个人与一只猫、一只狗，有什么分别？人生的意义不在于何以有生，而在于自己怎样生活。你若情愿把这六尺之躯葬送在白昼做梦之上，那就是你这一生的意义。你若发愤振作起来，决心去寻求生命的意义，去创造自己的生命
C练题笔记之：牛客-HJ012.字符串反转
题目：描述接受一个只包含小写字母的字符串，然后输出该字符串反转后的字符串。（字符串长度不超过1000）输入描述：输入一行，为一个只包含小写字母的字符串。输出描述：输出该字符串反转后的字符串。示例1输入：abcd复制输出：dcba结果：解题思路：获取字符串，用双指针，一头一尾开始交换，直至到中间。代码：#include#includeintmain(){charstr[1024]={};scanf(
STM32F4-ETH通信（lwip）——学习笔记_stm32 lwip 2401_84010497 程序员嵌入式
7、CSMA/CD冲突检测：8、MAC子层：MAC数据包、MAC数据包格式、MAC地址：MAC地址由48位数字组成，它是网卡的物理地址，在以太网传输的最底层，就是根据MAC地址来收发数据的。部分MAC地址用于广播和多播，在同一个网络里不能有两个相同的MAC地址。PC的网卡在出厂时已经设置好了MAC地址，但也可以通过一些软件来进行修改，在嵌入式的以太网控制器中可由程序进行配置。数据包中的DA是目标地
日更92/365：我为什么要写作？富足的徐欢
我为什么要写作？这是真是一个好问题，若在做一件事情之前，知道自己的目标动机和需求，才能排序，分配好自己的时间。余生我想把写作当成我的习惯，因为在写作上面我可以有下面三个方面的提升：1.整理笔记有时，我们听完一堂课，会感觉到心潮澎湃，可是若没有把它整理成笔记或写践行清单，假以时日，这些没有被运用或链接的知识信息会在大脑处抹去。所以整理笔记是最优的辅助学习方法。2.梳理情绪相信大家都有这种体验，当我们
解决修改android手机设置中字体大小后系统布局混乱的方法 f44148db1e8c
均属于笔记，仅供个人参考，有问题欢迎指正重写getResources方法@OverridepublicResourcesgetResources(){//returnsuper.getResources();//解决修改android手机设置中字体大小后系统布局混乱的方法，重构getResources，修改系统倍数对应用内sp的影响；Resourcesres=super.getResources(
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
读书笔记||《焦虑者自救手册》（二）徐小胖杂谈
书名：《焦虑者自救手册》阅读进度：43-83页阅读时间：30分钟阅读思考问题：1、关于忧虑的5种积极信念2、列举一个你的忧虑案例，用以上的五种积极信念进行分析，看看你赞成哪种或者哪几种信念？3、对忧虑进行审判时，我们通常需要扮演哪三种角色？4、用你自己忧虑的一个例子，分别用辩方律师和公诉律师的角度，为它辩护，写下证词。5、最终经过以上辩护，你将得出怎样的判决？金句摘抄：1、如果你对某件事感到忧虑，
京东618大额券怎么领？京东有大额优惠券吗？直返APP淘客项目
京东618购物节：解锁APP直返大额券，畅享购物狂欢京东618购物节，这场年度购物盛宴，无疑是每一位消费者心中的期盼。在这场盛宴中，大额优惠券如同宝藏一般，等待着精明的你去发掘。而掌握领取大额券的秘诀，将让你的购物之旅更加畅快淋漓，尤其是当你充分利用京东APP的优势时。一、如何在京东APP轻松领取大额券？月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）返利就用
“重复”定义函数的睿智(Python/与ai助手“智普清言”深度交流) 梦幻精灵_cq 笔记学习
镜像双胞谬重复，定制便捷巧活工。笔记模板由python脚本于2025-07-1612:16:30创建，本篇笔记适合至少通晓一门语言，熟悉基本编程范式的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/F
偶拾《退让》，一阙仿七律带出的文化思考(中文诗创作) 梦幻精灵_cq 笔记学习
礼貌温言沐春风，谦让理解通彼此。笔记模板由python脚本于2025-07-0111:29:03创建，本篇笔记适合喜欢中文仿古七言诗的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/Free：大咖
2022年第六次一周小结（09.11-09.17）龚宇佳
上周总结：1.阅读28h。第一，上周整理了《深度思维》剩余笔记，目前整本书的笔记都整理完成。第二，开始阅读黄奇帆的《分析与思考》，之前看过他的《结构性改革》，两本书有相似的地方，但值得一看。第三，继续精读《态度改变与社会影响》，需要思考和做笔记的比较多，因此进度比我想得要慢，上周没有达成计划目标。2.写作2h。上周继续保持日更。3.语言学习12.5h。I.粤语学习方面。模仿电影《回魂夜》，且听黄子
【软考速通笔记】系统架构设计师⑱——大数据架构设计理论与实践小康师兄系统架构设计师笔记系统架构大数据 Lanbda Kappa 数据湖批处理
文章目录一、前言二、传统数据库遇到的问题2.1问题的根源2.2传统解决方法三、大数据基础3.1大数据处理技术3.2大数据利用过程3.3大数据处理系统面临的挑战3.4大数据具有的属性和特征四、Lanbda架构4.1批处理层4.2加速层4.3服务层五、Kappa架构5.1实时层5.2服务层六、Lambda和Kappa对比七、其他一、前言笔记目录大纲请查阅：【软考速通笔记】系统架构设计师——导读关注【小
Here-Document的`＜＜` 与 `＜＜-` 与 `＜＜＜` 多解说笔记250722 kfepiza #Linux #控制台命令行 Shell bash cmd 等笔记 linux bash
Here-Document的poem.txt静夜思床前明月光疑是地上霜FORMATTED#2.空格敏感的配置catconfig.ymlindentation:level:4#必须4空格SPACE何时用tabs.txt重要制表符:→这里Tab会被保留但行首Tab会被移除TABS#2.空格缩进的环境#（如Python脚本）技术原理图解HereDocumentquery.sqlSELECT*FROM${
从 0 到 1 搞定nvidia 独显推流：硬件视频编码环境安装完整学习笔记 lxmyzzs 图像算法之音视频编解码音视频学习笔记
笔记用于安装和配置一套完整的媒体处理工具链，包括NVIDIA编码头文件、带CUDA加速的FFmpeg以及ZLMediaKit流媒体服务框架，适用于需要进行视频编解码、流媒体推流/拉流等场景的开发与部署。标题核心组件及版本说明nv-codec-headers来源：Gitee仓库jario-jin/nv-codec-headers版本：n11.1.5.0（对应NVIDIAVideoCodecSDK接口
学习笔记56-(已解决)pip指令下载超时Read timed out错误李卓璐报错整理 pip
(已解决)pip指令下载超时Readtimedout错误下了一上午卡到自闭然后查了很多帖子，最后更换国内安装源和设置超时时间可以解决。在pip3installXXX命令的后面加上–default-timeout=100-ihttps://pypi.tuna.tsinghua.edu.cn/simple
《历史的温度：寻找历史背面的故事、热血和真性情》读书笔记（一）选科规划与志愿填报_让梦想起航
纵观民国历史，像蔡锷这样不党不群、不要地盘不拉军队的将军，真的找不到第二个。而偏偏就是这个只念国家、不念私人的将军，对中国的进程产生了影响。无须向他道歉，当然，他也从来无须向任何人道歉。他是一个中国体育以后可能再也不会出现的运动员——不是说他的运动成就，而是他的人生遭遇：大起大落，大喜大悲，大彻大悟。他就是刘翔。在特定的大时代背景下，我们又有谁，有能力掌控自己的命运呢？我相信对于大部分男生来说，那
registry-ui docker搭建私有仓库的一些问题笔记深圳卢先生 ui docker 笔记
搭建私有仓库，用docker-registry作为仓库，docker-registry-ui作为界面。原来的docker-compose.yml如下services:registry:image:registry:2container_name:registryports:-"5000:5000"#外网访问的端口volumes:-./data:/var/lib/registry#用于持久化数据存储
今日读书笔记分享小朗_18f9
1.如果我们通过批评来提出主张，人们的反应常常是申辩或反击。反之，如果我们直接说出需要，其他人就较有可能做出积极的回应。2.如果我们不看重自己的需要，别人可能也不会。实际上，如果直接说出需要，获得积极回应的可能性就会增加。3.真诚待人比委曲求全更为可贵。如果别人感到不安，我们可以认真地倾听，但无须责备自己。4.我们意识到，虽然我们对自己的意愿、感受和行动负有完全的责任，但无法为他人负责。我们还发现
2015笔记——富文本满庭花醉三千客
鉴于之前遇到富文本的东西，一窍不通，如今是要好好学习学习了，先从最基本的开始吧：屏幕快照2015-12-1016.28.40.png我分别设置了字号、字体颜色、下划线、字体及大小、删除线。接下来给label赋值：屏幕快照2015-12-1016.29.09.png为了直观，我给label添加了背景色。接下来就是看效果了：屏幕快照2015-12-1016.33.43.png是不是很简单呢？加油！
《恋恋笔记本》:不仅仅是爱之絮语平生灯火
琼瑶式的浪漫爱情童话，加上好莱坞经典的编织手段，成就了无数影迷津津乐道的一部纯爱经典。象我这个年纪，为此感动和沉醉似乎已不太可能，但竟然也会有一些或柔软或稀奇古怪的感慨。演变中的爱情主题词。季节有寒来暑往，人生有红颜白发。一路走过爱情的旅途，每一程都有不同的风景，不同的感受。年轻的时候，爱是青春不顾一切的燃烧。就像艾丽和诺亚的十七岁一样，每个人也许都曾有那么一个夏天，爱情将青春燃烧得肆无忌惮，燃烧
2024年十大返利app排行榜,全网佣金超高的返利平台推荐十款直返APP淘宝优惠券
随着电子商务的快速发展和互联网消费的普及，越来越多的人开始关注返利软件。返利软件作为一种便捷的消费理财方式，不仅可以让用户在购物时享受到优惠折扣，还能通过返利机制获得额外的佣金。在这篇文章中，我们将为大家介绍返利软件十大排行榜以及返利佣金最高的APP。月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）一、直返直返的口号是“返利就用直返”，它强调没有上级赚差价，直
读书笔记 kissmoonmiss
读《有钱人为何用长钱包》读了整本书，如果让我用一句话总计，那么我觉得最合适的话就是：你善待钱，钱善待你。而对于现今的我们来说，可能越来越少的人出门还带着钱包，表面上整本书的观点和建议也许不太用的上，但是我想，其实作者希望我们知道的是，我们应该控制好自己的金钱流向，每一笔钱都花在刀刃上，而不是随意花钱从不记账（这里我就想到自己，上大学以来，虽然每个月父母会给一定的生活费，但是从来都是入不敷出，自己从
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s