ShowMeAI

斯坦福NLP名课带学详解 | CS224n 第8讲 - 机器翻译、seq2seq与注意力机制（NLP通关指南·完结）

作者：韩信子@ShowMeAI，路遥@ShowMeAI，奇异果@ShowMeAI
教程地址：http://www.showmeai.tech/tutorials/36
本文地址：http://www.showmeai.tech/article-detail/243
声明：版权所有，转载请联系平台与作者并注明出处
收藏ShowMeAI查看更多精彩内容

ShowMeAI为斯坦福CS224n《自然语言处理与深度学习(Natural Language Processing with Deep Learning)》课程的全部课件，做了中文翻译和注释，并制作成了GIF动图！

本讲内容的深度总结教程可以在这里查看。视频和课件等资料的获取方式见文末。

引言

本篇内容覆盖

引入新任务：机器翻译
引入一种新的神经结构：sequence-to-sequence
- 机器翻译是 sequence-to-sequence 的一个主要用例
引入一种新的神经技术：注意力
- sequence-to-sequence 通过 attention 得到提升

1.机器翻译与SMT（统计机器翻译）

1.1 Pre-neural Machine Translation

1.2 机器翻译

机器翻译(MT)是将一个句子 $x$ 从一种语言(源语言)转换为另一种语言(目标语言)的句子 $y$ 的任务。

1.3 1950s：早期机器翻译

机器翻译研究始于20世纪50年代初。

俄语 → 英语(冷战的推动)
系统主要是基于规则的，使用双语词典来讲俄语单词映射为对应的英语部分

1.4 1990s-2010s：统计机器翻译

核心想法：从数据中学习概率模型
假设我们正在翻译法语 → 英语
对于给定法语句子 $x$ ，我们想要找到最好的英语句子 $y$

$argmax_yP(y \mid x)$

使用Bayes规则将其分解为两个组件从而分别学习

$argmax_yP(x \mid y) P(y)$

$\mid y)$ ：Translation Model / 翻译模型
- 分析单词和短语应该如何翻译(逼真)
- 从并行数据中学习
$P (y)$ ：Language Model / 语言模型
- 模型如何写出好英语(流利)
- 从单语数据中学习

1.5 1990s-2010s：统计机器翻译

问题：如何学习翻译模型 P(x \mid y)？
首先，需要大量的并行数据(例如成对的人工翻译的法语/英语句子)

1.6 SMT的学习对齐

问题：如何从并行语料库中学习翻译模型 $\mid y)$ ？
进一步分解：我们实际上想要考虑

$\mid y)$

$a$ 是对齐
即法语句子 $x$ 和英语句子 $y$ 之间的单词级对应

1.7 对齐

Examples from: “The Mathematics of Statistical Machine Translation: Parameter Estimation", Brown et al, 1993. http://www.aclweb.org/anthology/J93-2003

对齐是翻译句子中特定词语之间的对应关系
- 注意：有些词没有对应词

1.8 对齐是复杂的

对齐可以是多对一的

1.9 对齐是复杂的

对齐可以是一对多的

1.10 对齐是复杂的

有些词很丰富
对齐可以是多对多(短语级)
我们学习很多因素的组合，包括
- 特定单词对齐的概率(也取决于发送位置)
- 特定单词具有特定多词对应的概率(对应单词的数量)

1.11 SMT的学习对齐

问题：如何计算argmax
- 我们可以列举所有可能的 $y$ 并计算概率？→ 计算成本太高
回答：使用启发式搜索算法搜索最佳翻译，丢弃概率过低的假设
- 这个过程称为解码

1.12 SMT解码

Source: ”Statistical Machine Translation", Chapter 6, Koehn, 2009. https://www.cambridge.org/core/books/statistical-machine-translation/94EADF9F680558E13BE759997553CDE5

1.13 SMT解码

1.14 1990s-2010s：统计机器翻译

SMT是一个巨大的研究领域
最好的系统非常复杂
- 数以百计的重要细节我们还没有提到
- 系统有许多独立设计子组件工程
- 大量特征工程
  - 很多功能需要设计特性来获取特定的语言现象
- 需要编译和维护额外的资源
  - 比如双语短语对应表
- 需要大量的人力来维护
  - 对于每一对语言都需要重复操作

2.神经网络机器翻译

2.1 Neural Machine Translation

2.2 神经机器翻译(NMT)

2.3 神经机器翻译(NMT)

神经机器翻译(NMT)是利用单个神经网络进行机器翻译的一种方法
神经网络架构称为 sequence-to-sequence (又名seq2seq)，它包含两个RNNs

2.4 神经机器翻译(NMT)

编码器RNN生成源语句的编码
源语句的编码为解码器RNN提供初始隐藏状态
解码器RNN是一种以编码为条件生成目标句的语言模型
注意：此图显示了测试时行为 → 解码器输出作为下一步的输入

2.5 Sequence-to-sequence是多功能的！

序列到序列不仅仅对机器翻译有用
许多NLP任务可以按照顺序进行表达
- 摘要(长文本 → 短文本)
- 对话(前一句话 → 下一句话)
- 解析(输入文本 → 输出解析为序列)
- 代码生成(自然语言 → Python代码)

2.6 神经机器翻译(NMT)

sequence-to-sequence 模型是条件语言模型的一个例子
- 语言模型(Language Model)，因为解码器正在预测目标句的下一个单词 $y$
- 条件约束的(Conditional)，因为预测也取决于源句 $x$
NMT直接计算 $\mid x)$

$x)=P\left(y_{1} | x\right) P\left(y_{2} | y_{1}, x\right) P\left(y_{3} | y_{1}, y_{2}, x\right) \ldots P\left(y_{T} | y_{1}, \ldots, y_{T-1}, x\right)$

上式中最后一项为，给定到目前为止的目标词和源句 $x$ ，下一个目标词的概率
问题：如何训练NMT系统？
回答：找一个大的平行语料库

2.7 训练一个机器翻译系统

Seq2seq被优化为一个单一的系统。反向传播运行在“端到端”中

3.机器翻译解码

3.1 贪婪解码

我们了解了如何生成(或“解码”)目标句，通过对解码器的每个步骤使用 argmax
这是贪婪解码(每一步都取最可能的单词)
这种方法有问题吗？

3.2 贪婪解码的问题

贪婪解码没有办法撤销决定
如何修复？

3.3 穷举搜索解码

理想情况下，我们想要找到一个(长度为 $T$ )的翻译 $y$ 使其最大化
我们可以尝试计算所有可能的序列 $y$
- 这意味着在解码器的每一步 $t$ ，我们跟踪 $V^t$ 个可能的部分翻译，其中 $V$ 是 vocab 大小
- 这种 $O(V^T)$ 的复杂性太昂贵了！

3.4 集束搜索解码

核心思想：在解码器的每一步，跟踪 $k$ 个最可能的部分翻译(我们称之为假设[hypotheses ] )
- $k$ 是Beam的大小(实际中大约是5到10)
假设 $y_1, \ldots,y_t$ 有一个分数，即它的对数概率

$\operatorname{score}\left(y_{1}, \ldots, y_{t}\right)=\log P_{\mathrm{LM}}\left(y_{1}, \ldots, y_{t} | x\right)=\sum_{i=1}^{t} \log P_{\operatorname{LM}}\left(y_{i} | y_{1}, \ldots, y_{i-1}, x\right)$

分数都是负数，分数越高越好
我们寻找得分较高的假设，跟踪每一步的 top k 个部分翻译
波束搜索 不一定能 找到最优解
但比穷举搜索效率高得多

3.5 集束搜索解码：示例

Beam size = k = 2
蓝色的数字是

$\operatorname{score}\left(y_{1}, \ldots, y_{t}\right)=\sum_{i=1}^{t} \log P_{\operatorname{LM}}\left(y_{i} | y_{1}, \ldots, y_{i-1}, x\right)$

计算下一个单词的概率分布
取前 $k$ 个单词并计算分数
- 对于每一次的 $k$ 个假设，找出最前面的 $k$ 个单词并计算分数
- 在 $k^2$ 的假设中，保留 $k$ 个最高的分值
  - $t = 2$ 时，保留分数最高的 hit 和 was
  - $t = 3$ 时，保留分数最高的 a 和 me
  - $t = 4$ 时，保留分数最高的 pie 和 with
  - $t = 5$ 时，保留分数最高的 a 和 one
  - $t = 6$ 时，保留分数最高的 pie
这是最高得分的假设
回溯以获得完整的假设

3.6 集束搜索解码：停止判据

在贪心解码中，我们通常解码到模型产生一个令牌
- 例如： he hit me with a pie
在集束搜索解码中，不同的假设可能在不同的时间步长上产生令牌
- 当一个假设生成了令牌，该假设完成
- 把它放在一边，通过 Beam Search 继续探索其他假设
通常我们继续进行 Beam Search ，直到
- 我们到达时间步长 $T$ (其中 $T$ 是预定义截止点)
- 我们至少有 $n$ 个已完成的假设(其中 $n$ 是预定义截止点)

3.7 集束搜索解码：完成

我们有完整的假设列表
如何选择得分最高的？
我们清单上的每个假设 $y_1, \ldots ,y_t$ 都有一个分数

$\operatorname{score}\left(y_{1}, \ldots, y_{t}\right)=\log P_{\mathrm{LM}}\left(y_{1}, \ldots, y_{t} \mid x\right)=\sum_{i=1}^{t} \log P_{\operatorname{LM}}\left(y_{i} \mid y_{1}, \ldots, y_{i-1}, x\right)$

问题在于 ：较长的假设得分较低
修正：按长度标准化。用下式来选择top one

$\frac{1}{t} \sum_{i=1}^{t} \log P_{\mathrm{LM}}\left(y_{i} \mid y_{1}, \ldots, y_{i-1}, x\right)$

3.8 神经机器翻译(NMT)的优点

与SMT相比，NMT有很多优点

更好的性能
- 更流利
- 更好地使用上下文
- 更好地使用短语相似性
单个神经网络端到端优化
- 没有子组件需要单独优化
需要更少的人类工程付出
- 无特征工程
- 所有语言对的方法相同

3.9 神经机器翻译(NMT)的缺点

SMT相比，NMT的缺点

NMT的可解释性较差
- 难以调试
NMT很难控制
- 例如，不能轻松指定翻译规则或指南
- 安全问题

4.机器翻译评估

4.1 如何评估机器翻译质量

BLEU (Bilingual Evaluation Understudy)
- 你将会在 Assignment 4 中看到BLEU的细节
BLEU将机器翻译和人工翻译(一个或多个)，并计算一个相似的分数
- n-gram 精度 (n通常为1-4)
- 对过于短的机器翻译的加上惩罚
BLEU很有用，但不完美
- 有很多有效的方法来翻译一个句子
- 所以一个好的翻译可以得到一个糟糕的BLEU score，因为它与人工翻译的n-gram重叠较低

4.2 MT随时间推移的进步

Source: http://www.meta-net.eu/events/meta-forum-2016/slides/09_sennrich.pdf

4.3 NMT：NLP深度学习的最大成功案例

神经机器翻译于2014年从边缘研究活动到2016年成为领先标准方法

2014：第一篇 seq2seq 的文章发布
2016：谷歌翻译从 SMT 换成了 NMT
这是惊人的
- 由数百名工程师历经多年打造的SMT系统，在短短几个月内就被少数工程师训练过的NMT系统超越

4.4 机器翻译问题完美解决了吗？

Further reading: “Has AI surpassed humans at translation? Not even close!” https://www.skynettoday.com/editorials/state_of_nmt

Source: https://hackernoon.com/bias-sexist-or-this-is-the-way-it-should-be-ce1f7c8c683c

Picture source: https://www.vice.com/en_uk/article/j5npeg/why-is-google-translate-spitting-out-sinister-religious-prophecies

Explanation: https://www.skynettoday.com/briefs/google-nmt-prophecies

没有！
许多困难仍然存在
- 词表外的单词处理
- 训练和测试数据之间的领域不匹配
- 在较长文本上维护上下文
- 资源较低的语言对
使用常识仍然很难
NMT在训练数据中发现偏差
无法解释的系统会做一些奇怪的事情

4.5 NMT研究仍在继续

NMT是NLP深度学习的核心任务
NMT研究引领了NLP深度学习的许多最新创新
2019年：NMT研究将继续蓬勃发展
- 研究人员发现，对于我们今天介绍的普通seq2seq NMT系统，有很多、很多的改进。
- 但有一个改进是如此不可或缺

5.注意力机制

5.1 Attention

5.2 Sequence-to-sequence：瓶颈问题

源语句的编码
需要捕获关于源语句的所有信息
信息瓶颈！

5.3 注意力

注意力为瓶颈问题提供了一个解决方案
核心理念：在解码器的每一步，使用与编码器的直接连接来专注于源序列的特定部分
首先我们将通过图表展示(没有方程)，然后我们将用方程展示

5.4 带注意力机制的序列到序列模型

将解码器部分的第一个token 与源语句中的每一个时间步的隐藏状态进行 Dot Product 得到每一时间步的分数
通过softmax将分数转化为概率分布
在这个解码器时间步长上，我们主要关注第一个编码器隐藏状态(“he”)
利用注意力分布对编码器的隐藏状态进行加权求和
注意力输出主要包含来自于受到高度关注的隐藏状态的信息
连接的注意力输出与解码器隐藏状态 ，然后用来计算 $\hat y_1$
有时，我们从前面的步骤中提取注意力输出，并将其输入解码器(连同通常的解码器输入)。我们在作业4中做这个。

5.5 注意力：公式

我们有编码器隐藏状态 $h_{1}, \ldots, h_{N} \in \mathbb{R}^{h}$
在时间步 $t$ 上，我们有解码器隐藏状态 $s_{t} \in \mathbb{R}^{h}$
我们得到这一步的注意分数

$e^{t}=\left[s_{t}^{T} \boldsymbol{h}_{1}, \ldots, \boldsymbol{s}_{t}^{T} \boldsymbol{h}_{N}\right] \in \mathbb{R}^{N}$

我们使用softmax得到这一步的注意分布 $\alpha^{t}$ (这是一个概率分布，和为1)

$\alpha^{t}=\operatorname{softmax}\left(e^{t}\right) \in \mathbb{R}^{N}$

我们使用 $\alpha^{t}$ 来获得编码器隐藏状态的加权和，得到注意力输出 $\alpha^{t}$

$\boldsymbol{a}_{t}=\sum_{i=1}^{N} \alpha_{i}^{t} \boldsymbol{h}_{i} \in \mathbb{R}^{h}$

最后，我们将注意输出 $\alpha^{t}$ 与解码器隐藏状态连接起来，并按照非注意 seq2seq 模型继续进行

$\left[\boldsymbol{a}_{t} ; \boldsymbol{s}_{t}\right] \in \mathbb{R}^{2 h}$

5.6 注意力很棒！

注意力显著提高了NMT性能
- 这是非常有用的，让解码器专注于某些部分的源语句
注意力解决瓶颈问题
- 注意力允许解码器直接查看源语句；绕过瓶颈
注意力帮助消失梯度问题
- 提供了通往遥远状态的捷径
注意力提供了一些可解释性
- 通过检查注意力的分布，我们可以看到解码器在关注什么
- 我们可以免费得到(软)对齐
- 这很酷，因为我们从来没有明确训练过对齐系统
- 网络只是自主学习了对齐

5.7 注意力是一种普遍的深度学习技巧

我们已经看到，注意力是改进机器翻译的序列到序列模型的一个很好的方法
然而：你可以在许多结构(不仅仅是seq2seq)和许多任务(不仅仅是MT)中使用注意力
我们有时说 query attends to the values
例如，在seq2seq + attention模型中，每个解码器的隐藏状态(查询)关注所有编码器的隐藏状态(值)

5.8 注意力是一种普遍的深度学习技巧

注意力的更一般定义
- 给定一组向量值和一个向量查询，注意力是一种根据查询，计算值的加权和的技术
直觉
- 加权和是值中包含的信息的选择性汇总，查询在其中确定要关注哪些值
- 注意是一种获取任意一组表示(值)的固定大小表示的方法，依赖于其他一些表示(查询)。

5.9 有几种注意力的变体

候选值 $\boldsymbol{h}_{1}, \ldots, \boldsymbol{h}_{N} \in \mathbb{R}^{d_{1}}$ ，查询 $\in \mathbb{R}^{d_{2}}$
注意力总是包括：
- 计算注意力得分 $\in \mathbb{R}^{N}$ (很多种计算方式)
- 采取softmax来获得注意力分布 $\alpha$

$\alpha=\operatorname{softmax}(\boldsymbol{e}) \in \mathbb{R}^{N}$

使用注意力分布对值进行加权求和：从而得到注意力输出 $\alpha$ (有时称为上下文向量)

$\boldsymbol{a}=\sum_{i=1}^{N} \alpha_{i} \boldsymbol{h}_{i} \in \mathbb{R}^{d_{1}}$

5.10 注意力的变体

More information: “Deep Learning for NLP Best Practices”, Ruder, 2017. http://ruder.io/deep-learning-nlp-best-practices/index.html#attention
“Massive Exploration of Neural Machine Translation Architectures”, Britz et al, 2017, https://arxiv.org/pdf/1703.03906.pdf

有几种方法可以从 $\boldsymbol{h}_{1}, \ldots, \boldsymbol{h}_{N} \in \mathbb{R}^{d_{1}}$ 计算 $\in \mathbb{R}^{N}$ 和 $\in \mathbb{R}^{d_{2}}$
基本的点乘注意力 $\boldsymbol{e}_{i}=\boldsymbol{s}^{T} \boldsymbol{h}_{i} \in \mathbb{R}$
- 注意：这里假设 $d_1 = d_2$ [这是我们之前看到的版本]
乘法注意力 $e_{i}=s^{T} \boldsymbol{W} \boldsymbol{h}_{i} \in \mathbb{R}$
- $\boldsymbol{W} \in \mathbb{R}^{d_{2} \times d_{1}}$ 是权重矩阵
加法注意力 $e_{i}=\boldsymbol{v}^{T} \tanh \left(\boldsymbol{W}_{1} \boldsymbol{h}_{i}+\boldsymbol{W}_{2} \boldsymbol{s}\right) \in \mathbb{R}$
- 其中 $\boldsymbol{W}_{1} \in \mathbb{R}^{d_{3} \times d_{1}}, \boldsymbol{W}_{2} \in \mathbb{R}^{d_{3} \times d_{2}}$ 是权重矩阵， $\boldsymbol{v} \in \mathbb{R}^{d_{3}}$ 是权重向量， $d_3$ (注意力维度)是一个超参数

5.11 课程总结

我们学习了一些机器翻译的历史
自2014年以来，神经机器翻译迅速取代了复杂的统计机器翻译
Sequence-to-sequence 是NMT的体系结构(使用2个RNN)
注意力是一种集中注意力的方法
- 从序列到序列改进了很多

6.视频教程

可以点击 B站查看视频的【双语字幕】版本

【双语字幕+资料下载】斯坦福CS224n | 深度学习与自然语言处理(2019·全20讲)

7.参考资料

《斯坦福NLP名课带学详解 | CS224n》本讲带学的动态翻页PPT在线阅翻页-Lecture8
《斯坦福CS224n深度学习与自然语言处理》课程学习指南
《斯坦福CS224n深度学习与自然语言处理》课程大作业解析
【双语字幕视频】斯坦福CS224n | 深度学习与自然语言处理(2019·全20讲)
Stanford官网 | CS224n: Natural Language Processing with Deep Learning

ShowMeAI 深度学习与自然语言处理教程（完整版）

ShowMeAI 深度学习与自然语言处理教程(1) - 词向量、SVD分解与Word2vec
ShowMeAI 深度学习与自然语言处理教程(2) - GloVe及词向量的训练与评估
ShowMeAI 深度学习与自然语言处理教程(3) - 神经网络与反向传播
ShowMeAI 深度学习与自然语言处理教程(4) - 句法分析与依存解析
ShowMeAI 深度学习与自然语言处理教程(5) - 语言模型、RNN、GRU与LSTM
ShowMeAI 深度学习与自然语言处理教程(6) - 神经机器翻译、seq2seq与注意力机制
ShowMeAI 深度学习与自然语言处理教程(7) - 问答系统
ShowMeAI 深度学习与自然语言处理教程(8) - NLP中的卷积神经网络
ShowMeAI 深度学习与自然语言处理教程(9) - 句法分析与树形递归神经网络

ShowMeAI 斯坦福NLP名课 CS224n带学详解（20讲·完整版）

斯坦福NLP名课带学详解 | CS224n 第1讲 - NLP介绍与词向量初步
斯坦福NLP名课带学详解 | CS224n 第2讲 - 词向量进阶
斯坦福NLP名课带学详解 | CS224n 第3讲 - 神经网络知识回顾
斯坦福NLP名课带学详解 | CS224n 第4讲 - 神经网络反向传播与计算图
斯坦福NLP名课带学详解 | CS224n 第5讲 - 句法分析与依存解析
斯坦福NLP名课带学详解 | CS224n 第6讲 - 循环神经网络与语言模型
斯坦福NLP名课带学详解 | CS224n 第7讲 - 梯度消失问题与RNN变种
斯坦福NLP名课带学详解 | CS224n 第8讲 - 机器翻译、seq2seq与注意力机制
斯坦福NLP名课带学详解 | CS224n 第9讲 - cs224n课程大项目实用技巧与经验
斯坦福NLP名课带学详解 | CS224n 第10讲 - NLP中的问答系统
斯坦福NLP名课带学详解 | CS224n 第11讲 - NLP中的卷积神经网络
斯坦福NLP名课带学详解 | CS224n 第12讲 - 子词模型
斯坦福NLP名课带学详解 | CS224n 第13讲 - 基于上下文的表征与NLP预训练模型
斯坦福NLP名课带学详解 | CS224n 第14讲 - Transformers自注意力与生成模型
斯坦福NLP名课带学详解 | CS224n 第15讲 - NLP文本生成任务
斯坦福NLP名课带学详解 | CS224n 第16讲 - 指代消解问题与神经网络方法
斯坦福NLP名课带学详解 | CS224n 第17讲 - 多任务学习(以问答系统为例)
斯坦福NLP名课带学详解 | CS224n 第18讲 - 句法分析与树形递归神经网络
斯坦福NLP名课带学详解 | CS224n 第19讲 - AI安全偏见与公平
斯坦福NLP名课带学详解 | CS224n 第20讲 - NLP与深度学习的未来

ShowMeAI系列教程精选推荐

大厂技术实现：推荐与广告计算解决方案
大厂技术实现：计算机视觉解决方案
大厂技术实现：自然语言处理行业解决方案
图解Python编程：从入门到精通系列教程
图解数据分析：从入门到精通系列教程
图解AI数学基础：从入门到精通系列教程
图解大数据技术：从入门到精通系列教程
图解机器学习算法：从入门到精通系列教程
机器学习实战：手把手教你玩转机器学习系列
深度学习教程：吴恩达专项课程 · 全套笔记解读
自然语言处理教程：斯坦福CS224n课程 · 课程带学与全套笔记解读
深度学习与计算机视觉教程：斯坦福CS231n · 全套笔记解读

你可能感兴趣的:(自然语言处理教程,自然语言处理,cs224n,机器翻译,seq2seq,注意力)

DeepSeek R1蒸馏版模型部署的实战教程 herosunly DeepSeek从入门到精通 deepseek 大模型人工智能实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
DeepSeek推理模型架构以及DeepSeek爆火的原因微学AI 架构 LLM deepseek
大家好，我是微学AI，今天给大家介绍一下DeepSeek推理模型架构以及DeepSeek爆火的原因，DeepSeek推理模型凭借其创新的混合专家（MoE）架构和优化的Transformer架构，融合稀疏注意力机制，实现了高效的计算资源分配与显著降低的推理成本。在训练过程中，DeepSeek广泛应用蒸馏技术，通过生成高质量数据和将大型模型的推理能力迁移至小型模型，大幅提升训练效率与模型性能。Deep
如何在Java中设计大规模稀疏数据处理架构省赚客app开发者 java 架构开发语言
如何在Java中设计大规模稀疏数据处理架构大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！在大数据时代，稀疏数据在各个领域变得越来越常见，例如推荐系统、自然语言处理、图像处理等。稀疏数据通常包含大量零值或空值，直接使用传统的数据处理架构可能导致效率低下，内存和计算资源浪费。因此，设计一个高效的稀疏数据处理架构成为Java开发者面临的关键挑战。本文将探讨如何在Java中
MongoDB 云上数据迁移之纯手工操作实用教程 shijin23 文档型数据库服务华为云数据库免费迁移数据复制服务DRS 华为华为华为云数据库 MongoDB 数据库迁移
我们为用户提供MongoDB服务的过程中，发现很多用户都有在云服务商之间迁移数据的需求。在没有专业迁移工具的时候，如何实现数据库跨云迁移？今天我们就分享下利用开源工具进行纯手工操作MongoDB数据库迁移的方案。本方案基于MongoDB3.2.7版本进行讨论，迁移目标数据库为华为云DDS数据库，源库为自建或其他云服务商MongoDB数据库。注意：本篇文章涉及的迁移方案是特定场景下的一种方案，有其局
【LLM】大模型基础--大规模预训练语言模型的开源教程笔记 Langchain 笔记人工智能 langchain llama 大模型产品经理大模型基础
1.引言本文以DataWhale大模型开源教程为学习路线，进行一整个大模型的入门操作什么是语言模型语言模型是一种对词元序列（token）的概率分布，可以用于评估文本序列的合理性并生成新的文本。从生成文本的方式来看，LM（languagemodle）可以简单的分为：自回归模型非自回归模型特点逐字生成文本，每个词的生成都依赖于上文，关联性好一次性生成整个文本序列，不捕捉上文信息优点内容质量高生成速度快
VMware安全从我做起，vCenter和Esxi端口加固建议方案虚拟化爱好者 VMware VMware ESXi vCenter vSphere 云桌面虚拟化
哈喽大家好，欢迎来到虚拟化时代君（XNHCYL），收不到通知请将我点击星标！“大家好，我是虚拟化时代君，一位潜心于互联网的技术宅男。这里每天为你分享各种你感兴趣的技术、教程、软件、资源、福利…（每天更新不间断，福利不见不散）第一章、引言最近私信比较频繁，很多兄弟们想要VMwarevCenter和ESXi常见高危端口的修改方法，以及安全加固措施。今天粗略整理一些，望大家指正！第二章、vCenter和
【最新】沃德协会管理系统源码+uniapp前端+环境教程 kaui52066 kaui52066精品源码 uni-app 小程序前端开源 php 生活
一.系统介绍一款基于FastAdmin+ThinkPHP+Uniapp开发的商协会系统，新一代数字化商协会运营管理系统，以“智慧化会员体系、智敏化内容运营、智能化活动构建”三大板块为基点，实施功能全场景覆盖，一站式解决商协会需求壁垒，有效快速建立自有数字化管理体系、提升组织管理效能、增强会员粘性、沟通连接市场，真正做到为构建有影响力的现代化智慧型组织赋能。二.测试环境系统环境：CentOS、运行环
Cesium中级开发教程之三十四：单体化模型 CesiumMaster Cesium开发教程前端 javascript Cesium html
一、效果图在3D地理场景中，数据通常以群体的形式呈现，例如城市中的建筑可能是一个整体的3D模型。单体化就是将这些群体数据中的每个独立对象分离出来，使其能够被单独识别和操作。这样可以为用户提供更精细的交互体验，比如单独选中某一栋建筑进行信息查询，或者对某一个设施进行高亮显示。1、数据格式基础语义信息嵌入：支持单体化的数据格式，如i3dm、pnts、b3dm等，会在数据结构里嵌入每个独立对象的语义信息
sqlserver存储过程案例教程超级无敌暴龙战士塔塔开 sqlserver 数据库 sql
定义用sql写业务逻辑，系统变了，只要数据库没变，功能还是可以生效常用存储过程（系统自带）--查看数据库execsp_databases;--查看表execsp_tables;--查看列execsp_columnsstudentInfo;execsp_helpIndexstudent;--查看索引execsp_helpConstraintstudent;--约束execsp_stored_proc
大语言模型（LLM）如何实现上下文的长期记忆？
引言大语言模型（LargeLanguageModels,LLMs），如GPT-4、Claude和LLaMA等，已经在自然语言处理领域展现出卓越的能力。然而，它们在实际应用中常常面临一个核心问题：如何实现上下文的长期记忆？传统LLM的上下文长度通常受限于计算资源和架构设计（如注意力机制），这限制了其处理长文档或保持复杂对话连续性的能力。本篇文章将深入探讨大语言模型的上下文记忆问题，分析其技术难点，并
YIUI Unity UI框架安装与使用教程翟培任Lame
YIUIUnityUI框架安装与使用教程YIUIUnity3DUGUIFramework项目地址:https://gitcode.com/gh_mirrors/yi/YIUI1.项目目录结构及介绍YIUI项目的目录结构如下：YIUI/├──YIUIFramework/│├──Assets/││├──Scripts/││├──Resources/││├──Scenes/││├──Shaders/││
python 学习曲线函数_如何使用学习曲线来诊断你的LSTM模型的行为？（附代码）... weixin_39576066 python 学习曲线函数
LSTM是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。在自然语言处理、语言识别等一系列的应用上都取得了很好的效果。《LongShortTermMemoryNetworkswithPython》是澳大利亚机器学习专家JasonBrownlee的著作，里面详细介绍了LSTM模型的原理和使用。该书总共分为十四个章节，具体如下：第一章：什么是LSTMs？第二章：怎么样训练
python程序设计案例教程胡国胜第二章答案_Python程序设计案例教程长发在船头舞蹈
章Python基础知识1.1Python简介1.1.1Python语言特点1.1.2Python版本1.1.3Python语言的实现1.1.4安装Python1.2Python开发环境1.2.1启动IDLE1.2.2Python代码编辑器1.2.3个小程序习题1第2章数据类型2.1数值2.1.1数值类型2.1.2变量章Python基础知识1.1Python简介1.1.1Python语言特点1.1.
transformer概述沉墨的夜 transformer 深度学习人工智能
Transformer架构的提出，不仅在自然语言处理（NLP）领域掀起了革命，也在多个深度学习任务中获得了广泛应用。自2017年由Vaswani等人提出以来，Transformer经历了多次优化和扩展，成为深度学习领域的基石。以下是Transformer架构的演进历程、作用和意义、架构详情以及未来发展趋势的详细阐述。Transformer架构的演进历程(1)Transformer的起源（2017年
【开源向量数据库】Milvus简介 IT古董开源数据库 milvus
Milvus是一个开源、高性能、可扩展的向量数据库，专门用于存储和检索高维向量数据。它支持近似最近邻搜索（ANN），适用于图像检索、自然语言处理（NLP）、推荐系统、异常检测等AI应用场景。官网：https://milvus.io/1.Milvus的特点（1）高性能支持数十亿级向量数据，查询速度快。使用近似最近邻（ANN）索引算法，如HNSW、IVF-FLAT、IVF-PQ、SCANN等。（2）分
Python中LLM的稀疏Transformer架构：Longformer与BigBird 二进制独立开发非纯粹GenAI GenAI与Python python transformer 架构开发语言分布式人工智能自然语言处理
文章目录1.Transformer架构的挑战2.稀疏Transformer架构的提出2.1Longformer2.1.1局部注意力2.1.2全局注意力2.1.3实现2.2BigBird2.2.1随机注意力2.2.2局部注意力2.2.3全局注意力2.2.4实现3.稀疏Transformer架构的优势4.稀疏Transformer架构的挑战5.未来发展方向5.1更高效的稀疏注意力机制5.2自适应稀疏注
PyTorch中文/英文官方文档&教程资源三千の世界 Python DataAnalysis Computer Science pytorch
PyTorch中文文档https://pytorch-cn.readthedocs.io/zh/latest/PyTorch英文文档https://pytorch.org/docs/stable/index.htmlPyTorch官方教程-PyTorch教程1.1.0文档https://pytorch.org/tutorials/
【PYTORCH】官方的turoria实现中英文翻译 liwulin0506 pytorch python pytorch 人工智能 python
参考https://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html背景pytorch官方的是seq2seq是法语到英文，做了一个中文到英文的。数据集下载后解压，使用的data\testsets\devset\UNv1.0.devset.zh和UNv1.0.devset.en，因为电脑配置不行，所以只选取了10
《高效学习法：如何通过“案例学习法”提升应用能力？》
引言：聊聊我的学习困境[]()曾经的我，深陷学习的泥沼，怎么也挣扎不出来。每次坐在书桌前，看着堆积如山的书本和资料，满心都是焦虑和无助。那些密密麻麻的文字，仿佛是一道道难以跨越的沟壑，让我望而却步。课堂上，我拼命想要集中注意力，可思绪总是不由自主地飘走。老师讲的内容，我只能一知半解，笔记也记得乱七八糟。课后复习时，面对那些似曾相识又完全陌生的知识点，我感觉自己就像一只无头苍蝇，四处乱撞，却找不到方
MobPush智能推送系统的用户行为分析：驱动精准运营的核心引擎数据库
MobPush智能推送系统的用户行为分析：驱动精准运营的核心引擎在移动应用竞争白热化的今天，用户注意力成为最稀缺的资源。APP企业纷纷引入MobPush智能推送系统，其核心价值在于通过用户行为分析实现精准触达。这种技术不仅改变了传统"广撒网"式的推送策略，更成为用户留存和商业转化的关键武器。本文将从实践效果与典型案例维度，解析MobPush智能推送系统如何重构用户运营逻辑。实践效果：从经验驱动到数
Python-OAuth2 教程房耿园Hartley
Python-OAuth2教程项目地址:https://gitcode.com/gh_mirrors/pyt/python-oauth21.项目目录结构及介绍在python-oauth2项目中，目录结构通常包括以下几个部分：src/:主要代码存放的地方，包含了OAuth2的核心模块和实现。tests/:测试用例，用于确保代码的功能正确性。docs/:文档目录，包含项目的README和其他相关说明。
解决 `‘npm‘ 不是内部或外部命令` 的步骤王大师王文峰 Java基础到框架面经吐血整理编程利器IDEA npm 前端 node.js
本人详解作者：王文峰，参加过CSDN2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的Java开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰哦）解决`'npm'不是内部或外部命令`的步骤学习教程（传送门）解决`'npm'不是内部或外部命令`的步骤1.**确认是否已安装No
PyTorch实战深度学习——用CNN进行手写数字识别一位小说男主人工智能入门深度学习
用CNN进行手写数字识别---计算机专业研究生的代码第一课，相当于”HelloWorld“，不管以后选择什么研究方向，都值得一看,欢迎大家留言交流学习！下面手把手教大家一步一步实现该任务：1.环境准备首先呢，您需要确保安装了PyTorch库。如果还没有安装，可以使用以下命令进行安装，这里默认您已经有Anaconda并创建好虚拟环境啦，如果还没有安装，可以参考其他更完整的安装pytorch的教程：p
python编写mapreduce job教程 weixin_49526058 python mapreduce hadoop
在Python中实现MapReduce作业，通常可以使用mrjob库，这是一个用于编写和执行MapReduce作业的Python库。它可以运行在本地模式或Hadoop集群上。以下是一个简单的MapReduce示例，它计算文本文件中每个单词的出现次数。安装mrjob首先，你需要安装mrjob库。可以通过pip安装：pipinstallmrjobMapReduce示例：计算单词频率1.创建一个MapR
RTOS 特性及其思考 TianYaKe-天涯客 arm开发
前言最近在研究FreeRTOS，觉得RTOS有些特性还是比较有趣的，有一些想法，问了一下AI，简单探讨一下。有纰漏请指出，转载请说明。学习交流请发邮件[email protected]百问网《FreeRTOS入门与工程实践-基于STM32F103》教程-基于DShanMCU-103(STM32F103)|百问网为什么有些项目，裸机编程不再适用，需要RTOS一、任务调度与并发处理裸机编程：在裸机环境
Vue学习教程-04数据代理番茄番茄君 vue.js 学习 javascript
文章目录一、什么是数据代理二、数据代理过程三、vue数据代理应用1.数据代理代码2.代理底层逻辑总结一、什么是数据代理数据代理是一种技术，通过代理、拦截对象属性及方法的访问请求，实现与该对象的交互。在Vue中，数据代理是指在Vue实例化一个组件时，Vue会将组件中的data属性中的数据转化为getter/setter，并将这些getter/setter注册到Vue的响应式系统中，在Vue实例中访问
Kotlin 2.1.0 入门教程（二十一）数据类 xvch Kotlin kotlin android
数据类数据类主要用于存储数据。对于每个数据类，编译器会自动生成一些额外的成员函数，这些函数支持将实例打印为易读的输出、比较实例、复制实例等操作。数据类使用data关键字标记：dataclassUser(valname:String,valage:Int)编译器会根据主构造函数中声明的所有属性，自动派生以下成员：equals()/hashCode()对。格式为User(name=John,age=4
Kotlin 2.1.0 入门教程（二十）扩展 xvch Kotlin kotlin android
扩展Kotlin提供了一种能力，无需继承类或使用像装饰器这样的设计模式，就能为类或接口扩展新的功能。这是通过一种名为扩展的特殊声明来实现的。例如，你可以为无法修改的第三方库中的类或接口编写新的函数。这些函数可以像原类的方法一样以常规方式调用。这种机制被称为扩展函数。此外，还有扩展属性，它允许你为现有类定义新的属性。扩展函数要声明一个扩展函数，需要在函数名前加上接收者类型，该接收者类型指的是要被扩展
DataWorks Copilot × DeepSeek-R1 来了！给你的智能数据开发加满 buff
DataWorksCopilot×DeepSeek-R1来了！DataWorksCopilot，作为一站式智能数据开发治理平台DataWorks的智能助手，借助AI推理和自然语言处理能力，通过提供代码辅助和智能应用开发功能，为开发者和企业用户带来便捷高效的数据开发体验。现在，DataWorksCopilot与DeepSeek-R1模型深度对接，支持DeepSeek-R1-671B模型与DeepSe
数据库MySQL 8.0.32安装包网盘资源下载（附教程）听风说雨的人儿数据库 mysql 百度云
如大家所熟悉的，MySQL是一个开源的关系型数据库管理系统（RDBMS）。它使用SQL（结构化查询语言）来管理数据，允许用户定义表、字段、索引和关系，并通过SQL语句来查询、更新和管理数据。MySQL支持多种操作系统，包括Windows、Linux和MacOS等，并且广泛用于各种应用程序中，如Web应用程序、数据仓库和电子商务系统等。MySQL的优势：成本效益与开源特性作为一个开源数据库，MySQ
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc