让我看看谁在学习

读Hearing Lips：Improving Lip Reading by Distilling Speech Recognizers论文

论文：https://arxiv.org/pdf/1911.11502.pdf

代码：无

标题：听唇：通过蒸馏语音识别器改善唇读

关键词：多模态、语音唇读LIBS、CMLR中文数据集、Lip by Speech (LIBS)、CSSMCM、attention-based sequence-to-sequence model

[sos] => 句子起始标识符、[eos] => 句子结束标识符和 [pad] => 补全字符、

word embedding：通俗的翻译可以认为是单词嵌入，就是把X所属空间的单词映射为到Y空间的多维向量；就是找到一个映射或者函数，生成在一个新的空间上的表达。

alignment score function、alignment

Teacher Forcing 机制：RNN有两种训练模式：（1）free-running mode：上一个state的输出作为下一个state的输入；（2）teacher-forcing mode：使用给定的target即标签作为输入

Character Error Rate (CER)：字错误率，中文语句中的最小单位是汉字，使用CER作为指标

Word Error Rate (WER)：单词错误率，英文语句中最小单位是单词，使用WER作为指标

BLEU：（bilingual evaluation understudy），即：双语互译质量评估辅助工具。机器翻译结果越接近专业人工翻译的结果，则越好；BLUE去做判断：一句机器翻译的话与其相对应的几个参考翻译作比较，算出一个综合分数。这个分数越高说明机器翻译得越好。（注：BLEU算法是句子之间的比较，不是词组，也不是段落）

beam search：集束搜索，

grid search：Grid Search是一种调参的手段，即穷举，穷举所有的超参组合。以有两个参数的模型为例，参数a有3种可能，参数b有4种可能，把所有可能性列出来，可以表示成一个3*4的表格，其中每个cell就是一个网格，循环过程就像是在每个网格里遍历、搜索

摘要：

近年来，由于深度学习和大规模数据集的出现，唇读得到了无与伦比的发展。尽管取得了令人鼓舞的成果，但遗憾的是，由于唇部动作的模糊性，使得从唇部动作视频中提取判别特征具有挑战性，因此唇部阅读的性能仍然不如其对应的语音识别。在本文中，我们提出了一种新的方法，被称为 "语音唇读"（LIBS），其目的是通过学习语音识别器来加强唇语阅读。我们的方法背后的原理是，从语音识别器中提取的特征可以提供补充性和鉴别性的线索，这些线索很难从嘴唇的微妙运动中获得，因此有利于读唇器的训练。具体来说，这是通过从语音识别器中提炼出多模态知识给读唇器来实现的。为了进行这种跨模式的知识提炼，我们利用一种有效的对齐方案（指后文的帧级别的知识蒸馏）来处理音频和视频的长度不一致的问题，以及一种创新的过滤策略（指后文的LCS）来完善语音识别器的预测。所提出的方法在CMLR和LRS2数据集上实现了新的最先进的性能，在字符错误率方面分别比基准线高出了7.66%和2.75%。

贡献：提出音频视频对齐方案，使用新的过滤策略从不同层面进行知识蒸馏

介绍：

唇读，也称为视觉语音识别，旨在预测正在说出的句子，给定一个正在说话的人脸的静音视频。得益于最近深度学习的发展和用于训练的大数据的可用性，唇读取得了前所未有的进展，性能得到了很大提高(Assael et al. 2016; Chung et al. 2017; Zhao, Xu, and Song 2019)。

尽管取得了令人鼓舞的成就，但基于视频的唇读的性能仍然远低于其对应的基于音频的语音识别，基于音频的语音识别的目标也是解码口语文本，因此可以被视为与唇读共享相同底层分布的异类模态。给定相同数量的训练数据和模型架构，在语音识别和唇读的字符错误率方面，性能差异分别高达10.4%和39.5%(Chung et al . 2017)。这是由于嘴唇动作本质上的模糊性:几个看似相同的嘴唇动作可能产生不同的单词，使得从感兴趣的视频中提取鉴别特征并进一步可靠地预测文本输出非常具有挑战性。

在这篇论文中，我们提出了一个新颖的方案，通过语音唇读(LIBS)，它利用语音识别，其性能在大多数情况下是令人满意的，以促进更具挑战性的唇读的训练。我们假设给定一个预先训练好的语音识别器，并尝试提取隐藏在语音识别器中的知识给待训练的目标唇读器。

利用知识蒸馏(Hinton、Vinyals和Dean 2015)完成这项任务的基本原理在于，声音语音信号包含的信息与视觉信号的信息是互补的。例如，具有细微运动的话语很难在视觉上区分，但在大多数情况下，在听觉上很容易识别(Wolff et al. 1994)。通过模仿由语音识别器提取的声学语音特征，唇读器有望增强其提取判别视觉特征的能力。为此，LIBS被设计成在多个时间尺度上提取知识，包括序列级、上下文级和帧级，以便对来自输入序列的多粒度语义进行编码。

然而，从一个异质的模态中提取知识，在这个例子中是音频序列，面临两个主要的挑战。第一个原因在于，这两种模态可能以不同的采样率为特征，因此是异步的，而第二个原因在于不完美的语音识别预测。为此，我们采用跨模态对齐策略，通过寻找音频和视频之间的对应关系来同步音频和视频数据，从而进行从音频特征到视觉特征的细粒度知识蒸馏。另一方面，为了增强语音预测，我们引入了一种过滤技术来细化蒸馏特征，以便可以过滤有用的特征来进行知识提取。

在CMLR (Zhao, Xu, and Song 2019) 和 LRS2 (Afouras et al. 2018)两个大规模唇读数据集上的实验结果表明，该方法优于现有技术。我们在数据集上实现了31.27%的字符错误率（CER）CMLR Benchmark (Lipreading) | Papers With Code，比基线提高了7.66%，在LRS2上实现了45.53%的字符错误率，比基线提高了2.75%。值得注意的是，当训练数据量减少时，所提出的方法往往会产生更大的性能增益。例如，当只使用了20%的训练样本时，在CMLR数据集上，相对于基线的性能提高了9.63%。

因此，我们的贡献是通过从语音识别器中提取多粒度知识，实现一种创新和有效的方法来增强唇读器的训练。据我们所知，这是沿着这条路线的第一次尝试，与现有的在卷积神经网络上工作的特征级知识提取方法不同(Romero et al. 2014; Gupta, Hoffman, and Malik 2016; Hou et al. 2019)，我们的策略处理RNN。在几个数据集上的实验表明，所提出的方法产生新的SOTA。

背景：

关于Seq2Seq和基于注意力的Seq2Seq可以看博客：seq2seq model和Attention-based seq2seq Model(动图展示)_nana-li的博客-CSDN博客

这里我们简单回顾一下基于注意力的序列对序列模型(Bahdanau，Cho和Bengio 2015)。设x = [x1，...，xI]，y = [y1，...，yK]分别是长度为I和K的输入和目标序列。序列到序列模型用编码器神经网络和解码器神经网络来参数化概率p(y|x)。编码器变换输入序列x1，...，xI进入隐藏状态序列h1^x，...，hI^x，并产生固定维度的状态向量s^x，它包含输入序列的语义含义。在本文中我们也称s^x为序列向量。

解码器根据编码器的输出计算目标序列的概率。具体来说，给定输入序列和先前生成的目标序列 y

其中 g 是 softmax 函数，hk^d 是Decoder RNN 在时间步 k 处的隐藏状态，ck^x 是注意力机制计算的上下文向量。注意机制允许解码器在输出生成的每个步骤中关注输入序列的不同部分。

具体来说，Context vector上下文向量是通过根据相似度分布αk对每个编码器隐藏状态hi^x进行加权来计算的：

相似度分布 αk 表示 h(k−1)^d 和每个 hi^x 之间的近似度，计算公式为：

f 计算 h(k−1)^d 和 hi^x 之间的非归一化相似度，通常采用以下方式：

提出方法：

LIBS 的框架如图 1 所示。语音识别器和唇读器都基于基于注意力的序列到序列架构。对于输入视频，x^v = [x1^v, ..., xJ^v] 表示其视频帧序列，y = [y1, ..., yK] 是目标字符序列。对应的音频帧序列为 x^a = [x1^a, ..., xI^a ]。预训练的语音识别器读入音频帧序列 x^a，并输出预测的字符序列 y^~ = [ y1^~, ..., yL^∼]。需要注意的是，语音识别器预测的句子是不完善的，L可能不等于K。同时，编码器隐藏状态h^a = [h1^a, ..., hI^a ]，序列向量s^a，上下文向量c^a = [c1^a, ..., cL^a] 也可以得到。它们用于指导唇读者的训练。基本唇读器被训练以最大化条件概率分布 p(y|x^v)，这等于最小化损失函数：

Encoder编码器的隐藏状态(hidden states)、序列向量（s）和上下文向量（c）分别表示为 h^v = [h1^v, ..., hJ^v], sv, 和 c^v = [c1^v, ..., cK^v]。所提出的方法LIBS旨在最小化损失函数：

其中 LKD1、LKD2 和 LKD3 构成多粒度知识蒸馏，分别工作在序列级、上下文级和帧级。 λ1、λ2 和 λ3 是相应的平衡权重。详情如下所述。

图 1：LIBS 的框架。学生网络处理唇读，教师处理语音识别。知识在序列、上下文和帧级别进行提炼，以使多粒度的特征能够从教师网络转移到学生。 KD是知识蒸馏的缩写

序列级知识蒸馏：

如前所述，序列向量 s^x 包含输入序列的语义信息。对于一个视频帧序列x^v及其对应的音频帧序列x^a，它们的序列向量s^a和s^v应该是相同的，因为它们是同一事物的不同表达。因此，序列级知识蒸馏表示为：

（等号右边表示二范数的平方，范数其实是一个函数，它把不能比较的向量转换成可以比较的实数；范数的本质是距离，存在的意义是为了实现比较，参考博客：范数对于数学的意义？1范数、2范数、无穷范数_yangpan011的博客-CSDN博客_无穷范数）

t 是一个简单的变换函数（例如线性或仿射函数），它将特征嵌入到具有相同维度的空间中。

上下文级知识蒸馏：

当解码器在某个时间步预测一个字符时，注意力机制使用上下文向量来总结与当前输出最相关的输入信息。因此，如果唇读器和语音识别器在第 j 个时间步预测相同的字符，则上下文向量 cj^v 和 cj^a 应该包含相同的信息。自然，上下文级别的知识蒸馏应该推动 cj^v 和 cj^a 相同。

然而，由于不完美的语音识别预测，yj^~ 和 yj 可能不一样。简单地使 cj^v 和 cj^a 相似会阻碍唇读器的性能。这需要从语音识别预测中选择正确的字符，并使用相应的上下文向量进行知识蒸馏。此外，在当前的注意力机制中，上下文向量是建立在 RNN 隐藏状态向量之上的，它作为输入句子前缀子串的表示，考虑到 RNN 计算的顺序性（Wu et al. 2018）。因此，即使预测句子中有相同的字符，它们对应的上下文向量也会因为位置不同而不同。

基于这些发现，提出了一种基于最长公共子序列 (LCS) 1 的过滤方法来细化提取的特征。 LCS 用于比较两个序列。找出两个序列中相同顺序的公共子序列，选择最长的序列。 LCS 最重要的方面是公共子序列不必是连续的，它保留了字符之间的相对位置信息。形式上，LCS 计算 y^~ = [y1^~, ..., yL^~] 和 y = [y1, ..., yK] 之间的公共子序列，并获得 y^~ 和 y 中对应字符的下标：

其中 I1^a , ..., IM^a 和 I1^v , ..., IM^v 分别是语音识别器预测的句子和真实 (ground truth) 句子中的下标。详情请参阅补充材料。值得注意的是，当句子是中文时，如果两个字符有相同的拼音，则定义为相同。拼音是汉字的音标，同音字占汉字的85%以上。

上下文级知识蒸馏仅计算这些常见字符：

帧级别知识蒸馏：

此外，我们希望语音识别器可以更精细、更明确地教唇读者。具体来说，知识在帧级别被提炼，以增强每个视频帧特征的可辨别性。

如果知道视频和音频的对应关系，那么直接将视频帧特征与对应的音频特征进行匹配就足够了。但是，由于采样率不同，视频序列和音频序列长度不一致。此外，由于数据的开头或结尾可能出现空白，因此无法保证视频和音频严格同步。因此，不可能人为地指定对应关系。这个问题是通过首先学习视频和音频的对应关系，然后进行帧级知识蒸馏来解决的。

由于 RNN 的隐藏状态提供更高级别的语义并且比原始输入特征更容易关联（Sterpu、Saam 和 Harte 2018），音频和视频之间的对齐是在音频编码器和视频编码器的隐藏状态上学习的，正式的说，对于每一个音频隐藏状态 hi^a ，最相似的视频帧特征是通过类似于注意力机制的方式计算出来的:

βji 是 hi^a 和视频编码器隐藏状态 hj^v 之间的归一化相似度：

由于hi^v~ 包含与音频特征hi^a 最相似的信息，并且声学语音信号包含与视觉信号互补的信息，因此使hi^v~ 和hi^a 相同可以增强唇读者提取判别视觉特征的能力。因此，帧级知识蒸馏定义为：

音频和视频模态可以有双向交互。然而，在初步实验中，我们发现视频参与音频会导致性能下降。因此，仅选择音频参与视频来执行帧级知识蒸馏。

实验：

数据集：

CMLR：

(Zhao, Xu, and Song 2019)：它是目前最大的中文普通话唇读数据集。它包含来自中国网络电视网站的100,000多个自然句子，包括3,000多个汉字和20,000个短语。

LRS2:

(Afouras et al. 2018)：它包含来自 BBC 电视台的 45,000 多个口语句子。 LRS2根据播出日期分为开发（train/val）和测试集。该数据集有一个“预训练”集，其中包含用每个单词的对齐边界注释的句子。我们在实验中遵循提供的数据集分区。

评价指标：

对于 LRS2 数据集的实验，我们报告了字错误率 (CER)、单词错误率 (WER) 和 BLEU (Papineni et al. 2002)。 CER 和 WER 定义为 ErrorRate = (S + D + I)/N，其中 S 是替换数，D 是删除数，I 是从对假设的引用中获得的插入数，N是参考文献中的字符（单词）数。BLEU 是 n-gram 精度的一种改进形式，用于将候选句子与一个或多个参考句子进行比较。在这里，使用一元 BLEU。对于 CMLR 数据集的实验，只报告了 CER 和 BLEU，因为中文句子呈现为连续的字符串，没有词边界的划分。

训练策略：

与 (Chung et al. 2017) 一样，课程学习（curriculum learning）用于加速训练并减少过度拟合。由于 CMLR 和 LRS2 的训练集没有标注词边界，因此句子根据长度分组为子集。我们开始训练短句，然后随着网络训练使序列长度增加。计划抽样（Scheduled sampling）(Bengio et al. 2015) 用于消除训练和推理之间的差异。对于 CMLR 数据集，前一个输出的采样率从 0.7 到 1 选择，对于 LRS2 数据集从 0 到 0.25 选择。为了公平比较，解码是通过 CMLR 的宽度为 1 集束宽（beam width）和 LRS2 的宽度为 4 的集束搜索执行的，与 (Chan et al. 2016) 类似。

然而，初步实验结果表明，基于序列到序列的模型很难在 LRS2 数据集上取得合理的结果。这是因为即使是最短的英文句子也包含 14 个字符，解码器在训练开始时仍然难以从所有输入步骤中提取相关信息。因此，为 LRS2 数据集添加了预训练阶段，如 (Afouras et al. 2018)。在预训练时，CNN 对 MV-LRS (Chung and Zisserman 2017) 数据集的单词摘录进行预训练，用于提取预训练集的视觉特征。唇读者在这些冻结的视觉特征上进行训练。预训练从一个单词开始，然后逐渐增加到最大 16 个单词的长度。之后，模型在训练集上进行端到端训练。

实施细节：

唇语阅读器：

CMLR：输入图像的尺寸为 64 × 128。 VGG-M 模型（Chatfield et al. 2014）用于提取视觉特征。唇帧转化为灰度，VGG-M网络以每5个唇帧为输入，每个时间步移动2帧。我们使用2层双向 GRU (Cho et al. 2014)，编码器单元大小为 256，解码器单元大小为 512 的2层单向 GRU。对于字符词汇，保留出现超过 20 次的字符。 [sos] => 句子起始标识符、[eos] => 句子结束标识符和 [pad] => 补全字符也包括在内。最终词汇量为 1779。初始学习率为 0.0003，每次训练误差在 4 个 epoch 内没有改善时，学习率下降 50%。模型预热（He et al. 2016）（即以一个很小的学习率逐步上升到设定的学习率，这样做会使模型的最终收敛效果更好。）用于防止过度拟合。

表 1：CMLR 和 LRS2 数据集中使用的平衡权重。

LRS2：输入图像为 112 × 112 像素，覆盖嘴巴周围区域。用于提取视觉特征的 CNN 基于 (Stafylakis and Tzimiropoulos 2017)，在 3D 卷积中具有 5 帧的卷积核宽度。编码器包含 3 层双向 LSTM (Hochreiter and Schmidhuber 1997)，单元大小为 256，解码器包含 3 层单向 LSTM，单元大小为 512。唇读器的输出大小为 29，包含 [sos]、[eos]、[pad] 的 26 个字母和标记。预训练的初始学习率为 0.0008，训练的初始学习率为 0.0001，每次训练误差在 3 个 epoch 内没有改善时，初始学习率下降 50%。

两个数据集中使用的平衡权重如表 1 所示。这些值是通过进行grid search（网格搜索）（穷举所有的超参组合）获得的。

语音识别器：

用于训练语音识别器的数据集是 CMLR 和 LRS2 数据集的音频，以及其他语音数据：用于 CMLR 的 aishell (Bu et al. 2017) 和用于 LRS2 的 LibriSpeech (Panayotov et al. 2015)。使用 240 维 fbank（基于滤波器组的特征 Filter bank：语音特征提取算法之一，Fbank保留了更多的原始语音数据）特征作为语音特征，以 16kHz 采样并计算超过 25ms 的窗口，步长为 10ms。对于 LRS2 数据集，语音识别器和唇读器具有相同的架构。对于 CMLR 数据集，具体来说，考虑了三种不同的语音识别器架构来验证 LIBS 的泛化性。

老师 1：它包含 2 层用于encoder的双向 GRU，单元大小为 256，2 层用于decoder的单向 GRU，单元大小为 512。换句话说，它与唇读器具有相同的架构。

老师 2：encoder 和 decoder 的单元大小都是 512。其他与1老师相同。

老师 3：encoder包含 3 层金字塔双向 GRU (Chan et al. 2016)。其他与1老师相同。

值得注意的是，Teacher 2 和 Lip reader 的特征维度不同，Teacher 3 将音频时间分辨率降低了 8 倍。

实验结果：

不同教师模型的有效性：

为了评估所提出的多粒度知识蒸馏方法的泛化性，我们比较了不同教师模型下 LIBS 对 CMLR 数据集的影响。由于 WAS（Watch, Attend and Spell） (Chung et al. 2017) 和基线唇读器（未经知识蒸馏训练）具有相同的Seq2Seq架构， WAS 使用与 LIBS 相同的训练策略进行训练，并在论文中与基线互换使用.从表 2 可以看出，LIBS 在不同的教师模型结构下大大超过了基线。值得注意的是，虽然教师 2 的表现优于教师 1，但对应的学生网络却不然。这是因为 Teacher 2 语音识别器和唇读器的特征维度不同。这意味着直接在相同维度的特征空间中提取知识可以获得更好的结果。在接下来的实验中，我们分析了在 CMLR 数据集上从教师 1 学习的唇读器。

表 2：在 CMLR 数据集上使用不同教师模型时 LIBS 的性能。

多粒度知识蒸馏的效果：

表 3 显示了多粒度知识蒸馏对 CMLR 和 LRS2 数据集的影响。比较 WAS、WAS +LKD1、WAS +LKD1 + LKD2 和 LIBS，所有指标都随着知识蒸馏粒度的增加而增加。越来越多的结果表明，知识蒸馏的每个粒度都能够促进 LIBS 的性能。但是，增加的幅度越来越小，并不表示序列级知识蒸馏比框架级知识蒸馏的影响更大。当只添加一个粒度的知识蒸馏时，WAS+LKD2表现出最好的性能。这是由于上下文级知识蒸馏直接作用于预测字符的特征上。

在 CMLR 数据集上，LIBS 在 CER 中超过 W AS 7.66%。但是，在LRS2 数据集上差距并没有那么大，只有 2.75%。这可能是由于训练策略的差异造成的。在 LRS2 数据集上，CNN 首先在 MV-LRS 数据集上进行预训练。预训练给 CNN 一个很好的初始值，以便在训练过程中提取更好的视频帧特征。为了验证这一点，我们比较了没有预训练阶段的 WAS 和 LIBS。 WAS 和 LIBS 的 CER 分别为 67.64% 和 62.91%，较大的差值为 4.73%。这证实了 LIBS 可以帮助提取更有效的视觉特征的假设。

表 3：多粒度知识蒸馏的效果。

不同数量训练数据的影响：

与唇视频数据相比，语音数据更容易收集。我们评估了 LIBS 在 CMLR 数据集上唇部视频数据有限的情况下的效果。如前所述，句子根据长度分组为子集，只使用第一个子集来训练唇读。第一个子集大约是全训练集的 20%，包含 27262 个句子，每个句子的字符数不超过 11 个。从表 4 可以看出，当训练数据有限时，LIBS 倾向于产生更大的性能增益：CER 的改进从 7.66% 增加到 9.63%，BLEU 的改进从 5.86 增加到 7.96。

表 4：在 CMLR 数据集上使用不同数量的训练数据进行训练时 LIBS 的性能。

与SOTA方法比较：

表 5 显示了与其他框架比较的实验结果：WAS (Chung et al. 2017)、CSSMCM (Zhao, Xu, and Song 2019)、TM-seq2seq（transformer sequence to sequence） (Afouras et al. 2018) 和 CTC/attention (Petridis et al. . 2018). TM-seq2seq 在 LRS2 数据集上实现了最低的 WER，因为它的transformer自注意力架构（V aswani et al. 2017）。由于 LIBS 是为序列到序列架构设计的，因此可以通过将 RNN 替换为transformer 自注意力块。请注意，尽管专为汉语普通话唇读设计的 CSSMCM 具有出色的性能，但 LIBS 在 CER 方面仍以 1.21% 的优势超过它。

表 5：在 CMLR 和 LRS2 数据集上与其他现有框架的性能比较。

可视化：

注意力可视化：

注意机制在输入视频帧和生成的字符输出之间生成显式对齐。由于输入视频帧和生成的字符输出之间的对应在时间上是单调的，是否对齐有对角线趋势是模型性能的反映（Wang et al. 2017）。图 2 在 LRS2 数据集的测试集上可视化了视频帧的对齐方式和具有不同知识蒸馏粒度的相应输出。比较图 2(a) 和图 2(b)，添加序列级知识蒸馏提高了生成句子结尾部分的质量。这表明唇读器增强了对整个句子语义信息的理解。添加上下文级知识蒸馏（图 2（c））允许每个解码器步骤的注意力集中在相应的视频帧周围，减少对不相关帧的关注。这也使得预测的字符更加准确。最后，帧级知识蒸馏（图2（d））进一步提高了视频帧特征的可辨别性，使注意力更加集中。生成的句子的质量和可理解性随着知识蒸馏的不同程度的增加而提高。

图 2：视频帧和预测字符之间的对齐，具有不同级别的所提出的多粒度知识蒸馏。纵轴代表视频帧，横轴代表预测字符。基本事实判决是由政府设立的。

Saliency Maps：（用来做模型的解释，哪些变量对于模型是重要的）

显着性可视化技术用于验证 LIBS 通过显示模型在预测时最集中的视频帧区域来增强唇读器提取判别视觉特征的能力。图 3 分别显示了基线模型和 LIBS 的显着性可视化，基于 (Smilkov et al. 2017）。基线模型和 LIBS 都可以正确聚焦在嘴周围的区域，但基线模型的显着区域比 LIBS 更分散。

图 3：WAS 和 LIBS 的显着性图。唇读者学会参加的地方以红色突出显示。

结论：

在这篇文章中，我们提出了LIBS，一种创新的和有效的方法来训练唇读从一个预先训练的语音识别器学习。LIBS从序列级、上下文级和帧级提取多种粒度的语音识别知识，以指导唇读程序的学习。具体来说，这是通过引入一种新的过滤策略来改进语音识别器的特征，并通过采用一种基于跨模态对齐的方法进行帧级知识提取来解决两个序列之间的采样率不一致的问题。实验结果表明，与现有技术相比，所提出的LIBS产生了相当大的改进，尤其是当训练样本有限时。在我们未来的工作中，我们期待着对其他通道对，如语音和手语，采用相同的框架。

致谢：

你可能感兴趣的:(读论文,机器翻译,自然语言处理,深度学习,唇语识别)

AI原生应用必知：5大高效多轮对话框架对比 AI原生应用开发 AI-native easyui 前端 ai
AI原生应用必知：5大高效多轮对话框架对比关键词：AI原生应用、多轮对话、对话框架、自然语言处理、上下文管理、意图识别、对话状态跟踪摘要：本文深入探讨了构建AI原生应用时必备的5大多轮对话框架，包括Rasa、Dialogflow、MicrosoftBotFramework、AmazonLex和IBMWatsonAssistant。通过对比分析它们的架构设计、核心功能和应用场景，帮助开发者选择最适合
剖析AI人工智能领域Whisper的性能指标 AI大模型应用实战人工智能 whisper xcode ai
剖析AI人工智能领域Whisper的性能指标关键词：Whisper、语音识别、性能指标、ASR、AI模型评估、基准测试、语音转文本摘要：本文深入剖析OpenAI开发的Whisper语音识别系统的性能指标。我们将从技术原理、架构设计、性能基准测试等多个维度，全面分析Whisper在不同场景下的表现。文章将详细讲解Whisper的评估方法、关键性能指标解读、实际应用中的性能表现，以及与其他主流语音识别
【科研写作自动化工具】如何用AI技术组合（大模型+多Agent+自动化）打造一个“智能论文生产线”，把枯燥的写作流程变成自动化
n8n是一款开源的工作流自动化工具，类似于Zapier或Make（原Integromat），但更注重灵活性和开发者友好性。在课程文件中提到的n8n自动化流水线主要用于科研写作的自动化流程集成，以下是详细解释：n8n的核心功能可视化工作流设计：通过拖拽节点（Nodes）连接不同工具和服务，无需编写复杂代码即可搭建自动化流程。多平台集成：支持连接文献数据库（如PubMed、arXiv）、AI模型（如O
Ubuntu20.04切换源 dongdundun ubuntu linux 运维
一、ubuntu20.04系统重装二、工具安装1.更换Ubuntu源更换conda源更换pip源2.安装QQqq闪退卸载安装wine版QQ3.安装搜狗输入法及中文设置安装搜狗输入法中文设置4.安装vim5.安装google6.安装VsCode7.安装python3的opencv8.安装向日葵向日葵闪退9.ubuntu下识别不到U盘10.安装Typora11.安装百度网盘12.安装ceres库（优化
零信任的两大关键技术：内容识别和行为分析天空卫士网络数据安全网络安全
零信任（ZeroTrust）安全对传统边界安全架构进行了重新评估和审视，并对安全架构思路给出了新的建议。零信任模型的核心零信任的意思是：从不信任，始终验证。其核心思想是，默认情况下不应该信任网络内部和外部的任何人/设备/系统，需要基于认证和授权重新构建访问控制的信任基础。如IP地址、主机、地理位置、所处网络等均不能作为可信的凭证。通过零信任，可以防止恶意用户访问企业内部的私有资源、防止数据泄露以及
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
Latex beamer 常用操作记录
最近组会要讲论文，试着用latex做下slide，感觉效果不错。在此，记录一些可能会比较常用的一些操作。以后学到了新的操作，再继续更新。用的是这个主题，感觉比较简洁：https://www.overleaf.com/latex/templates/artrabeamer/cvtmgdbwvdmr放置图片图片感觉有好多参数，因为这次汇报比较水，所以只用了scale这个缩放参数凑合，以后再补上一些常用
JuPyter(IPython) Notebooks中使用pip安装Python的模块 weixin_34218890 开发工具 python 人工智能
问题描述：没有带GPU的电脑，搞深度学习不是耍流氓嘛，我网上看到有个云平台，免费使用了一下，小姐姐很热情。使用过程如下：他们给的接口是Jupyter编辑平台，我就在上面跑了一个小例子。tensorflow和python环境是他们配置好的，不过我的例子中需要导入matplotlib.pylot模块。可是他们没有提供，怎么办呢？网上查了一下啊解决方法：采用如下方法：importpipdefMyPipi
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
JSP汽车网站yzp17--（程序+源码+数据库+调试部署+开发环境） CK3042 java 汽车开发语言 oracle 数据库服务器大数据
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容一、项目背景随着互联网的飞速发展和人民生活水平的日益提高，汽车已成为许多家庭的重要交通工具。为了更好地满足消费者对汽车信息的需求，提升购车体验，我们计划开发一个功能全面、信息丰富的汽车网站。该项目旨在为用户提供便捷的汽车资讯查询、车型对比、购车指南以及售后服务等功能，打造
happy-llm 第一章 NLP 基础概念 weixin_38374194 自然语言处理人工智能学习
文章目录一、什么是NLP？二、NLP发展三大阶段三、NLP核心任务精要四、文本表示演进史1.传统方法：统计表征2.神经网络：语义向量化课程地址：happy-llmNLP基础概念一、什么是NLP？核心目标：让计算机理解、生成、处理人类语言，实现人机自然交互。现状与挑战：成就：深度学习推动文本分类、翻译等任务达到近人类水平。瓶颈：歧义性、隐喻理解、跨文化差异等。二、NLP发展三大阶段时期代表技术核心思
Happy-LLM 第二章 Transformer HalukiSan transformer 深度学习人工智能
Transform架构图片来自[Happy-llm](happy-llm/docs/chapter2/第二章Transformer架构.mdatmain·datawhalechina/happy-llm)，若加载不出来，请开梯子注意力机制前馈神经网络每一层的神经元都与上下两层的每一个神经元完全连接数据在其中只向前流动，用于处理静态的数据，进行图像识别或者分类，但是该网络没有记忆能力，数据在它里面没
印章抠图神器
印章抠图神器：一键去除图片背景，透明印章轻松生成在为如何获取透明背景的印章而烦恼？本工具专为解决电子文档盖章难题而生！告别用PS抠图，傻瓜式操作。链接文末，自行下载核心功能：双窗口实时对比：原始图像与抠图结果同屏对比智能背景识别：自定义背景色+容差调节，精准识别背景区域一键导出透明PNG：完美保留印章主体，背景透明化使用方法：点击"打开图像"导入印章图片使用颜色选择器指定背景色（默认白色）拖动滑块
Nystromformer：一种基于 Nyström 方法的自注意力近似算法 AI专题精讲 Paper阅读人工智能自然语言处理 AI
1.摘要Transformer已经成为广泛自然语言处理任务中的强大工具。推动Transformer展现出卓越性能的一个关键组件是self-attention机制，它对每个token编码了其他token的影响或依赖关系。虽然self-attention机制具有诸多优势，但其在输入序列长度上的二次复杂度限制了其在较长序列上的应用——这是当前社区积极研究的一个主题。为了解决这一限制，我们提出了Nystr
使用 C++/OpenCV 和 MFCC 构建双重认证智能门禁系统
使用C++/OpenCV和MFCC构建双重认证智能门禁系统引言随着物联网和人工智能技术的发展，智能门禁系统在安防领域的应用越来越广泛。相比于传统的钥匙、门禁卡或密码，生物识别技术（如人脸识别、指纹识别、虹膜识别等）提供了更高的安全性与便利性。然而，单一的生物识别方式在某些场景下可能存在安全隐患。例如，人脸识别可能被高清照片或视频欺骗（称为“欺骗攻击”），在光照、姿态变化剧烈时识别率也可能下降。为了
SQL注入与防御-第三章：复查代码中的SQL注入
复查代码中的SQL注入一、核心逻辑通过静态/动态代码分析，识别代码中直接拼接用户输入、未验证过滤的危险编码行为，定位“将用户可控数据传入SQL执行函数”的风险点，从代码源头预防SQL注入。核心是识别“用户输入→危险函数→SQL执行”的未净化链路，结合多场景适配，切断注入风险。二、关键步骤与方法（一）代码分析方法1.静态代码分析原理：不执行代码，直接审计源码，查找“用户输入拼接SQL”的危险逻辑。重
SurveyForge：AI自动撰写综述论文的革命性工具，助力科研效率跃升花生糖@ AIGC学习资料库人工智能 AI论文 AI助手
在学术研究领域，综述论文（SurveyPaper）的撰写是一项耗时且复杂的任务，通常需要数周甚至数月的文献调研与内容整合。如今，上海人工智能实验室、复旦大学与上海交通大学联合开源的SurveyForge，通过创新的AI技术，将这一过程压缩至10分钟内，且生成质量接近人工水平，成为科研人员的得力助手。项目简介SurveyForge是一款基于大语言模型（LLM）的自动综述论文生成工具，专为计算机科学领
供应链风险管理：AI预测潜在风险 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,风险评估,供应链可视化1.背景介绍在当今全球化经济体系中，供应链的复杂性和脆弱性日益凸显。供应链风险是指任何可能对供应链正常运行造成负面影响的事件或因素。这些风险可能来自自然灾害、政治动荡、经济波动、技术故障、供应商违约等方面。一旦供应链风险爆发，可能会导致生产中断、产品短缺、成本飙升、品牌形象受损等严重后果。传统供应链风险管理方法主要依
供应链风险管理：AI如何预测供应链风险 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,时间序列分析,风险评估1.背景介绍在当今全球化经济体系中，供应链风险已成为企业面临的重大挑战。供应链的复杂性和不可预测性使得企业更容易受到各种风险的影响，例如自然灾害、政治动荡、经济波动、疫情爆发等。这些风险可能导致供应中断、成本增加、交付延迟，甚至损害企业声誉。传统供应链风险管理方法主要依赖于经验和专家判断，缺乏数据驱动和预测能力。随着
【极光优化算法+分解对比】VMD-PLO-Transformer-LSTM多变量时间序列光伏功率预测Matlab代码 matlab科研助手算法 transformer lstm
✅作者简介：热爱数据处理、建模、算法设计的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍光伏发电作为一种清洁能源，其功率预测对于电网稳定运行和电力系统调度至关重要。然而，光伏功率具有高度的非线性和波动性，传统的预测方法难以准确捕捉其动态特性。近年来，深度学习技术在时间序列预测领域取得了显著进展，为提高光伏功率预测精度提供了新的途径
命名管道与RPC通信无名小猴学习
文章目录一、命名管道二、RPC一、命名管道命名管道，NamedPipes，是一种进程间通信(IPC)机制，用于在本地或远程计算机的两个进程之间传递数据。它是一种"管道"，允许一个进程向它写入数据，另一个进程读取。"命名"指的是它存在于文件系统中的路径（如\.\pipe\myPipe），可以被其它进程识别和访问Windows系统中命名管道是SMB协议的一种通信信道。特性说明双向通信可全双工发送和接收
【MySQL基础】MVCC多版本并发控制 scj1022 MySQL mysql
文章目录MVCC-多版本并发控制一、MVCC概述1、三种并发场景2、当前读&快照读3、MVCC的作用4、结合MVCC处理并发问题二、MVCC实现原理1、隐式字段2、回滚日志UndoLog3、一致性视图ReadView1）什么时候生成？2）可见性判断3）可见性算法（属性）4）可见性算法（实现）5）可见性算法（小结）4、举例说明（版本链）三、MVCC与可重复读RR1、事务的启动时机2、事务A读取流程3
深入剖析MYSQL MVCC多版本并发控制+ReadView视图快照规避幻读问题 LiRuiJie MySQL mysql 数据库
一、剖析MVCC底层如何实现1.MVCC的目标在高并发场景下，MVCC实现：能力描述读写并发读不会阻塞写，写也不会阻塞读（大多数SELECT是非阻塞的）一致性视图每个事务看到的数据是其开始时的一致状态高性能避免频繁加锁，减少锁竞争开销2.InnoDB如何实现MVCCInnoDB使用以下两部分实现MVCC：UndoLog（撤销日志）：用于保存数据变更前的旧版本ReadView（读视图）：用于判断当前
【python深度学习】DAY 51 复习日抽风的雨610 【打卡】Python训练营 python 深度学习开发语言
作业：day43的时候我们安排大家对自己找的数据集用简单cnn训练，现在可以尝试下借助这几天的知识来实现精度的进一步提高1.读取数据使用CIFAR-10图像数据importtorchfromtorchvisionimportdatasets,transforms#数据预处理transform=transforms.Compose([transforms.ToTensor(),transforms.
使用Python爬虫与自然语言处理技术抓取并分析网页内容 Python爬虫项目 python 爬虫自然语言处理 javascript 数据分析人工智能
1.引言在如今数据驱动的时代，网页爬虫（WebScraping）和自然语言处理（NLP）已成为处理大量网页数据的重要工具。利用Python爬虫抓取网页内容，结合NLP技术进行文本分析和信息抽取，能够从大量网页中提取有价值的信息。无论是新闻文章的情感分析、社交媒体的舆情分析，还是电商网站的商品评论挖掘，这些技术都发挥着至关重要的作用。本文将介绍如何利用Python爬虫与自然语言处理技术抓取并分析网页
用Python解锁图像处理之力：从基础到智能应用的深度探索熊猫钓鱼>_> python 图像处理开发语言
在像素构成的数字世界里，Python已成为解码图像奥秘的核心引擎。一、为何选择Python处理图像？超越工具的本质思考当人们谈论图像处理时，往往会陷入工具对比的漩涡（PythonvsMATLABvsC++）。但Python的真正价值在于其构建的完整生态闭环：科学计算基石：NumPy的ndarray结构完美对应图像的多维矩阵本质算法实现自由：从传统算子到深度学习模型的无缝衔接可视化即战力：Matpl
【网络安全】深入理解 IoC 与 IoA：从“事后识别”到“事前防御” 学习溢出 Security 安全网络安全运维网络
1.简介在网络安全领域，IoC（IndicatorsofCompromise，入侵指标）和IoA（IndicatorsofAttack，攻击指标）是两个核心概念。它们是安全分析师识别攻击行为、调查事件、制定防御策略的重要依据。尽管这两个术语经常一起出现，但它们的作用时机和侧重点是不同的：IoC注重“结果”：攻击已发生，留下的痕迹；IoA注重“过程”：攻击正在发生，或者即将发生的行为特征。本文将带你
智能家居-深耕10年原创合集(2025/06更新) CYP_2015 智能家居 xcode ios macos ide
2025-06更新篇章2025年广州光亚展参展记录智能插座：技术与应用演进之路语音识别技术：全链路技术栈解析6000字干货长文，深度解读智能家居7大派系，谁能真正统一“江湖”？最近参与某智能家居项目的早期调研，再次感慨用户对我们所说的“便捷”实则是“无感”。用户原话："你们总说'智能'，我就想要个不用记按钮、不用掏手机的家伙。"我们说的"便捷"，在用户那儿根本不是"多快多远"，而是"不用刻意"。现
深度学习数据集加载 Ethan@LM 深度学习人工智能
数据集结构E:\Mytest\test20250622\pythonProject\dataset├──rose│├──rose1.jpg│├──rose2.jpg│└──...└──sunflower├──sunflower1.jpg├──sunflower2.jpg└──...主要只有的两个类fromtorch.utils.dataimportDatasetfromtorchvisionimp
纹理贴图算法研究论文综述点云SLAM 算法图形图像处理算法纹理贴图计算机图形学计算机视觉人工智能虚拟现实（VR）纹理贴图算法综述
纹理贴图（TextureMapping）是计算机图形学和计算机视觉中的核心技术，广泛应用于三维重建、游戏渲染、虚拟现实（VR）、增强现实（AR）等领域。对其算法的研究涵盖了纹理生成、映射、缝合、优化等多个方面。1.引言纹理贴图是指将二维图像纹理映射到三维几何表面上，以增强模型的视觉真实感。传统方法主要关注静态几何模型上的纹理生成与映射，而近年来，随着多视角图像重建、RGB-D扫描、神经渲染的发展，
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，