AI科技大本营

重磅 | 机器学习大神Bengio最新论文发布，专注RNN优化难题，将在NIPS提出新概念fraternal dropout

编译 | Troy·Chang、爱心心、reason_W

校对 | reason_W

下个月机器学习领域的顶会Nips就要在大洋彼岸开幕啦，那么这次的Nips又有什么值得关注的亮点呢？Bengio在新作中提出了RNN优化的新概念fraternal dropout，通过最小化使用不同的dropout mask的同一个RNN的预测差异，提升RNN对于不同dropout mask的不变性，来对RNN进行优化。模型在对比实验中取得了非常惊艳的效果，同时在图像标注和半监督任务上也表现不俗，下面就跟随小编对这篇文章进行一发膜拜吧。

摘要

RNN作为神经网络中的一类十分重要的架构，主要用于语言建模和序列预测。然而，RNN的优化却相当棘手，比前馈神经网络要难的多，学界也提出了很多技术来解决这个问题。我们在我们中提出了一项叫做fraternal dropout的技术，主要通过利用dropout来实现这个目标。具体来说，我们首先用不同的dropout mask对两个一模一样的RNN进行训练，同时最小化它们(pre-softmax)预测的差异。通过这种方式，我们的正则项会促进RNN的表示对dropout mask的不变性。我们证明了我们的正则项的上限是线性期望dropout目标，而且线性期望dropout目标已经被证明了可以解决dropout在训练和推理阶段的差异导致的较大差异(gap)。我们在两个基准数据集(Penn Treebank 和Wikitext-2.)上进行了序列建模任务以评价我们的模型，并且获得了十分惊艳的结果。我们也证明了这种方法可以为图像标注(Microsoft COCO)和半监督(CIFAR-10)任务带来显著的性能提升。

1 前言

像LSTM网络(LSTM; Hochreiter & Schmidhuber(1997))和门控循环单元(GRU; Chung et al. (2014))这样的循环神经网络都是处理诸如语言生成、翻译、语音合成以及机器理解等序列建模任务的流行架构。然而由于输入序列的长度可变性，每个时刻相同转换算子的重复应用以及由词汇量决定的大规模密集嵌入矩阵等问题的存在，与前馈网络相比，这些RNNs网络架构更加难以优化。也正是由于同前馈神经网络相比，RNNs在优化问题上遇到的这些挑战，使得批归一化以及它的变体(层归一化，循环批归一化，循环归一化传播)，尽管确实带来了很大的性能提升，但其应用依然没有像它们在前馈神经网络中对应的部件一样成功(Laurent等, 2016),。同样的，dropout的朴素应用(Srivastava等，2014)也已经证明在RNNs中是无效的(Zaremba等，2014)。因此，RNNs的正则化技术到目前为止依然是一个活跃的研究领域。

为了解决这些挑战，Zaremba等人(2014)提出将dropout仅用于多层RNN中的非环式连接。Variational dropout(Gal&Ghahramani，2016))会在训练期间在整个序列中使用相同的dropoutmask。DropConnect(Wan等，2013)在权重矩阵上应用了dropout操作。Zoneout(Krueger et al等(2016))以类似的dropout方式随机选择使用前一个时刻隐藏状态，而不是使用当前时刻隐藏状态。类似地，作为批归一化的替代，层归一化将每个样本内的隐藏单元归一化为具有零均值和单位标准偏差的分布。循环批标准化适用于批标准化，但对于每个时刻使用非共享的mini-batch统计(Cooijmans等，2016)。

Merity等人(2017a)和Merity等(2017b)从另一方面证明激活正则化(AR)和时域激活正则化(TAR)也是正则化LSTMs的有效方法。

在我们中，我们提出了一个基于dropout的简单正则化，我们称之为fraternal dropout。这个方法将最小化两个网络预测损失的等权重加权和（这两个网络由两个不同dropoutmask在同一个LSTM上得到），并将两个网络的(pre-softmax)预测结果的L2差作为正则项相加。我们分析证明了，该方法的正则化目标等于最小化来自不同的i.i.d. dropoutmask的预测结果的方差。该方法将会提升预测结果对于不同dropoutmask的不变性。同时，文章也讨论了我们的正则项和线性期望dropout(Ma等,2016)、II-model(Laine&Aila,2016)以及激活正则化(Merity等，2017a)的相关性，并且通过实验证明了我们的方法与这些相关方法相比带来的性能提升，第五部分的ablation study将进一步解释这些方法。

2 FRATERNAL DROPOUT

Dropout在神经网络中是一种强大的正则化方式。它通常在密集连接的层上更有效，因为与参数共享的卷积层相比，它们更容易受到过拟合的影响。出于这个原因，dropout是RNN系列一个重要的正则化方式。然而，dropout的使用在训练和推理阶段之间是存在gap的，因为推理阶段假设是用线性激活的方式来校正因子，因此每个激活的期望值都会不同。（小编注：为了更好的理解这部分内容，大家可以参考Dropout with Expectation-linear Regularization - https://arxiv.org/abs/1609.08017 ，这篇文章从理论上分析了dropout的ensemble模式和一般的求期望模式的gap。然后提出了将这个gap作为一种正则化方式，也就是说gap的优化目标就是要尽可能小）。另外，带有dropout的预测模型通常会随着不同dropout mask而变化。然而，在这种情况下理想的结果就是最后的预测结果不随着dropout mask的变化而变化。

因此，提出fraternal dropout的想法就是在训练一个神经网络模型时，保证在不同dropout masks下预测结果的变化尽可能的小。比如，假定我们有一个RNN模型M(θ)，输入是X，θ 是该模型的参数，然后让

表示预测模型，即给定一个在t时间点的输入样例X，dropout mask是

当前输入是zt ，其中zt 是关于输入X的一个函数，隐藏层的状态是跟之前时刻有关。同样的，

是跟整个输入目标样本对(X,Y)在第t时刻的损失值相关的。

在fraternal dropout中，我们采用两个相同的RNN来同时前馈输入样本X。这两个RNN共享相同的模型参数θ，但是在每个时刻t有不同的dropout masks 和。这样在每个时间点t，会产生两个损失值

和。

因此，fraternal dropout整体的损失函数就可以由下面公式表示，

其中κ是正则化系数，m是

的维数，

是fraternal dropout正则化项，具体表示如下，

我们采用蒙特卡洛采样来估计

，

其中，和计算值使用的是同一表达式。因此，额外的计算可以忽略不计。

我们注意到，如下面所示，我们正则化项的目标等价于最小化在不同dropout masks下，预测函数的方差(附录中有证明)

备注1 假定和均是独立同分布的，dropout masks和是上述的预测函数。

因此，

3 相关工作

3.1 线性期望dropout相关工作

Ma et al.(2016)分析研究显示下述两者之间的预期误差（在样本上）是有上限的，即在所有的dropout mask下的模型的期望值与使用平均mask的期望值之间的误差。基于这一结论，他们提出了明确地最小化差异（我们在我们的该符号表达中采用了他们的正则式），

其中，s是dropout mask。但是，基于可行性考虑，他们提出在实践中使用下列正则式进行替代，

特别地，这个式子是通过在网络中的两次前馈输入（分别使用和不使用dropout mask），以及最小化主要网络损失（该损失是在有dropout的情况下的）和前面指定的正则项（但是在无dropout的网络中没有反向传播梯度）来实现的。Ma et al.(2016)的目标是最小化网络损失以及期望差异，这个期望差异是指来自独立的dropout mask的预测值和来自期望的dropout mask的预测值之间的差异。同时，我们的正则项目标的上限是线性期望dropout，如下式所示（附录中证明）：

结果表明，最小化ELD目标可以间接地最小化我们的正则项。最终如前文所述，他们仅在无dropout的网络中应用了目标损失（target loss）。实际上，在我们的ablation研究中（参见第5节），我们发现通过网络（无dropout）反向传播目标损失（target loss）会让优化模型更难。但是，在该设置中，同时反向传播目标损失（target loss）能够获得包括性能增益和收敛增益的网络收益。我们认为由于在所用实例（case）中，网络权重更有可能通过反向传播更新来达到目标，所以我们的正则项收敛速度会更快。尤其对于权重dropout（Wan et al., 2013）更是如此，因为在这种情况下，dropout权重将不会在训练的迭代中获得更新。

3.2 II –model 相关工作

为了实现在半监督分类任务中提高性能的目标，Laine & Aila(2016)提出了II –model。他们提出的模型和我们提出的模型相似，除了他们仅在其中一个网络中应用了目标损失（target loss），并且使用的是依赖时间的权重函数（而我们使用常量k/m），可以等价于是我们模型的深度前馈版本。他们实例的直觉（intuition）是利用未标记的数据来最小化两种预测上的差异，即两种使用不同dropout mask的同一网络的预测值。而且，他们也在监督任务中测试了他们的模型，但是无法解释使用这一正则项带来的提升。

通过对我们的实例（case）进行分析，我们证明了，最小化该正则项（在II –model中也使用了）同最小化模型预测结果（备注1）中的方差是等价的。此外，我们也证明了正则项同线性期望dropout（命题1）之间的关系。在第5节，我们研究了基于没有在II –model中使用的两种网络损失的目标的影响。我们发现在两个网络中应用目标损失（target loss）将使得网络获得关键性的更快的收敛。最后，我们注意到时域嵌入（temporal embedding ，Laine&Aila（2016）提出的另一模型，声称对于半监督学习来说，是比II –model更好的版本）在自然语言处理应用中相当的棘手，因为保存所有时刻的平均预测值会十分消耗内存（因为预测值的数目往往非常大-数以万计）。还有一点，我们证明了在监督学习的实例（case）中，使用时间依赖的权重函数来代替一个常量值k/m是没有必要的。因为标记的数据是已知的，我们没有观察到Laine&Aila（2016）提到的问题，即当在早期训练的epoch中太大时，网络会陷入退化。我们注意到寻找一个优化的常量值比调整时间依赖的函数更加容易，这也在我们的实例中进行了实现。

和II –model的方法相似，我们的方法也和其他半监督任务相关，主要有Rasmus et al.(2015)和Sajjadi et al.(2016)。由于半监督学习并不是本文要关注的部分，因此我们参考了Laine&Aila（2016）的更多细节。

4 实验

4.1 语言模型

在语言建模的情形下，我们在两个基准数据集Penn Tree-bank（PTB）数据集（Marcus等，1993）和WikiText-2（WT2）数据集（Merity等，2016）上测试了我们的模型。预处理操作参考了Mikolov等（2010）（用于PTB语料库），并且用到了Moses tokenizer（Koehn等，2007）（用于WT2数据集）。

对于这两个数据集，我们都采用了Merity等人描述的AWD-LSTM 3层架构。（2017a）。用于PTB的模型中的参数数量是2400万，而WT2的参数数量则是3400万，这是因为WT2词汇量更大，我们要使用更大的嵌入矩阵。除了这些差异之外，架构是相同的。

Penn Tree-bank（PTB）词级任务

我们使用混淆度指标来评估我们的模型，并将我们获得的结果与现有的最好结果进行比较。表1显示了我们的结果，在现有benchmark上，我们的方法达到了最先进的性能。

WikiText-2词级任务

在WikiText-2语言建模任务的情况下，我们的表现优于目前的最新技术水平。表2列出了最终结果。关于实验的更多细节可以在5.4节中找到。

4.2 图像标注

我们也把fraternal dropout应用到了图像标注任务上。我们使用著名的show and tell模型作为baseline（Vinyals等，2014）。这里要强调的是，在图像标注任务中，图像编码器和句子解码器架构通常是一起学习的。但既然我们想把重点放在在RNN中使用fraternal dropout的好处上，我们就使用了冻结的预训练ResNet-101（He 等，2015）模型作为我们的图像编码器。这也就意味着我们的结果不能与其他最先进的方法直接比较，但是我们提供了原始方法的结果，以便读者可以看到我们的baseline良好的表现。表3提供了最终的结果。

我们认为，在这个任务中，κ值较小时，效果最好，因为图像标注编码器在开始时就被给予了所有信息，因此连续预测的方差会小于在无条件的自然语言处理任务中的方差。Fraternal dropout可能在这里是有利的，主要是因为它对不同mask的平均梯度进行了平均，从而更新权重频率更快。

5 ABLATION STUDIES (模型简化测试)

在本节中，我们的目标是研究与我们方法密切相关的现有方法。expectation linear dropout （Ma et al. ,2016），Π-model(Laine & Aila 2016)和activity regularization(Merity et al. 2017b),我们所有的ablation studies（小编注：ablation study是为了研究模型中所提出的一些结构是否有效而设计的实验）都是采用一个单层LSTM，使用相同的超参数和模型结构。

5.1 线性期望DROPOUT (ELD)

第二部分已经讨论了我们法方法和ELD方法的联系。这里我们进行实验来研究使用ELD正则化和我们的正则化（FD）性能上的差异。除了ELD，我们还研究了一个ELD的改进版ELDM。ELDM就是跟FD的用法相似，将ELD应用在两个相同的LSTM上(在原作者的实验中只是在一个LSTM上用了dropout)。因此我们得到了一个没有任何正则化方式的基准模型。图1画出了这几种方法训练过程的曲线。与其他方法相比，我们的正则化方法在收敛性上表现的更好。而在泛化性能上，我们发现FD和ELD相似，而基准模型和ELDM表现得更差。有趣的是，如果一起看训练和验证曲线，ELDM似乎还有待进一步的优化。

5.2 Π-MODEL

因为Π-MODEL和我们的算法相似（即使它是为前馈网络中的半监督学习而设计的），所以我们为了明确我们算法的优势，分别从定性和定量的角度研究了它们在性能上的差异。首先，基于PTB（Penn Treebank Dataset）任务，我们运行了单层LSTM和3层AWD-LSTM来在语言建模上对两种算法进测试比较。图1和2显示了测试结果。我们发现我们的模型比Π-MODEL收敛速度明显加快，我们相信这是因为我们采用两个网络(Π-MODEL相反)反向传播目标损失，导致了更多的采用基于目标梯度的参数更新。

尽管我们设计的算法是专门来解决RNN中的问题，但为了有一个公平的对比，我们在半监督任务上也与Π-MODEL做了对比。因此，我们使用了包含10类由32x32大小图像组成的CIFAR-10数据集。参照半监督学习文献中通常的数据拆分方法，我们使用了4000张标记的图片和41000张无标记图片作为训练集，5000张标记的图片做验证集合10000张标记的图片做测试集。我们使用了原版的56层残差网络结构，网格搜索参数

，

dropout率在{0.05，0.1，0.15，0.2}，然后保持剩下的超参数不变。我们另外测验了使用无标记数据的重要性。表4给出了结果。我们发现我们算法的表现和Π-MODEL几乎一样。当无标记数据没有使用时，fraternal dropout仅仅比普通的dropout表现得要稍微好些。

5.3激活正则化(AR)和时域激活正则化(TAR)分析

Merity et al.(2017b)的作者们研究了激活正则化(AR)的重要性，和在LSTM中的时域激活正则化(TAR)，如下所示，

表4：基于ResNet-56模型在改变的（半监督任务）CIFAR-10数据集的准确率。我们发现我们提出的算法和II模型有同等的表现。当未标记数据没有被使用，传统dropout会破坏性能，但是fraternal dropout提供了略好的结果。这意味着当缺乏数据和不得不使用额外的正则方法时，我们的方法是有利的。

图4：Ablation研究：使用PTB词级模型的单层LSTM（10M参数）的训练（左）和验证（右）混淆度。显示了基准模型、时域激活正则化(TAR)、预测模型（PR）、激活正则化(AR)和fraternal dropout（FD,我们的算法）的学习动态曲线。我们发现与对照的正则项相比，FD收敛速度更快，泛华性能更好。

其中，是LSTM在时刻t时的输出激活（因此同时取决于当前输入和模型参数）。注意AR和TAR正则化应用在LSTM的输出上，而我们的正则化应用在LSTM的pre-softmax输出上。但是，因为我们的正则项能够分解如下：

并且，封装了一个项和点积项，我们通过实验确定了在我们的方法中的提升并不是单独由正则项决定的。TAR目标也有一个相似的争论。我们在上运行网格搜索，包括在Merity et al.(2017b)中提到的超参数。我们在提出的正则项中使用。而且，我们也在一个正则式为正则项（PR）上进行了比较，以进一步排除仅来自于正则项的任何提升。基于这一网格搜索，我们选择了在验证集上对所有正则化来说最好的模型，另外还报告了一个未使用已提及的4种正则化的基准模型。学习动态如图4所示。与其他方法相比，我们的正则项在收敛和概括期间都表现更好。当描述的任意正则项被应用时，平均隐藏态激活减少（如图3所示）。

5.4 LANGUAGE MODELING FAIR COMPARISON（语言模型比较）

正如4.1小节所述，由于Melis等人（2017）的影响，我们要确保fraternal dropout能够超越现有的方法不仅仅是因为广泛的超参数网格搜索。因此，在我们的实验中，我们保留了原始文件中提到的绝大多数超参数，即嵌入和隐藏状态大小，梯度裁剪值，权重衰减以及用于所有dropout层的值（词向量上的dropout，LSTM层间的输出，最终LSTM的输出和嵌入dropout）。

当然，也进行了一些必要的变化：

AR和TAR的系数必须改变，因为fraternal dropout也影响RNN的激活（如5.3小节所述） - 我们没有进行网格搜索来获得最好的值，而是简单地去除了AR和TAR正则项。
由于我们需要两倍的内存，所以batch的size被减小了一半，从而让模型产生大致相同的内存量需求，并且可以安装在同一个GPU上

最后一项变动的地方是改变ASGD的非单调间隔超参数n。我们在n∈{5,25,40,50,60}上进行了一个网格搜索，并且在n取最大值（40,50和60）的时候获得了非常相似的结果。因此，我们的模型使用普通SGD优化器的训练时间要长于原始模型。

为了确保我们的模型效果，我们在PTB数据集上通过使用不同种子的原始超参数（不进行微调）运行了10个学习程序来计算置信区间。平均最佳验证混淆度为60.64±0.15，最小值为60.33。测试混淆度分别为58.32±0.14和58.05。我们的得分（59.8分验证混淆度和58.0分测试混淆度）比最初的dropout得分好。

由于计算资源有限，我们在WT2数据集对fraternal dropout运行了一次单独的训练程序。在这个实验中，我们使用PTB数据集的最佳超参数（κ= 0.1，非单调间隔n = 60，batch size减半）。

我们证实使用fine-tuning会对ASGD有好处（Merity等，2017a）。然而，这是一个非常耗时的做法，因为在这个附加的学习过程中可能会使用不同的超参数，所以通过广泛的网格搜索而获得更好的结果的可能性更高。因此，在我们的实验中，我们使用与官方存储库中实施的相同的fine-tunin程序（甚至没有使用fraternal dropout）。表5中列出了fine-tuning的重要性。

我们认为，运行网格联合搜索所有超参数可能会获得更好的结果（改变dropout率可能是尤其有利，因为我们的方法就明确地使用了dropout）。然而，我们这里的目的是排除仅仅因为使用更好的超参数而表现更好的可能性。

6 结论

在论文中，我们提出了一个叫做fraternal dropout的简单RNNs正则化方法，通过作为正则项来减少模型在不同的dropout mask上预测结果的方差。通过实验证明了我们的模型具有更快的收敛速度，同时在基准语言建模任务上取得了最先进的成果。我们也分析研究了我们的正则项和线性期望dropout (Ma 等，2016)之间的关系。我们进行了一系列的ablation 研究，从不同的角度评估了模型，并从定性和定量的角度将其与相关方法进行了仔细比较。

论文链接 Fraternal Dropout

https://arxiv.org/abs/1711.00066

资源推荐

重磅 | 128篇论文，21大领域，深度学习最值得看的资源全在这了

爆款 | Medium上6900个赞的AI学习路线图，让你快速上手机器学习

Quora十大机器学习作者与Facebook十大机器学习、数据科学群组

Chatbot大牛推荐：AI、机器学习、深度学习必看9大入门视频

葵花宝典之机器学习：全网最重要的AI资源都在这里了（大牛，研究机构，视频，博客，书籍，Quora......）

重磅｜数据科学入门必看：来自斯坦福、MIT、微软、Twitter等名校名企的20门课程清单

资源 | 值得收藏的 27 个机器学习的小抄

你可能感兴趣的:(重磅 | 机器学习大神Bengio最新论文发布，专注RNN优化难题，将在NIPS提出新概念fraternal dropout)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
网易严选官方旗舰店，优质商品，卓越服务高省_飞智666600
网易严选官方旗舰店是网易旗下的一家电商平台，以提供优质商品和卓越服务而闻名。作为一名SEO优化师，我将为您详细介绍网易严选官方旗舰店，并重点强调其特点和优势。大家好！我是高省APP最大团队&联合创始人飞智导师。相较于其他返利app，高省APP的佣金更高，模式更好，最重要的是，终端用户不会流失！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
读书||陶新华《教育中的积极心理学》1—28 流水淙淙2022
读一本好书，尤如和一位高尚者对话，亦能对人的精神进行洗礼。但是若不能和实践结合起来，也只能落到空读书的状态。读书摘要与感想1、塞利格曼在《持续的幸福》一书中提出了幸福2.0理论，提出幸福由5个元素决定——积极情绪、投入的工作和生活、目标和意义、和谐的人际关系、成就感。2、人的大脑皮层在进行智力活动时，都伴有皮下中枢活动，对这些活动进行体验请假，并由此产生了情感解读。人的情绪情感体验总是优先于大脑的
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
闲鱼鱼小铺怎么开通？鱼小铺开通需要哪些流程？高省APP大九
闲鱼鱼小铺是平台推出的一个专业程度的店铺，与普通店铺相比会有更多的权益，比如说发布的商品数量从50增加到500；拥有专业的店铺数据看板与分析的功能，这对于专门在闲鱼做生意的用户来说是非常有帮助的，那么鱼小铺每个人都能开通吗？大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能
《大兴安岭猎人传说》今年最好看的东北鬼怪故事，很优秀一部电影
《大兴安岭猎人传说》是最新上映于愚人节的网剧，别看是网剧却远超出我的个人预料。该片由民俗故事改编，这点就很吸引人，因为民俗故事口口相传，比那些编造而成的鬼故事更具有了真实性，网大做的电影还不错哦，如果可以我打四星好评。大兴安岭的故事我们经常听老人提起，那里有原始大森林，物产丰富，更流传着精灵怪物的传说。什么红黄白柳灰，出马仙、人参娃娃的故事层出不穷，以大兴安岭为背景的故事真不少。可很多鬼片看到最后
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
果然只有离职的时候，才有人敢说真话！ return2ok
今天公司出了神贴。今天中午吃饭，同事问我看了论坛上的神贴了吗？什么帖子？我问。同事显得很惊讶，你居然没看，现在那个帖子可能会成为年度最佳帖子。这么厉害？我等不及了，饭没吃完就快速的奔向办公室，打开公司论坛，我要一睹这个帖子的神奇。写这帖子的童鞋胆儿真肥。这哪里是一个帖子，这是很多个帖子，组成了一个系列。某人从公司文化、管理、人事、项目管理等多个方面分析了公司的概况，并抨击了公司的各种弊端，并提出了
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
道阻且长，行则将至 sweet橘子
本文参与书香澜梦主题征文“行”文章原创首发，文责自负。我们每一个人都应该有属于自己的愿望或者是理想，人一但有了理想也就算是有了方向，它就会像灯塔一样指引我们前进的方向，哪怕是再远大的理想，如果坚持，那么我相信它就一定有收获。屈原是我最喜欢的一个浪漫主义的诗人，他曾今说过：“路漫漫其修远兮，吾将上下而求索。”人生的道路很长，但是为了实现自己的理想抱负我愿意付出我毕生的精力，只专注这一件事，因为“道阻
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
女儿考研完报考雅思捡拾流年
是否我过于焦虑？会不会无形间让女儿觉得压力太大了啊。2022年对于我们家来说是不平常的一年。女儿今年大四，为了准备考研，暑假也没回家，年初去了学校到了年末才回家。女儿自己一个人面对考研，没有参加培训，大四学校作业论文等课业也多，她同时也是很努力复习考研的。在疫情开放很多羊的时期，女儿终于顺顺利利参加12月24、25号的考研，我们和家人都觉得女儿回家来要好好休息调养。可女儿回到家，我再查阅考研信息，
最超值的Mac——Mac mini 初心么么哒
你知道最超值的Mac是什么吗？自2005年以来，Macmini一直是Apple台式机产品线中的主要产品。最初推出是为了让对Mac好奇的Mac进入Apple生态系统的一种简单方式，现在新的AppleSiliconMacmini可能是任何寻找新Mac的人的最有吸引力的购买。什么是AppleSiliconMacmini？M1Macmini是Apple最小的台式电脑，同时也是最快的台式电脑之一。最新型号由
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
大雄的新恐龙：养育生命，的确不易沧浪先生
哆啦A梦这个动画片，我小时候没有看过，长大了之后似乎对这种充满童真童趣的动画片也没有太多的喜爱，所以结果很明显，我并没有看过哆啦A梦这个动画片。但是近年来大屏幕的兴起，让各家影视剧制作者发现了电影化的好处，没错，电影不仅影响力更大，钱赚得也多。《哆啦A梦·大雄的新恐龙》是最新的一部大屏幕电影，大雄和柯南一样，都永远长不大，而且他和他的小伙伴日复一日、年复一年地和机器猫哆啦A梦在一起玩耍，永远的神奇
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
作业是家庭关系的枢纽潘海松
回想一下，当孩子做作业的时候，我们不断地在和孩子聊天、沟通，互相提出一些要求，也不可避免地，会产生分歧。举个最常见的例子，我们告诉孩子：「该写作业了。」娃是什么反应？好的亲子关系，孩子会乖乖停掉手里的事马上去写作业，或者好声好气地和家长商量，能不能在半个小时（或某个时间）开始。而不如意的亲子关系，孩子听到这句话的瞬间，就是各种不情愿，敷衍、拖延甚至于撒谎、撒泼打滚。最后，成为当天家庭里坏情绪的引爆
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
上班族可以做线上副业兼职有哪些？盘点7个适合上班族做的副业兼职！高省APP大九
对于许多上班族来说，工资往往不能满足他们的生活需求，因此许多人开始寻找副业来增加收入。以下是一些适合普通人的副业赚钱路子，希望能给您带来一些灵感。1、做好物推荐现在很多职场人其实有大量的个人时间，只不过这些个人时间比较碎片化，他们不能够很好的利用起来，其实可以利用这些碎片化的时间去做副业，比如做好物推荐。在网上有很多的平台，比如头条抖音等等都开通了一个商品的分销功能，只要你发布相关的视频或者文章，
esp32开发快速入门 8 : MQTT 的快速入门，基于esp32实现MQTT通信 z755924843 ESP32开发快速入门服务器网络运维
MQTT介绍简介MQTT（MessageQueuingTelemetryTransport，消息队列遥测传输协议），是一种基于发布/订阅（publish/subscribe）模式的"轻量级"通讯协议，该协议构建于TCP/IP协议上，由IBM在1999年发布。MQTT最大优点在于，可以以极少的代码和有限的带宽，为连接远程设备提供实时可靠的消息服务。作为一种低开销、低带宽占用的即时通讯协议，使其在物联
python怎么将png转为tif_png转tif weixin_39977276
发国外的文章要求图片是tif，cmyk色彩空间的。大小尺寸还有要求。比如网上大神多，找到了一段代码，感谢！https://www.jianshu.com/p/ec2af4311f56https://github.com/KevinZc007/image2Tifimportjava.awt.image.BufferedImage;importjava.io.File;importjava.io.Fi
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite