数智物语

ICLR2020推荐阅读论文50篇

文章发布于公号【数智物语】（ID：decision_engine），关注公号不错过每一篇干货。

来源 | 香侬科技

作者 | 香侬科技

我们为大家整理了ICLR2020的相关论文，此次分享的是从Openreview中选取的部分论文，共50篇，其中大部分为NLP相关。文中涉及的相关论文推荐指数与推荐理由仅为小编个人观点，利益无关。希望大家可以从中获得启发。

推荐指数4.0论文

论文1

Reducing Transformer Depth on Demand with Structured Dropout

https://openreview.net/pdf?id=SylO2yStDr

推荐说明：还是那个问题，Transformer、BERT等模型太大，我们想要给模型瘦身而效果不减。

本文提出使用LayerDrop——随机丢弃一些层，来给模型减肥。这种Drop方法既可以起到正则化的效果，更重要的是，它可以无痛剪枝，不需要再次微调，一劳永逸，简直令人激动。

推荐理由：方法非常优雅，在多个任务上的实验也表明了这种方法的有效性，怎一个好字了得。

推荐指数：4.0

论文2

On Layer Normalization in the TransformerArchitecture

https://openreview.net/pdf?id=B1x8anVFPr

推荐说明：我们知道，在原始的Transformer中，Layer Norm在跟在Residual之后的，我们把这个称为Post-LN Transformer。

而且用Transformer调过参的同学也知道，Post-LN Transformer对参数非常敏感，需要很仔细地调参才能取得好的结果，比如必备的warm-up学习率策略，这会非常耗时间。

所以现在问题来了，为什么warm-up是必须的？能不能把它去掉？

本文的出发点是：既然warm-up是训练的初始阶段使用的，那肯定是训练的初始阶段优化有问题，包括模型的初始化。

从而，作者发现，Post-LN Transformer在训练的初始阶段，输出层附近的期望梯度非常大，所以，如果没有warm-up，模型优化过程就会炸裂，非常不稳定。

既然如此，本文作者尝试把LayerNorm换个位置，比如放在Residual的过程之中（称为Pre-LN Transformer），再观察训练初始阶段的梯度变化，发现比Post-LN Transformer不知道好到哪里去了，甚至不需要warm-up，从而进一步减少训练时间，这一结果的确令人震惊。

推荐理由：本文别出心裁，用实验和理论验证了Pre-LN Transformer结构不需要使用warm-up的可能性，其根源是LN层的位置导致层次梯度范数的增长，进而导致了Post-LN Transformer训练的不稳定性。

本文第一次将warm-up、LayerNorm、gradient和initialization联系起来，非常值得一读！

推荐指数：4.0

推荐指数3.5论文

论文3

Copy That! Editing Sequences by CopyingSpans

https://openreview.net/pdf?id=SklM1xStPB

推荐说明：对于文本修改任务如纠错，SEQ2SEQ方法其实并不好，这是因为大部分文本没有错，只需要单纯copy即可。

本文基于大篇幅copy现象提出copy spans方法去动态地修改序列。方法非常简单，但在代码修复、语法纠错任务上表现很好。

推荐理由：方法简洁有效，未来有很大的扩展空间。

推荐指数：3.5

论文4

SuperBloom: Bloom Filter MeetsTransformer

https://openreview.net/pdf?id=SJxy5A4twS

推荐说明：Bloom Filter是用来判定一个元素“是否一定不在集合”中的方法，也就是说，BF只有两种结果：可能在与一定不在。BF使用的是哈希表方法。

另一方面，词向量表一般非常大，这会降低训练和推理的效率。本文在Transformer中使用BF算法，对词向量矩阵大幅瘦身，并且在多个实验上达到Recall的提升。

推荐理由：方法非常有趣，效果也很明显。

推荐指数：3.5

论文5

Calibration, Entropy Rates, And Memory inLanguage Models

https://openreview.net/pdf?id=B1eQcCEtDB

推荐说明：本文集中回答一个问题：语言模型生成句子的长距离依赖和真实语言的长距离依赖之间应该如何比较。以往的度量是用熵率衡量，越小越好。

但是，GPT-2尽管实现了23.7的PPL，它的熵率却达到了61.2，这说明这两个指标并不是在说同一件事。本文提出一种基于校准的方法检测和修正语言模型长距离依赖和真实分布之间不一致问题。

推荐理由：本文有助于学界重视LM中长距离依赖和future-aware的问题。

推荐指数：3.5

论文6

DEFINE: Deep Factorized Input WordEmbeddings for Neural Sequence Modeling

https://openreview.net/pdf?id=rJeXS04FPH

推荐说明：还是那个问题，词典太大导致首尾两个embedding参数量庞大（实际上也没必要，因为很多词出现频率很低）。

本文提出使用“低维嵌入—>分层分组变换—>高维嵌入”的方法降低参数量，直接把Transformer-XL的参数化降一半。

在WikiText-103和PTB上的实验表明，参数量大幅减少的同时效果却不差；在WMT2014 En-De上的实验表明，参数量的降低是显著的。

推荐理由：这种方法真的挺优雅的，感觉还可以改进，比如把FFN换成Attention和Conv啥的魔改一下。

推荐指数：3.5

论文7

Understanding Knowledge Distillation inNon-Autoregressive Machine Translation

https://openreview.net/pdf?id=BygFVAEKDH

推荐说明：NAT，其中基本都使用到了知识蒸馏（就是用teacher模型的输出当作NAT模型的输出目标），但是为什么非要这么做呢？难道用有噪音的输出不会效果更差吗？

本文使用大量实验告诉我们：蒸馏降低了NAT模型的条件熵。基于此，本文还提出了几种进一步提高NAT效果的方法，已经和AT效果差不多了。

推荐理由：知识蒸馏恐怖如斯！

推荐指数：3.5

论文8

Encoder-Agnostic Adaptation forConditional Language Generation

https://openreview.net/pdf?id=B1xq264YvH

推荐说明：众所周知，对于非生成类任务，大型预训练模型已经成为刷SOTA的标配，但是怎么把预训练用到语言生成上去呢？

本文提出了三种encoder-agnostic的方法，将任一encoder得到的特征表示送入decoder并生成相应任务的句子。这里的encoder是具体任务相关的、随机初始化的。

而这三种方法的区别在于，decoder的不同部分有不同的初始化，但总的来说都分为使用预训练模型初始化或随机初始化。整个模型使用监督方法训练。在多个生成任务上的实验表明，这种方法的确可以显著提高生成效果。

推荐理由：方法简单、有效、通用。

推荐指数：3.5

论文9

Combiner: Inductively Learning TreeStructured Attention in Transformers

https://openreview.net/pdf?id=B1eySTVtvB

推荐说明：本文使用了Sparse Attention和Hierarchical Attention Block的方法去得到句子的语法树，只需要对Transformer稍作修改，就可以取得相当好的结果。

和前一篇GrammarInduction文章不同，本文注重得到句子结构，也就是语法树，而前者注重语法规则。

推荐理由：效果是真的不错，方法也很优雅，推荐阅读。

推荐指数：3.5

论文10

Encoding Word Order in Complex Embeddings

https://openreview.net/pdf?id=Hke-WTVtwr

推荐说明：本文提出一种通用的基于复数的方法去直接导出词向量，从而综合了词向量和位置向量，还可以表示词之间的相对距离。

而且Transformer中的positional embedding和word embedding结合方式可以看作是本文方法的一种特殊情况。在多个任务上的实验表明了这种方法的有效性。

推荐理由：复数空间非常有趣，很有发展潜力。

推荐指数：3.5

论文11

Large-scale Pretraining for NeuralMachine Translation with Tens of Billions of Sentence Pairs

https://openreview.net/pdf?id=Bkl8YR4YDB

推荐说明：本文在40B的超大数据上验证了NMT模型的效果，并且提出了一种平衡数据集利用和预训练效率的方法。

实验结果表明，大规模预训练的确可以显著提高NMT效果，而且也从经验上验证了在大语料下大模型的必要性。我们在WMT17 Ch-En上实现了32.3的BLEU值，达到新的SOTA。

推荐理由：本文简直是暴力出奇迹的典范，虽然暴力，但是也确实验证了数据集和模型大小的有用性，还提出了大力下的训练方法，为广大“贫穷”的科研人员开辟了一条研究的路。

推荐指数：3.5

推荐指数3.0论文

论文12

An Exponential Learning Rate Schedule forBatch Normalized Networks

https://openreview.net/pdf?id=rJg8TeSFDH

推荐说明：这是一篇无关NLP的论文。本文提出了一个每次乘以(1+a)的指数递增学习率schedule方法，并在数学上证明它等价于BN + SGD + WD + Momentum + Standard Rate Tuning。

本文的出发点基于各种Normalization方法的scale-invariant性质：rescale模型的参数不会改变模型的预测结果。

因此，本文的方法可以总结为：（在使用如BN的Normalization方法的模型上）将初始学习率调为一个合适的值（如0.1），然后以（1+a）指数增长；当验证集的loss不再降低之后，再以（1+b,b

推荐理由：本文突破了以往的固有想法——学习率要不断下降，从理论上验证了在Normalization下学习率指数上升的等价性，具有一定新颖性。

推荐指数：3.0

论文13

Improving the Gating Mechanism of Recurrent Neural Networks

https://openreview.net/pdf?id=r1lnigSFDr

推荐说明：各种模型内的门控机制期望可以动态地实现信息的更迭，保留重要的信息而丢弃不重要的信息。

从BP的角度看，保留信息实际上是梯度的保留，也就是接近函数的饱和区域（梯度约为1，也即函数值接近0或1）。但问题是，一旦接近饱和区域，模型实际上很难建模长距离信息。

本文使用两种方法缓解这些问题：（1）对遗忘门初始化为[0,1]上的均匀分布；（2）提出一个refine gate。在多个任务的实验验证了这种方法的有效性。

推荐理由：本文探究了一系列门控方法，并且提出了一种新的门控方法——UR-LSTM，可以更好地建模长距离依赖。另外，本文的实验图很好看。

推荐指数：3.0

论文14

Masked Translation Model

https://openreview.net/pdf?id=HygaSxHYvH

推荐说明：长期以来，机器翻译都是基于seq2seq架构和AR生成。

本文提出的Masked Translation Model把编码器和解码器融合在一起，基于Mask方法，既可以AR生成，也可以Non-AR生成，还提供多种解码策略，非常flexible，可以看作一种更通用的KERMIT模型。

推荐理由：这种翻译方法近来非常流行，本文继续提高了这种方法的翻译结果，不但可以做翻译，甚至可以做LM、Text Editing等，很方便。

推荐指数：3.0

论文15

Multichannel Generative Language Models

https://openreview.net/pdf?id=r1xQNlBYPS

推荐说明：本文提出了一个改进的KERMIT模型，用于建模多语言（这里称为多channel）的联合分布，如此既可以进行条件生成（如MT），也可以进行无条件生成（直接生成句子），不但可以AR生成，也可以Non-AR生成，功能丰富。

推荐理由：再次强调这种通用模型，是非常厉害的！

推荐指数：3.0

论文16

Semi-Supervised Named Entity Recognitionwith CRF-VAEs

https://openreview.net/pdf?id=BkxnKkrtvS

推荐说明：本文独具匠心地把CRF和VAE相融合去做半监督下的NER。

标准情况下的NER是编码器->CRF->输出标签，而本文还加入了未标注文本，把CRF当成一种近似后验加入优化ELBO，从而实现半监督下的模型学习。实验证明了这种方法具有一定有效性。

推荐理由：方法很有趣，但不太优雅。

推荐指数：3.0

论文17

A Probabilistic Formulation ofUnsupervised Text Style Transfer

https://openreview.net/pdf?id=HJlA0C4tPS

推荐说明：本文以一种概率生成模型的角度去分析无监督文本风格迁移，在没有平行语料的情况下，训练两个领域的隐平行句子。

然后使用两个LM先验模型+两个共享参数的领域转换模型直接去建模整体联合分布，然后使用ELBO优化模型。在多个数据集上的实验结果表明本文的方法可以提高Acc和BLEU值。

推荐理由：以一种概率分布的视角搭建起了无监督文本风格迁移各种方法的桥梁，可以读一下。

推荐指数：3.0

论文18

Word Embedding Re-Examined: Is theSymmetric Factorization Optimal?

https://openreview.net/pdf?id=HklCk1BtwS

推荐说明：本文从理论上分析了word embedding具有一些良好性质的原因，本质上是共现矩阵到嵌入空间的低秩变换，这使得词之间的相对距离得以保留，从而共现矩阵有的性质，word embedding也得以继承。

推荐理由：本文的证明过程具有一定的指导意义。

推荐指数：3.0

论文19

Learning to Contextually AggregateMulti-Source Supervision for Sequence Labeling

https://openreview.net/pdf?id=HJe9cR4KvB

推荐说明：本文学习了一个聚合同一任务不同数据源数据的序列标注模型，可以通过这种方法缓解数据内标注分布偏移和噪声的问题，也可以用于学习跨领域的数据。

推荐理由：方法简单，效果不错，跨领域学习也有吸引力。

推荐指数：3.0

论文20

BERTScore: Evaluating Text Generationwith BERT

https://openreview.net/pdf?id=SkeHuCVFDr

推荐说明：BERT既然这么牛逼，为什么不能用它作为一种度量标准呢？直接把生成句子和参考句子怼进BERT，然后计算token之间的cos相似度，然后用一个max-pool，再玄学算一下，暴力有效，因吹斯听！

推荐理由：据说和人类评估更接近，而且也比较鲁棒（这篇文章好像是某会被拒了，重投ICLR）。

推荐指数：3.0

论文21

Parallel Neural Text-to-Speech

https://openreview.net/pdf?id=BJeFQ0NtPS

推荐说明：传统的TTS一般是follow了一个多流程的pipeline，近年来基于深度学习的方法使用的是seq2seq，比如WaveNet、ClariNet等。

本文提出ParaNet，一种Non-AR的TTS方法，直接提取Mel频谱，再使用Attention蒸馏，速度很快，效果不错。

推荐理由：文本转语音的研究比较少，可以拿出来给大家复（预）习下。

推荐指数：3.0

论文22

Contextual Text Style Transfer

https://openreview.net/pdf?id=HkeJzANFwS

推荐说明：本文介绍了一种新的任务：上下文相关文本风格迁移。所谓上下文相关，就是在迁移的时候要保持上下文语义的一致性，这就在单纯的文本风格迁移上多了一层要求。

本文提出的方法基于半监督，使用了多个损失，比较复杂，但是不难理解，效果却也不错。

推荐理由：挖了个新坑，妙啊。

推荐指数：3.0

论文23

Are Transformers Universal Approximationsof Sequence-to-Sequence Functions?

https://openreview.net/pdf?id=ByxRM0Ntvr

推荐说明：本文从理论上证明了：Transformer是一个支持连续和置换不变性序列到序列函数的通用近似器，只要有足够好的positional embedding。

此外，本文还发现把self-attention替换成其他的一些上下文映射函数可以取得更好的效果。

推荐理由：满页的公式，还是你们来。

推荐指数：3.0

论文24

TABNET: Attentive Interpretable TabularLearning

https://openreview.net/pdf?id=BylRkAEKDH

推荐说明：本文提出使用sequential attention去建模表格型数据，适用于各种分类和回归任务。

推荐理由：Kaggle福利，现成模板，童叟无欺。

推荐指数：3.0

论文25

Mixout: Effective Regularization toFinetune Large-Scale Pretrained Language Models

https://openreview.net/pdf?id=HkgaETNtDB

推荐说明：本文提出一种新的用于微调预训练模型的L2正则化方法：mixout。

所谓mixout，就是在微调的整个过程中，动态地融合两个阶段模型的参数的方法，这样可以使得微调渐次进行，不至于导致效果的崩塌。在GLUE几个任务上的实验验证了该方法的有效性。

推荐理由：方法挺有趣，可以进一步推广到其他任务看看效果。

推荐指数：3.0

论文26

Language GANs Falling Short

https://openreview.net/pdf?id=BJgza6VtPB

推荐说明：评价一个模型生成句子的效果有两方面的指标：质量和多样性。只重视前者而忽略后者会导致exposure bias，尤其对于像GAN这种生成模型。

本文创造性地使用temperature作为一种评估模型quality-diversitytrade-off的指标。通过这种方法，作者发现基于MLE的生成模型在quality/diversity上都超过了基于GAN的方法。

推荐理由：很有意思的文章，不过GAN真的是弟弟？

推荐指数：3.0

论文27

Unifying Question Answering, TextClassification, and Regression via Span Extraction

https://openreview.net/pdf?id=HketzTNYwS

推荐说明：用BERT去做QA、文本分类和回归任务时，都是使用的最后一层单元的Span（或长或短），本文认为可以把这些任务综合起来进行。

对QA，按照原BERT处理，直接抽取即可；对文本分类，在文本前加上“positive ornegative”，然后让模型去判别“positive/negative”对应位置的span即可。

对句对分类，在文本前加上“entailment, contradictionor neutral”；对回归问题，直接对可能的值均匀分割成一些离散的值。

使用这种方法，我们有望把这些任务合在一种模型里，减少了模型的设计量，并且如果做成多任务，还可以提高有限数据量下的效果。

推荐理由：本文来自Salesforce论文小分队，不用我多说了嗷。

推荐指数：3.0

论文28

Are Pre-trained Language Models Aware ofPhrases? Simple but Strong Baselines for Grammar Induction

https://openreview.net/pdf?id=H1xPR3NtPB

推荐说明：本文提出直接从预训练的语言模型中提取语法结构成分，形成语法树。

本文提出直接从Transformer-like的预训练语言模型中，利用其多头机制，直接提取各种短语结构，包括动词短语、名词短语、副词短语等。

本文在英语语法推导任务上验证了该方法的有效性，可以作为一个很强的baseline。

推荐理由：不再训练，不用规则！语法推导，点击就送！

推荐指数：3.0

论文29

Dynamically Pruned Message PassingNetworks for Large-scale Knowledge Graph Reasoning

https://openreview.net/pdf?id=rkeuAhVKvB

推荐说明：知识图谱推理最近变得很火，这其实也是一个有巨大潜力的方向。以往的研究大多是给出一个推理路径（path-based）。

本文提出一种更灵活、更具解释力的方法，能够在推理的同时进行网络图剪枝得到子图（sub-graph），提高大规模知识图谱下的推理效率。

本文采用了attention、consciousness prior等多种方法，十分novel。

推荐理由：新的推理方法，有探索价值。

推荐指数：3.0

论文30

An Empirical Study on Post-ProcessingMethods for Word Embeddings

https://openreview.net/pdf?id=Byla224KPr

推荐说明：本文又是一篇偏理论的文章，研究了词向量的后处理方法，把这种方法视为对Gram矩阵的缩放。

两个词向量集应该满足各向同性缩放，从而中心核对齐（CKA）可以作为一种度量，因此我们目标就是去最大化这个相似性度量。

为此，本文提出在半黎曼流形（semi-Riemannian manifold）上优化，并且scale了其中的单位矩阵。实验表明本文的方法具有一定效果。

推荐理由：本文的词向量后处理方法看似很复杂，但实际上作者给出了步骤，还是非常直观的。

推荐指数：3.0

论文31

Reinforcement Learning BasedGraph-to-Sequence Model for Natural Question Generation

https://openreview.net/pdf?id=HygnDhEtvr

推荐说明：作为一个NLP中比较小众的领域，问题生成（QG）可以说是小众中偏困难的了。它比QA难在，它是一个纯粹的文本生成任务，而QA一般是作为分类任务。

本文首先提出一个对齐网络进行词层面和隐层层面的对齐；然后使用一个双向的图到序列生成器获得进一步的特征表示；最后使用一个RNN解码器生成句子。

而且，本文还使用了CE损失和RL损失相结合的方法保证语法和语义的兼顾。

推荐理由：本文提出了一个基于RL损失的Graph2Seq模型用于QG，实验效果也是杠杠的。

推荐指数：3.0

论文32

Topology of Deep Neural Networks

https://openreview.net/pdf?id=SkgBfaNKPr

推荐说明：本文认为，从拓扑学的角度看，深度模型实际上是把拓扑上非常复杂的数据转化为简单的拓扑结构，使得在输出的时候线性可分，并且ReLU会使得这种简化过程更快。

推荐理由：把深度学习模型置于拓扑学的观点下，给出了解释深度学习模型的一个非常直观的途径。

推荐指数：3.0

推荐指数2.5论文

论文33

Toward Controllable Text ContentManipulation

https://openreview.net/pdf?id=Skg7TerKPH

推荐说明：表格转文本和受限文本生成是近期比较火热的议题，把二者结合起来又如何呢。

本文提出受限表格转文本生成方法，对给定表格和一个参考句，模型需要生成一段文本，文本的内容是描述表格，但风格却是参考句。

在这种设置下，本文首先构建了两个专门的数据集，然后使用seq2seq+attention+copy+reconstruction的方法训练模型。

推荐理由：本文的出发点比较有趣，提出了一个简单实用的模型结构，并且结合了表格转文本和文本风格迁移两大主题，可以阅读。

推荐指数：2.5

论文34

A Syntax-Aware Approach for UnsupervisedText Style Transfer

https://openreview.net/pdf?id=Bkll_kHFPB

推荐说明：本文提出把预测语法标签作为附加任务去做无监督的文本风格转换；

损失还有三个：reconstruction, back-translation和discrimination。在几个常用数据集的实验上取得了一致的提高。

推荐理由：这种语法多任务可以看作一种防止过拟合的手段，出乎我意料的是，效果竟然还不错。

推荐指数：2.5

论文35

Compressive Transformers for Long-RangeSequence Modeling

https://openreview.net/pdf?id=SylKikSYDH

推荐说明：LSTM不能建模长距离序列，Transformer存储代价又太大，Transformer-XL会把很旧的单元丢掉，基于此，本文提出把Transformer-XL中要丢弃的部分压缩，当作一种“压缩记忆”。

怎么压缩呢？用花式CNN和Pooling……当然了，本文还提出一个新的数据集——PG-19，在这个数据集、WikiText-103和Enwiki8上达到SOTA。

通过各种实验，本文证明了对超长文本建模，CompressedTransformer的确表现最好。

推荐理由：方法简单，但是有效呀！

推荐指数：2.5

论文36

Contextual Temperature for LanguageModeling

https://openreview.net/pdf?id=H1x9004YPr

推荐说明：在softmax中使用temperature已经是一个基本操作了，但是之前的温度设置要么全程固定，要么随训练保持规律地变化。

本文认为，温度大小应该和上下文有关，从而使用当前步的上文学习一个对当前步的温度，在MoS上进行LM实验，并且采用了多个正则项。大概有2个点的PPL提升。

推荐理由：其实温度和上下文相关还是很有道理的，但是本文的方法比较简单，好在实验还做得不错。

推荐指数：2.5

论文37

On Variational Learning of ControllableRepresentations for Text without Supervision

https://openreview.net/pdf?id=Hkex2a4FPr

推荐说明：本文分析了使用VAE控制无监督文本生成的困难所在——后验空间的潜在空缺（latent vacancy）问题。

由此，本文提出使用两个损失项将后验高斯均值映射到一个受限空间中，从而鼓励该空间能够被“填满”，进行更好的优化。

这两个损失，一是结构化重构损失——一种max margin方法把目标往两个方向推，二是正则项——约束embeddingmatrix为正交。

推荐理由：方法简单，效果尚可。

推荐指数：2.5

论文38

Neural Markov Logic Networks

https://openreview.net/pdf?id=SkeGvaEtPr

推荐说明：马尔科夫逻辑网络（MLN）是一种将一阶逻辑和概率图模型相结合的统计学习方法。

本文提出的神经马尔科夫逻辑网络（NMLN）不需要显式地指定一阶逻辑规则，而通过神经网络隐式地学习。在知识库填充和分子数据生成的实验上取得显著效果。

推荐理由：看起来很厉害，有空学习下。

推荐指数：2.5

论文39

EINs：LongShort-Term Memory with Extrapolated Input Network Simplification

https://openreview.net/pdf?id=B1l5m6VFwr

推荐说明：本文通过改写LSTM和GRU的方程，将它们作为一种动态Hopfield网络，推出一种参数更少的RNN结构——EINS。

推荐理由：虽然参数少了，但是更复杂了呢。

推荐指数：2.5

推荐指数2.0论文

论文40

Faster and Just as Accurate: A SimpleDecomposition for Transformer Models

https://openreview.net/pdf?id=B1gKVeBtDH

推荐说明：尽管Transformer和BERT如此成功，但是训练它们需要耗费巨量的时间。

本文认为，我们不需要在self-attention的时候使得每个token去关注所有的token，一部分就够了。

由此，本文提出前k层分成两部分，各自self-attention，剩下的层再合起来self-attention，并且使用了知识蒸馏和层级相似度减少信息损失。在QA和句子相似度分类任务上的实验验证了这种方法的高效率和低损耗。

推荐理由：显卡燃烧的味道不香吗？

推荐指数：2.0

论文41

Incorporating BERT into Neural MachineTranslation

https://openreview.net/pdf?id=Hyl7ygStwB

推荐说明：如何把预训练模型，如BERT融入到MT中是自BERT诞生以来的问题。

不直接使用BERT初始化模型，本文是把BERT的输出融入到SEQ2SEQ模型的每一层，用在每个self-attention之中。

此外，本文还提出drop-net——随机丢弃BERT表示或模型本身的表示，充分利用两个方面的信息。实验结果还不错。

推荐理由：本文可以算是成功地把BERT加入到了MT中，方法比较奇特，但是还不够优雅。

推荐指数：2.0

论文42

Robustness Verification for Transformers

https://openreview.net/pdf?id=BJxwPJHFwS

推荐说明：本文给Transformer提出了首个鲁棒性验证方法，从理论和实验两个方面给出了界，并通过这种方法分析了情感分析中不同词的重要性。

推荐理由：来点偏理论的研究增增味。

推荐指数：2.0

论文43

On Predictive Information Sub-Optimalityof RNNs

https://openreview.net/pdf?id=HklsHyBKDr

推荐说明：现实世界中，人之所以如此智能，就是因为人能够记住很久之前的信息，从而能够帮助预测未来，而各种RNN从形式上好像也是记住过去，预测未来。

然而本文通过两个数据集上的实验表明，RNN简直弱爆了。

推荐理由：本文其实不太偏CS，算是给RNN的缺点提供了另外一种视角。

推荐指数：2.0

论文44

MUSE: Multi-Scale Attention Model forSequence to Sequence Learning

https://openreview.net/pdf?id=SJe-3REFwr

推荐说明：本文认为，像Transformer这样的模型对于建模长距离语义依然存在困难，从而提出多种建模方式（Attention、Dynamic Conv、FFN）平行计算，然后再聚合起来的方法。实验结果出乎意料地不错。

推荐理由：为什么不在WMT14 En-De上做呢？

推荐指数：3.0

论文45

Dropout: Explicit Forms and Capacity Control

https://openreview.net/pdf?id=Bylthp4Yvr

推荐说明：本文回答了一个问题：dropout是如何控制模型的容量的。本文通过一些数学推导给出了dropout下深度模型的泛化界，并在多种任务上进行了实验。

推荐理由：又是一篇数学学渣杀手，不过已经相对容易了。

推荐指数：2.0

论文46

Mitigating Posterior Collapse in StronglyConditioned VAE

https://openreview.net/pdf?id=rJlHea4Kvr

推荐说明：对于有很强条件的CVAE，decoder往往会忽略隐变量，使得模型退化为一个AE模型。

本文发现，这种情况发现的原因之一是条件变量的融入方式：直接concat。本文提出一种新的重参数方法使得条件变量和隐变量能够更好地融合，缓解后验坍塌问题。

推荐理由：本文融合两个变量的方法比较巧妙，值得学习。

推荐指数：2.0

论文47

SSE-PT: Sequential Recommendation viaPersonalized Transformer

https://openreview.net/pdf?id=HkeuD34KPH

推荐说明：使用深度学习的方法构建推荐系统是一个正在探索的领域，现在流行的方法是用RNN、CNN加Attention或Transformer模型，比如SASRec模型。

但是这些模型大都不能有个性化的推荐，要么就是效果不太好。本文把item embedding和user embedding结合起来，并使用SSE正则化方法减缓embedding的过拟合现象。

推荐理由：推荐系统还是要介绍一下的。

推荐指数：2.0

推荐指数1.0论文

论文48

Neural Phrase-to-Phrase MachineTranslation

https://openreview.net/pdf?id=S1gtclSFvr

推荐说明：本文提出一种新的短语到短语的机器翻译方法，使用短语层级的attention，然后用greedy或beam 的方法decode，再结合一个记忆力模块，实现了与Transformer相较的结果。

推荐理由：看个新鲜也是看。

推荐指数：1.0

论文49

Lossless Single Image Super Resolutionfrom Low-Quality JPG Images

https://openreview.net/pdf?id=r1l0VCNKwB

推荐说明：各种不可描述的图片往往会被各种压缩，给广大宅男同志带来很多困扰，要是能得到（无码[划掉]）高清图该多好啊！本文对JPG图像进行分辨率修复，算法简单，有没有效不知道。

推荐理由：我选择无损图像。

推荐指数：1.0

推荐指数0.5论文

论文50

Emergence of Functional and StructuralProperties of the Head Direction System by Optimization of RNN

https://openreview.net/pdf?id=HklSeREtPB

推荐说明：这篇什么意思，求懂的同学讲解一下……

推荐理由：？

推荐指数：0.5

星标我，每天多一点智慧

你可能感兴趣的:(自然语言分析)

LeetCode 21. 合并两个有序链表链表合并 Java实现 Lentr0py LeetCode 算法题 leetcode 链表 java 算法数据结构
21.合并两个有序链表21.合并两个有序链表题目来源题目分析题目难度题目标签题目限制解题思路思路：核心算法步骤迭代法代码实现代码解读性能分析复杂度结果测试用例扩展讨论优化写法其他实现总结21.合并两个有序链表题目来源21.合并两个有序链表题目分析将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。题目难度难度：简单题目标签标签：链表题目限制两个链表的节点数目
周报管理系统大霸王龙行业+领域+业务场景=定制 python microsoft ascii 文本处理
代码仓库产品名称：智汇周报管理系统主要功能：自动化报告生成：智汇周报管理系统能够自动收集项目进展、任务完成情况、团队成员工作日志等关键数据，基于预设模板或用户自定义模板，一键生成周报。支持多格式导出（如Word、PDF、Excel），满足不同场景下的报告需求。智能数据分析与可视化：系统内置强大的数据分析引擎，能够自动对收集到的数据进行统计分析，如任务完成率、进度延误情况、成员工作负荷等，并通过图表
GPT-4、GPT-4O 和 GPT-4O-mini 的区别与联系 surfirst LLM ai 语言模型 chatgpt
简介近年来，人工智能技术飞速发展，特别是在自然语言处理领域。GPT-4是OpenAI推出的新一代大模型，而GPT-4O和GPT-4O-mini是其优化版本，专门为不同应用场景和计算资源需求进行调整。在这篇文章中，我们将详细比较GPT-4、GPT-4O和GPT-4O-mini的区别与联系，帮助开发者更好地选择适合的模型。GPT-4是OpenAI发布的第四代通用预训练模型，具备强大的生成和理解能力，适
如何获取股票行情数据接口？有哪些可靠的途径与方法？财云量化 python炒股自动化量化交易程序化交易股票行情数据接口可靠途径官方渠道股票量化接口股票API接口
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
怎么利用商品详情 API 接口实现数据获取与应用？前端后端运维数据挖掘api
在电商蓬勃发展的时代，数据成为了驱动业务增长的关键要素。对于电商从业者、开发者以及数据分析爱好者而言，获取商品详情数据并加以有效应用，是实现精准营销、优化用户体验、提升运营效率的重要途径。商品详情API接口就像是一把钥匙，为我们打开了获取海量商品数据的大门。本文将深入探讨如何利用商品详情API接口实现数据的获取与应用，并通过丰富的代码示例，帮助大家更好地理解和实践。一、理解商品详情API接口API
LSP介绍并实现语言服务 lsp编程语言ide
首发于Enaium的个人博客LSP(LanguageServerProtocol)介绍前段时间我为JimmerDTO实现了一个LSP的语言服务，这是我第一次实现LSP，所以在这里我分享一下我实现LSP的经验。首先来看一下效果，图片太多，我就放一部分，更多的可以看jimmer-dto-lspLSP是一种协议，用于在IDE和语言服务器之间通信。IDE通过LSP请求语言服务器提供代码分析服务，语言服务器
Swift 周报第二十八期 Swift社区 Apple周刊 swift 开发语言 ios
文章目录前言新闻和社区外媒：iPhone的平均售价直逼1000美元创历史新高分析师：iPhone需求良好，苹果股价还能涨22%准备好迎接即将在5月9日推出的增强全球定价机制提案通过的提案正在审查的提案Swift论坛推荐博文话题讨论关于我们前言本期是Swift编辑组自主整理周报的第十九期，每个模块已初步成型。各位读者如果有好的提议，欢迎在文末留言。欢迎投稿或推荐内容。目前计划每两周周一发布，欢迎志同
Session+Redis，Token+Redis，JWT+Redis，用户身份认证，到底选择哪种更合适？简学云资源平台 Java技术 #Redis redis java
1三中方案的比较在选择Session+Redis、Token+Redis、JWT+Redis这三种用户身份认证方案时，我们需要考虑各自的优势、劣势以及应用场景。以下是对这三种方案的详细分析和比较：1.Session+Redis优势：Session登录是一种在Web应用程序中用于跟踪用户状态的机制，通过在服务器端存储会话信息，可以确保用户只需一次登录，并在整个会话期间保持登录状态。使用Redis作为
【2024校招总结帖】数据分析、面试经验、心得体会分享 huaxinjiayou java
首航新能源，一进来就开始大批裁员工作节奏比较快，公司对员工的加班要求也比较严格，而且没有加班费，缺乏福利待遇。另外，公司裁员频繁，而阿里国际一面面经吹爆阿里国际面试官，比某些自以为是的面试官好太多了，面试还不开摄像头。写题的时候，我问他要开摄像头吗鼠人传（第五十二集，2024/4/30）刷题：补昨天的C、MinimizingtheSum，定义dp[i][j]为长度i，使用最多j次可2024西山居S
沃尔玛礼品卡绑定分析 2766958292 java node go python php 沃尔玛沃尔玛礼品卡绑定
声明:本文章中所有内容仅供学习交流使用，不用于其他任何目的，抓包内容、敏感网址、数据接口等均已做脱敏处理，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！逆向分析部分代码参考funcdoPostRequest(urlstring,headersmap[string]string,body[]byte)(*http.Response,error){req,err:=http.NewR
python爬取自如网房源信息 2401_87368790 python 开发语言
本次爬取自如网房源信息所用到的知识点:requestsget请求lxml解析htmlXpathMongoDB存储正文分析目标站点url:http://hz.ziroom.com/z/nl/z3.html?p=2的p参数控制分页get请求获取单页源码--coding:utf-8--importrequestsimporttimefromrequests.exceptionsimportRequest
java.sql.Date 弃用分析与替代方案蓝田～ java microsoft
引言java.sql.Date是Java标准库中的一个类，它继承自java.util.Date，主要用于在Java应用程序与数据库之间进行日期数据的传输。然而，随着Java语言的发展，java.sql.Date以及其父类java.util.Date逐渐被认为存在设计缺陷，并被新的日期时间API所替代。本文将对java.sql.Date的启用原因进行分析，并探讨其弃用原因及替代方案。启用原因分析SQ
npm:升级自身时报错:EBADENGINE 落日弥漫的橘_ Node.js npm 前端 node.js
具体报错信息如下：1.原因分析npm和当前的node版本不兼容。//当前实际版本:Actual:{"npm":"10.2.4","node":"v20.11.0"}可以通过官网文档查看与自己node版本兼容的是哪一版本的npm，相对应进行更新即可：Node.js—Node.js版本2.解决方法升级一下node版本。//需要node的版本号为^20.17.0以上，Required:{"node":"
【黑龙江乡镇界】面图层arcgis数据shp格式乡镇名称和编码wgs84无偏移内容测评鸿业远图科技 arcgis
本文将详细讲解与“最新黑龙江乡镇界面图层arcgis数据shp格式乡镇名称和编码wgs84无偏移”相关的知识点，包括GIS基础、ArcGIS软件、SHP文件格式、WGS84坐标系统以及乡镇行政数据的重要性。GIS基础GIS（GeographicInformationSystem，地理信息系统）是一种用于采集、存储、管理、分析和展示所有类型地理数据的系统。它整合了地图、数据库、统计分析和计算机图形等
ROS学习（5）可视化和调试工具一敲代码的雪糕 ROS ROS
文章目录前言一、调试ROS节点1、使用gdb调试器调试节点2、在节点启动时调用gdb调试器3、在节点启动时调用valgrind分析节点4、设置ROS节点core文件存储二、日志消息1.输出日志消息2.调试消息级别3.为特定节点配置调试消息级别4.消息命名5.按条件显示消息与过滤消息6.显示消息的方式7.使用rqt_console和rqt_logger_level在运行时修改调试级别总结前言ROS自
【Kafka：概念、架构与应用】三日看尽长安花系统架构师 kafka 架构分布式
Kafka：概念、架构与应用目录什么是KafkaKafka的核心概念2.1生产者（Producer）2.2消费者（Consumer）2.3主题（Topic）2.4分区（Partition）2.5消息偏移量（Offset）2.6消费组（ConsumerGroup）Kafka的架构设计3.1Broker与集群3.2Zookeeper的作用Kafka的工作流程Kafka的应用场景Kafka的优缺点分析<
AI-知识库搭建（一）腾讯云向量数据库使用 CJ点人工智能 GPT 向量数据库知识库
一、AI知识库将已知的问答知识，问题和答案转变成向量存储在向量数据库，在查找答案时，输入问题，将问题向量化，匹配向量库的问题，将向量相似度最高的问题筛选出来，将答案提交。二、腾讯云向量数据库向量数据库_大模型知识库_向量数据存储_向量数据检索-腾讯云腾讯云向量数据库（TencentCloudVectorDB）是一款全托管的自研企业级分布式数据库服务，专用于存储、检索、分析多维向量数据。该数据库支持
PyQt6医疗多模态大语言模型（MLLM）实用系统框架构建初探（下.代码部分） Allen_LVyingbo 医疗高效编程研发 python 健康医疗 python pyqt 语言模型人工智能
医疗MLLM框架编程实现本医疗MLLM框架结合Python与PyQt6构建，旨在实现多模态医疗数据融合分析并提供可视化界面。下面从数据预处理、模型构建与训练、可视化界面开发、模型-界面通信与部署这几个关键部分详细介绍编程实现。6.1数据预处理在医疗MLLM框架中，多模态数据的预处理是非常关键的一步，它直接影响到后续模型的训练效果和性能。我们需要对医学影像、文本数据和音频数据分别进行预处理，以确保数
计算机视觉：卷积核每天五分钟玩转人工智能计算机视觉计算机视觉深度学习人工智能机器学习卷积神经网络
本文重点卷积神经网络（ConvolutionalNeuralNetwork，CNN）是一种深度学习模型，广泛应用于图像识别、自然语言处理、语音识别等领域。在卷积神经网络中，卷积核是网络的核心组件之一。通过不断堆叠卷积层和池化层，可以逐渐提取出更高级别的特征，从而实现更复杂的任务。卷积神经网络中的卷积核可以通过反向传播算法进行训练和优化，使其能够自适应地学习输入数据中的特征。因此，卷积神经网络在图像
【Python】红旗超市线下缴电费用户数据分析及可视化（pandas+pyecharts）风度78 百度人工智能 python 机器学习数据分析
场景分析：一部分用户习惯在红旗超市线下进行缴电费，电力公司希望了解哪些用户喜欢到线下缴费，具体分布在哪里，才能有针对性地宣传掌上电力app引导用户体验更高效的线上缴费方式，提升用户满意度。需求分析：首先要拿到红旗超市线下缴费清单数据，对所有数据进行隐私化处理，数据预览如图所示：可以看出台区名称为本项目的核心字段，通过台区匹配到经纬度信息，然后利用经纬度信息进行线下缴费热力图展示。同时可以提供分析报
【SpringBoot 框架】- SpringBoot 配置文件 2401_84408404 程序员 spring boot java spring
【SpringBoot框架】-入门——环境搭建、工程热部署、idea快捷创建SpringBoot项目【SpringBoot框架】-SpringBoot原理分析【SpringBoot框架】-SpringBoot配置文件【SpringBoot框架】-SpringBoot整合Mybatis、Junit、Redis目录一、SpringBoot配置文件类型1.application.properties配置
【postgresql初级使用】在表的多个频繁使用列上创建一个索引，多条件查询优化，多场景案例揭示索引失效韩楚风 postgresql 数据库 sql database
多列索引专栏内容：postgresql使用入门基础手写数据库toadb并发编程个人主页：我的主页管理社区：开源数据库座右铭：天行健，君子以自强不息；地势坤，君子以厚德载物.文章目录多列索引概述多列索引创建创建语法创建说明案例分析创建数据创建索引带首列查询不带首列查询总结结尾概述
ECharts：数据可视化的魔法师，偶尔也会“皮”一下 Python私教 Web 使用Vue3进行前端开发 Vue 信息可视化 echarts 前端
在数据爆炸的时代，如何从海量数据中提取有价值的信息，并将其清晰易懂地呈现出来，成为了各行各业面临的共同挑战。数据可视化作为一种有效的信息传递手段，应运而生，并逐渐成为数据分析领域不可或缺的一部分。而在众多数据可视化工具中，ECharts凭借其强大的功能、灵活的配置和丰富的图表类型，脱颖而出，成为了众多开发者的首选利器。一、ECharts：数据可视化的利器ECharts是一个由百度开源的可视化图表库
如何应对访问国外服务器缓慢的问题？SDWAN组网是性价比之选蓝讯小刘服务器运维
在全球化日益加深的今天，企业经常需要访问国外的服务器以进行远程办公、跨国业务处理、数据传输和视频会议等。然而，不少企业在使用中遇到了访问速度缓慢的问题。本文将介绍几种有效的解决方案，帮助提高访问效率。首先，我们来分析一下访问缓慢的原因：1.政策限制：为了维护国家网络的安全与稳定，我国对部分国外网站和服务器有一定的访问限制。2.技术障碍：国内与国际互联网的网络架构和协议存在差异，这可能导致数据传输不
企业如何安全合规地访问海外网站蓝讯小刘安全
国际专线、SD-WAN线路与VPN的利弊与风险在全球化背景下，中国的外贸企业以及海外公司分支机构、科研研发机构等，都需要频繁访问海外网站以开展正常业务。然而，企业访问海外网站的技术方式存在一定的合规风险。本文将概述三种访问海外网站的技术方式：国际专线、SD-WAN线路和VPN，并分析其利弊与风险。1.国际专线：这是一种合法合规的访问海外网站的方式，由国内三大通讯运营商授权或授权代理机构开通。虽然费
ESP32-C3入门教程环境篇③——VS Code IDE快速入门小康师兄 ESP32-C3入门教程 VS Code ESP32-C3 ESP32 嵌入式物联网
文章目录一、安装VisualStudioCode二、安装扩展三、配置ESP-IDF插件四、创建工程五、配置工程5.1选择目标芯片5.2项目配置方法一方法二六、编译工程6.1方法一6.2方法二七、固件分析八、固件下载8.1方法一8.2方法二8.3方法三九、串口日志9.1方法一9.2方法二十、遇到问题及解决10.1restartVisualStudioCodeandrunthiswizardagain
NVIDIA L40s、A10、A40、A100、A6000横评，哪个GPU 更适合 AI 推理任务？ DO_Community 技术科普商业建议人工智能 gpu算力 DigitalOcean ai AIGC
近年来，随着人工智能技术的发展，特别是深度学习模型的广泛应用，GPU（图形处理单元）作为加速计算的重要硬件，在AI领域扮演着越来越重要的角色。AI推理是指已经训练好的模型对新数据进行预测的过程。与训练阶段相比，推理通常对GPU的要求有所不同，更注重于能效比、延迟以及并发处理能力。本文将从这些角度出发，对比分析NVIDIA的L40s、A10、A40、A100、A6000五款GPU在AI推理任务中的表
浏览器指纹伪装的方式 ClonBrowser 指纹浏览器指纹浏览器伪装安全指纹识别
浏览器指纹是什么，如何追踪到我们的信息，如何才能将浏览器指纹伪装起来？什么是浏览器指纹浏览器既给我们带来便利也让我们的喜好信息展露了出来，浏览器指纹可以帮助运营商识别到用户的身份信息，从而分析出用户的喜好，进而推荐相关的广告，以便帮助用户更精准的找到所需信息浏览器指纹伪装的方式浏览器指纹获取的参数有：时区、UA、屏幕信息、系统相关设置、浏览器安装插件等等获取的方式虽然很多，但是只要限制浏览器指纹所
【趋势】《2024—2026金融科技十大趋势预测》一览学客汇商业研究商业观察人工智能大数据金融科技科技洞察 IT趋势金融行业预测
本白皮书基于新华三在金融行业的前沿实践和IDC的全球研究成果，深入分析了金融科技领域的十大关键趋势，旨在为金融机构提供前瞻性的战略指导和业务创新的参考。导言当前，在地缘政治冲突加剧、商业经济市场环境高度不确定、数字化业务加速发展的背景下，金融行业处于深度变革的潮流中，金融机构亟需重新思考其在技术支出、业务决策及业务创新发展等方面的投资重点。此外，金融机构也越来越需要借助大数据和AI技术来提升业务的
航空客户价值的数据挖掘与分析（numpy+pandas+matplotlib+scikit-learn） Want595 Python数据分析数据挖掘 numpy pandas
文章目录航空客户价值的数据挖掘与分析（numpy+pandas+matplotlib+scikit-learn）写在前面背景与挖掘目标1.1需求背景1.2挖掘目标1.3项目概述项目分析方法规划2.1RFM模型2.2LRFMC模型指标2.3分析总体流程图数据抽取探索及预处理3.1数据抽取3.2数据探索分析3.3数据预处理3.3.1数据清洗3.3.2属性规约3.3.3数据变换数据建模&应用4.1模型构
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后