zenRRan

EMNLP'21中预训练模型最新研究进展

每天给你送来NLP技术干货！

机构｜中国人民大学信息学院

研究方向｜序列表示学习与应用

来自 | RUC AI Box

导读

EMNLP 2021是人工智能领域自然语言处理（ Natural Language Processing，NLP）三大顶级会议之一，有着广泛的影响力。本年度会议计划于11月7日-11月11日，在线上和线下（多米尼克共和国Punta Cana）同时举行。官方在会议网站上发布了论文接收列表：https://2021.emnlp.org/papers

本文从main conference选择了98篇可以公开检索到的预训练技术相关文章，并按照预训练模型与知识、预训练相关技术、多语多模态预训练模型、预训练模型的性质与评估、预训练模型的应用、预训练模型的微调等进行分类整理，并为每篇论文提供了一两句话作为导读，以供参考。

预训练模型与知识

Editing Factual Knowledge in Language Models

本文提出了一种知识编辑器，它可以用来编辑事实知识，从而修正“错误”或意外的预测，而不需要昂贵的再培训或微调。其训练一个具有约束优化的超网络，在不影响其他知识的情况下修改一个事实;然后用训练后的超网络预测测试时的权值更新。

Relational World Knowledge Representation in Contextual Language Models: A Review

这是一篇综述，其中概述了语言模型如何在训练前和微调过程中获得相关世界知识。文中提出了一种新的分类法，根据提供给语言模型的知识库监督级别对知识表示方法进行分类，从没有明确的监督到实体和关系级别的监督。

Knowledge Base Completion Meets Transfer Learning

本文引入了一个用于在不同KBC模型之间迁移知识的方法，这些不同的KBC模型可以是基于开放的或者规范的知识图谱，而不需要实体和关系的匹配。

Knowledge-Aware Graph-Enhanced GPT-2 for Dialogue State Tracking

本文提出了一个新的混合结构，利用图注意网络的表示增强GPT2，以允许对槽值进行因果，序列预测。

NegatER: Unsupervised Discovery of Negatives in Commonsense Knowledge Bases

本文提出了NegatER，其使用语言模型对常识知识库中的潜在否定进行排序，其只依赖于LM中的积极知识，而不需要真实的否定例子

预训练相关技术

What to Pre-Train on? Efficient Intermediate Task Selection

本文对快速迁移学习中的各种有益任务的方法进行了综合比较。重点关注参数和计算效率适配器设置，突出显示不同的数据可用性场景，并为每种方法提供费用估算。结果表明，有效的基于嵌入的方法，只依赖于各自的数据集，优于计算昂贵的小样本微调方法。

Less is More: Pretrain a Strong Siamese Encoder for Dense Text Retrieval Using a Weak Decoder

本文提出使用一个较弱的解码器从而学习一个更强的编码器，该方法得到的编码器可以用于增强稠密检索任务。

CTAL: Pre-training Cross-modal Transformer for Audio-and-Language Representations

提出了一种新的预训练的通用表示CTAL以解决语音和语音任务，其在大规模的语音-语言对数据集上通过两个预训练任务对其进行表示学习。

Low-Resource Dialogue Summarization with Domain-Agnostic Multi-Source Pretraining

本文提出了一个领域不可知的低资源对话摘要的多源预训练范式，该范式利用多个不同来源的外部大规模语料库来促进对话建模、摘要语言建模和抽象摘要。除去传统的预训练任务，其还采用对抗信号来学习领域未知信息。

LayoutReader: Pre-training of Text and Layout for Reading Order Detection

我们提出了一个用于读取顺序检测的基准数据集ReadingBank，，包含500,000个文档和图像。此外还提出了一种新的基于预训练的阅读顺序检测方法LayoutReader。其显著优于从左到右、从上到下的启发式算法以及一些较强的基线。且可以很容易地适应任何OCR引擎，从而可以改善下游任务的读取顺序。

DILBERT: Customized Pre-Training for Domain Adaptation with Category Shift, with an Application to Aspect Extraction

本文提出了DILBERT，一种针对类别转移的无监督领域适应的预训练方法，并将其应用到方面抽取任务中。其通过对BERT预训练任务进行修改，可以更好地适应新的领域和方面类别。

BARThez: a Skilled Pretrained French Sequence-to-Sequence Model

本文提出了第一个基于法语的大规模预训练序列到序列语言模型，并提出了一个用于法语摘要生成的数据集。

Improving Sequence-to-Sequence Pre-training via Sequence Span Rewriting

本文提出sequence span rewriting，先生成mask span部分的内容，再重写恢复原句，相比text infilling可以引入更多样和细粒度的监督信号。

ARMAN: Pre-training with Semantically Selecting and Reordering of Sentences for Persian Abstractive Summarization

提出了ARMAN，一个基于Transformer的编码解码模型，并设计了三个预训练目标。ARMAN根据修改后的语义评分，从文档中选择突出的句子进行掩蔽，形成伪摘要。

When Attention Meets Fast Recurrence: Training Language Models with Reduced Compute

我们提出了SRU++，一个高效的架构，结合了快速的递归和对序列建模的关注。其同时具有很强的建模能力和训练效率

ReasonBERT: Pre-trained to Reason with Distant Supervision

提出了一种预训练模型ReasonBERT，它增强了语言模型在长期关系和多重(可能是混合的)上下文上进行推理的能力。

Condenser: a Pre-training Architecture for Dense Retrieval

然而，在本文中，我们发现，典型的预训练LM没有一个为双编码器准备好的内部注意力结构。它们不能有效地将信息压缩成单一的稠密向量表示。我们提出了一个新的架构，冷凝器，它在预训练时建立了特定结构。

多语多模态预训练模型

UNKs Everywhere: Adapting Multilingual Language Models to New Scripts

本文系统地评估了语言模型基于已知和未知语料来适应到未知语言的策略。其评估了存储在原始嵌入矩阵中的信息的重要性，提出利用词汇重叠标记的方法来提取潜在的语义概念，并在其基础上提出了一种将嵌入矩阵编码为低维嵌入和上投影的新方法。

Improving Multimodal Fusion with Hierarchical Mutual Information Maximization for Multimodal Sentiment Analysis

本文提出了分层互信息最大化(MI)的多模态融合算法MMIM，该模型对单模态输入和融合阶段分别采用两个MI下界。且针对这些下界中某些项的难解性，专门设计了精确、快速、稳健的估计方法。

Vision Guided Generative Pre-trained Language Models for Multimodal Abstractive Summarization

本文提出了一种简单而有效的方法来构建用于多模态摘要生成任务的视觉引导的生成式语言模型，其使用基于注意力的附加层来整合视觉信息，同时保持其原始文本生成能力。

Allocating Large Vocabulary Capacity for Cross-Lingual Language Model Pre-Training

本文研究词汇量大的预训练跨语言模型。首先提出了在跨语言模型中构建大规模多语言词汇的方法，再进行定量分析。此外，本文还提出了基于KNN的目标采样，通过逼近softmax函数来加速预训练时大规模多语言词汇的分配。

Zero-Shot Cross-Lingual Transfer of Neural Machine Translation with Multilingual Pretrained Encoders

本文研究零样本跨语言NMT迁移任务，并提出SixT来实现NMT的零样本跨语迁移，且充分利用标记数据，增强其迁移能力。

ERNIE-M: Enhanced Multilingual Representation by Aligning Cross-lingual Semantics with Monolingual Corpora

本文提出了ERNIE-M，鼓励模型用单语语料库对齐多语言的表示，以克服并行语料库大小对模型性能的限制。其将反向翻译整合到预训练过程中，并在单语语料库上生成伪平行句对，以实现不同语言之间语义对齐的学习，从而增强跨语言模型的语义建模。

mT6: Multilingual Pretrained Text-to-Text Transformer with Translation Pairs

本文改进了带有翻译对的多语种文本到文本转换转换器(MT6)，以解决三种跨语言的文本到文本训练前任务，且该模型还采用了一个部分非自回归目标的文本到文本的前训练。

Vision-and-Language or Vision-for-Language? On Cross-Modal Influence in Multimodal Transformers

我们提出了一种基于跨模态输入消融的诊断方法，以评估这些模型实际集成跨模态信息的程度。该方法涉及到从一个模态的输入，完全或选择性地基于跨模态进行对齐，并评估模型在其他模态上的预测性能。

BERT, mBERT, or BiBERT? A Study on Contextualized Embeddings for Neural Machine Translation

证明了简单地使用定制的、合适的双语预训练语言模型(BIBERT)的输出(上下文嵌入)作为NMT编码器的输入，就可以实现最先进的翻译性能。此外还提出了一种随机层选择方法和双向翻译模型，以确保充分利用上下文嵌入

Cross-lingual Intermediate Fine-tuning improves Dialogue State Tracking

通过预训练的多语言模型的中间微调来增强迁移学习过程，其中多语言模型是根据不同但相关的数据和/或任务进行微调的。其使用平行和对话的电影字幕数据集设计适合下游对话任务的跨语言中间任务。

Role of Language Relatedness in Multilingual Fine-tuning of Language Models: A Case Study in Indo-Aryan Languages

我们发现，多语言微调有效地利用了语言相关性，从而改善了单语言方法。我们用五种语言模型的实验证实了印度-雅利安语系的这一说法。多语言微调对于资源匮乏的语言尤其有效(例如，奥里亚语和旁遮普语在相对规模上提高了150%)。

预训练模型的性质与评估

Extract, Denoise and Enforce: Evaluating and Improving Concept Preservation for Text-to-Text Generation

本文检验了当前的文本到文本生成的预训练语言模型能否在没有明确指导的情况下保留源输入中的重要概念。我们提出了一个简单而有效的自动约束提取、去噪和强制执行框架，来添加重要的输入概念作为词汇约束时以帮助指导文本到文本生成。

How much pretraining data do language models need to learn syntax?

本文基于RoBERTa原始文本数据，研究不同数据增量的情况下，训练数据大小对模型句法能力的影响。

Discretized Integrated Gradients for Explaining Language Models

本文提出了离散集成梯度方法（DIG），允许沿着非线性插值路径进行有效归因。并为离散词嵌入空间设计了两种插值策略，使产生的插值点接近嵌入空间中的实际词，产生更可信的梯度计算。

Backdoor Attacks on Pre-trained Models by Layerwise Weight Poisoning

这篇文章重点讨论了预训练模型的一个潜在威胁:权重中毒(后门)。其探索了以前的方法的局限性，并引入了一种分层参数中毒训练策略和一种组合触发设置来解决相应的局限性。

Masked Language Modeling and the Distributional Hypothesis: Order Word Matters Pre-training for Little

本文讨论了一个假设，即掩码语言模型的优秀性能可以部分地解释为它学习经典NLP pipeline的能力。其发现绝大多数MLM的成功不是由于它对句法和语义机制等传统NLP知识的习得

Incorporating Residual and Normalization Layers into Analysis of Masked Language Models

本文从整个注意块中的多头注意力、残差连接和层标准化的角度对Transformer进行分析。

What Changes Can Large-scale Language Models Bring? Intensive Study on HyperCLOVA: Billions-scale Korean Generative Pretrained Transformers

超大规模的韩语预训练语料HyperCLOVA。

Stepmothers are mean and academics are pretentious: What do pretrained language models learn about you?

提出了第一个包含一系列社会群体典型属性的数据集。其提供的数据获取技术使能够在未来廉价地检索类似的数据集，从而实现对刻板印象随时间变化的比较分析

Transformer Feed-Forward Layers Are Key-Value Memories

本文提出transformer结构里的FFN模拟了键-值存储的角色，键与可解释的输入模式相关，值引导对应键所代表的模式的下一个词的预测分布，最终模型的输出是通过这些分布的加权聚合形成的。

What's in Your Head? Emergent Behaviour in Multi-Task Transformer Models

本文发现在预训练语言模型上训练多个任务对应的头时，会产生一种转向效应，目标头部会影响另一个头部的行为，引导它达到超出其训练目标的能力。

RuleBERT: Teaching Soft Rules to Pre-Trained Language Models

研究了预训练模型是否可以用软规则进行推理，其尝试了一种概率答案集编程(LPMLN)，其可以与其他的语义方法一起使用。

Disentangling Representations of Text by Masking Transformers

提出了学习解离表示的新视角，试图揭示预训练的Transformer(如BERT)中产生文本解离表示的现有子网络。通过掩码方法来估计二元掩码后权值或BERT中的隐藏状态，而不改变所有其他参数

Putting Words in BERT's Mouth: Navigating Contextualized Vector Spaces with Pseudowords

提出了一种新颖的方法和数据集，使用允许输入空间连续性的遍历技术，用于研究BERTspace的几何结构。其证明了在bert空间中有大量的规律性，各个区域对应于不同的意义。且在空间区域中也发现了不符合任何可理解意义的“空洞”。

Sorting through the noise: Testing robustness of information processing in pre-trained language models

本文检验了模型在分心内容面前部署相关上下文信息的能力，提出了需要使用关键上下文信息的完形填空模型，并引入分心内容来测试模型如何稳健性地保留和使用关键信息进行预测。

Mitigating Language-Dependent Ethnic Bias in BERT

分析和减轻英语、德语、西班牙语、朝鲜语、土耳其语和汉语单语BERT中的民族偏见，研究了民族偏见及其在不同语言中的变化。为了观察和量化种族偏见，开发了一种新的度量标准，称为分类偏见评分。然后提出了两种缓解方法;首先使用多语言模型，然后使用两种单语言模型的上下文词对齐

You should evaluate your language model on marginal likelihood over tokenisations

本文认为，语言模型应该评估它们的边际似然token化。比较了基于抽样的边际似然估计的不同估计量，证明了在可管理的样本数量下估计边际似然是可行的。

All Bark and No Bite: Rogue Dimensions in Transformer Language Models Obscure Representational Quality

本文发现一小部分不正常的维度(通常只有1-3个)主导了预训练模型的度量。此外发现了主导相似性度量的维度和那些对模型行为重要的维度之间存在显著的不匹配。

Exploring the Role of BERT Token Representations to Explain Sentence Probing Results

对BERT的表示空间进行了深入的分析，发现BERT倾向于在特定的token表示中编码有意义的知识，且可以检测语法和语义异常，区分语法上的数字和时态子空间

Gradient-based Adversarial Attacks against Text Transformers

提出了一种针对Transformer的通用基于梯度的攻击模型，其寻找由连续值矩阵参数化的对抗性例子的分布，从而实现基于梯度的优化

Do Long-Range Language Models Actually Use Long-Range Context?

基于PG-19数据集，对两个Long-Transformer语言模型上的token和序列级别改进的影响进行了细粒度分析。研究结果表明，这些模型很少利用长的上下文，它们大多仅仅以表面的方式使用该部分特征。

Pre-train or Annotate? Domain Adaptation with a Constrained Budget

在本文讨论了一些与NLP模型适应新领域的成本相关的问题，该问题可以被定义为消费者选择问题

The Stem Cell Hypothesis: Dilemma behind Multi-Task Learning with Transformer Encoders

本研究通过突出具有天赋的注意力头来分析对5个核心任务的干扰，这些注意力头的重要性在许多下游任务中是不变的。遵循干细胞假说：这些注意力头就像干细胞一样，可以成为专家，但不能成为全才。

Controlled Evaluation of Grammatical Knowledge in Mandarin Chinese Language Models

本研究评估了六种汉语语法关系模型，包括句法依赖关系和语义相容关系。其使用普通话作为案例研究，分析显式语法建模(由rnng和plm执行)的潜在优势如何从英语推广到一种不同类型的语言。

预训练模型的应用

DialogueCSE: Dialogue-based Contrastive Learning of Sentence Embeddings

本文提出基于对话的对比学习从多轮对话中学习句子表示，并为三个对话数据集构建了基于对话的句子嵌入评价基准。

ConvFiT: Conversational Fine-Tuning of Pretrained Language Models

本文提出一个两阶段对话微调方法，通过双重编码器结构将预训练语言模型转换为通用的（第一阶段后）和任务特定的（第二阶段后）对话句子编码器。

Dialogue State Tracking with a Language Model using Schema-Driven Prompting

本文提出自然语言增强的基于prompt的对话状态追踪（DST）模型，将该任务转换为从LM中prompt知识，模型能够从知识丰富的序列到序列模型（T5）中受益。

Learning to Selectively Learn for Weakly-supervised Paraphrase Generation

针对弱监督语义转写生成任务，本文通过基于检索的方式获得大量弱标记平行句;再建立元学习框架，逐步选择有价值的样本，在句子释义任务中精细调整预训练的语言模型

Text Detoxification using Large Pre-trained Neural Models

本文提出两种为恶毒文本量身定制的风格转移模型，将其转换成无毒文本。它们都结合了高质量的预训练语言模型和额外的风格指导模型。ParaGeDi受有风格限定的GPT-2模型指导进行风格转换。CondBERT模型基于BERT但是不需要任何微调，其风格控制通过预训练的毒性分类器来实现。

Memory and Knowledge Augmented Language Models for Inferring Salience in Long-Form Stories

本文采用巴尔特基数函数和惊奇理论衍生的无监督事件重要性检测方法，并将其应用于较长的叙事文献。其改进了标准的Transformer语言模型，加入了一个外部知识库(源自于检索增广得到)，并添加了记忆机制以提高对长文章的效果。同时还利用来自Shmoop经典文学作品语料库的章节对齐摘要来获得标注数据。

SimCSE: Simple Contrastive Learning of Sentence Embeddings

采用Dropout机制进行数据增广来进行对比学习，从而得到更好的句子表示用于各种句子级任务

Structural Adapters in Pretrained Language Models for AMR-to-Text Generation

提出了一种新的适配器结构STRUCTADAPT，其可以将图结构显式地被预训练语言模型来建模，且实验表明它在两个AMR-to-text基准测试中取得了最好的结果，但是训练的参数少得多。

Universal Sentence Representation Learning with Conditional Masked Language Model

提出了一种新的句子表示学习方法——条件掩码语言模型CMLM。该模型通过对相邻句子的编码向量进行约束，将句子表示学习融入到MLM训练中。

LM-Critic: Language Models for Unsupervised Grammatical Error Correction

这项工作展示了如何利用预训练的语言模型(LM)来定义一个LM-批评家，如果LM赋予一个句子比它的局部扰动更高的概率，它就会判断一个句子合乎语法。

Distantly-Supervised Named Entity Recognition with Noise-Robust Learning and Language Model Augmented Self-Training

提出一个噪声鲁棒的学习计划，其包括一个新的损失函数和一个噪声标签删除步骤，以训练NER distantly-labeled数据，其利用预训练语言模型并采用情景化的自我训练方法来改善NER模型的泛化能力。

Knowing False Negatives: An Adversarial Training Method for Distantly Supervised Relation Extraction

本文提出一个两阶段的方法。首先启发式地利用深度神经网络的记忆机制找出可能的假负例样本。然后通过对抗性训练将未标记数据与训练数据对齐到统一的特征空间中，并进一步利用伪标签中包含的信息

Fast, Effective, and Self-Supervised: Transforming Masked Language Models into Universal Lexical and Sentence Encoders

本文提出Mirror-BERT，一种简单快速，利用对比学习和自监督，高效地将Masked PLM转换为一个通用词汇和句子的编码器。

PAUSE: Positive and Annealed Unlabeled Sentence Embedding

本文试图弥合监督和非监督句子嵌入技术之间的差异，提出了一种通用的端到端句子嵌入方法PAUSE，其利用标签同时探索未标记句子对。

RocketQAv2: A Joint Training Method for Dense Passage Retrieval and Passage Re-ranking

本文提出了一个检索模型和精排模型的联合训练框架（RocketQAv2），其使用统一的listwise优化模式，让两个模型的相关性信息可以进行传递，从而通过动态的蒸馏过程实现了两个模型的联合训练。其还设计了一种混合数据增广策略，通过对具有多样性和高质量的训练样例进行采样，让listwise训练方式更具有效率。

ReGen: Reinforcement Learning for Text and Knowledge Base Generation using Pretrained Language Models

提出了ReGen，利用强化学习(RL)来提高文本和图的双向生成性能。其采用图线性化使这两个任务可以被重新框架为序列到序列生成问题。

Efficient Nearest Neighbor Language Models

我们探索了几种不同的方法来提高k-最近邻语言模型的效率，在达到可比性能的同时达到6倍的加速

Structure-aware Fine-tuning of Sequence-to-sequence Transformers for Transition-based AMR Parsing

提出了将预训练的Seq2Seq模型与基于transition的方法相结合的AMR抽取方法。该模型将指针网络和抽取结构信息融入了BART架构，在AMR 2.0中取得了SATO结果。

Cross-Attention is All You Need: Adapting Pretrained Transformers for Machine Translation

探索了cross-attention在翻译任务中的作用，分析了仅微调cross-attention可以取得与微调整个模型接近的结果，并进一步尝试了缓解灾难遗忘和零样本学习。

CodeT5: Identifier-aware Unified Pre-trained Encoder-Decoder Models for Code Understanding and Generation

提出了利用T5架构的统一的代码理解、生成的预训练模型；同时利用注释信息进行了自然语言-代码对齐的双模态训练。实验表明该模型在CodeXGLUE取得了SOTA效果。

Parallel Refinements for Lexically Constrained Text Generation with BART

提出了可用于限制文本生成的模型，在BART的基础上，在encoder添加分类器指导decoder哪里需要替换、插入，同时decoder利用encoder的信息并行进行迭代精炼生成。

FewshotQA: A simple framework for few-shot learning of question answering tasks using pre-trained text-to-text models

提出了利用预训练text-to-text模型的小样本QA框架，在微调时对齐了预训练的MLM任务。实验结果表明了该方法大幅提升了小样本QA任务结果。

ECONET: Effective Continual Pretraining of Language Models for Event Temporal Reasoning

提出了一种持续预训练方法，使PTLMs能够具有关于事件时间关系的知识。我们设计了自监督学习目标，以恢复被掩盖的事件和时间指标，并从残缺的对应句(事件或时间指标被替换)中区分句子。

Contrastive Out-of-Distribution Detection for Pretrained Transformers

这项工作为只需要ID数据的预训练的Transformer提出了一个无监督OOD检测框架。系统地研究了对比学习和评分函数的组合，且提出了一种基于边缘的对比目标学习表示对齐，结合马氏距离，在各种任务和数据集上获得了最佳性能。

Constrained Language Models Yield Few-Shot Semantic Parsers

使用语言模型将输入转述为一种类似英语的受控子语言，该子语言可以自动映射到目标意义表示。

Phrase-BERT: Improved Phrase Embeddings from BERT with an Application to Corpus Exploration

提出了一个对比的微调目标，使BERT能够产生更强大的短语嵌入。该方法(Phrase-BERT)依赖于使用一个paraphrase生成模型来自动生成的不同短语的paraphrase。

Pairwise Supervised Contrastive Learning of Sentence Representations

提出了一种基于样例区分的方法PairSupCon，旨在将语义蕴涵和矛盾理解与高级分类概念编码联系起来。

Self-training Improves Pre-training for Few-shot Learning in Task-oriented Dialog Systems

设计了一种自训练方法，利用丰富的未标记对话数据，进一步改进ToD系统的少样本学习场景中最先进的预训练模型。具体来说，其迭代地标记最自信的未标记数据，以训练更强的Student模型。且通过使用掩码语言模型替换非关键符号来进行数据增广，以更好地训练学生

DyLex: Incoporating Dynamic Lexicons into BERT for Sequence Labeling

我们提出了DyLex，一种基于BERT的序列标记任务的插件式词典合并方法。其采用了词语无关的标签嵌入，避免了在更新词汇时对表示进行重新训练。且还采用了一种有效的监督词汇知识去噪方法来平滑匹配噪声。

Different Strokes for Different Folks: Investigating Appropriate Further Pre-training Approaches for Diverse Dialogue Tasks

在进一步预训练阶段，我们通过设计各种不同的任务来改进多任务导向的对话下游任务。实验表明，不同的下游任务偏好不同的进一步预训练任务，这些进一步前训练任务具有内在的相关性，大多数对某些目标任务的改善效果显著.

Learning Implicit Sentiment in Aspect-based Sentiment Analysis with Supervised Contrastive Pre-Training

采用监督对比学习预处理从领域内语言资源中检索的大规模情感标注语料库，其通过将内隐情绪表达与具有相同情绪标签的情绪表达对齐，使得预训练过程可以更好地捕捉评论中的内隐和外显情绪倾向。

预训练模型的微调

Virtual Data Augmentation: A Robust and General Framework for Fine-tuning Pre-trained Models

提出了一种新的简单且通用的微调框架——虚拟数据增广（VDA），其不直接的生成增广数据，而是基于预训练模型的embedding层利用一个混合多项式分布来对相关embedding进行加权求和，进而生成虚拟的embedding。

Finetuning Pretrained Transformers into RNNs

提出了T2R，将预训练的Transformer看作RNN来进行微调，以减少其在自回归生成任务上的时间和内存开销

Raise a Child in Large Language Model: Towards Effective and Generalizable Fine-tuning

微调阶段，在每次梯度更新时仅更新一部分模型参数，但是却在下游任务上有普遍的提升。

GradTS: A Gradient-Based Automatic Auxiliary Task Selection Method Based on Transformer Networks

提出了一种基于预训练Transformer模型的MTL辅助任务自动选择方法GradTS，其基于梯度进行任务选择，且可以同时实现消耗的时间和资源更少。

Knowledge Enhanced Fine-Tuning for Better Handling Unseen Entities in Dialogue Generation

在知识库的帮助下，本文引入了两个辅助训练目标：解释掩码词，和上位词生成，使模型在推理过程中无需外部知识就能产生有知识的响应

The Power of Scale for Parameter-Efficient Prompt Tuning

本文提出prompt tuning，并在大语言模型上展示其与模型微调的竞争力。本文分析了许多设计选择方案，显示其质量和健壮性随规模逐渐提高。且在域转移问题上，显示prompt tuning优于模型微调。并提出prompt ensemble并展示其有效性

On the Influence of Masking Policies in Intermediate Pre-training

本文提出一种方法来自动的发现最能帮助下游任务的中间预训练策略，放在预训练和下游微调之间，提升下游任务性能。

Muppet: Massive Multi-task Representations with Pre-Finetuning

提出了预微调，这是介于语言模型预训练和微调之间的一个额外的大规模学习阶段。预微调是一种大规模的多任务学习(大约50个数据集，总计超过480万个标记示例)，旨在鼓励学习能够更好地泛化许多不同任务的表示

其他学习策略

Exploring Task Difficulty for Few-Shot Relation Extraction

本文介绍了一种基于对比学习的新方法，通过利用关系标签信息来判断任务的难易，进而学习更好的表示。且进一步设计了一种学习方法，允许模型自适应学习如何专注于困难的任务。

Text AutoAugment: Learning Compositional Augmentation Policy for Text Classification

本文提出了一个名为文本自动增强(TAA)的框架，以建立一个组合的可学习的数据增强范式。其将各种增广策略操作相组合，利用高效的贝叶斯优化算法自动搜索最优策略，大大提高了模型的泛化能力

Dynamic Knowledge Distillation for Pre-trained Language Models

本文探讨了一个动态的知识蒸馏，使学生能够根据自己的能力来调整学习过程。其从教师模式、数据选择和数据蒸馏目标适应三个方面探讨了动态调整。

Distilling Linguistic Context for Language Model Compression

本文提出了一个新的语言表征学习的知识蒸馏目标，通过单词关系和层转换关系在表征之间转移知识。

Comparing Text Representations: A Theory-Driven Approach

提出了一种方法来量化数据表示和一组关联标签之间的对齐。验证其假设：数据集的困难在于选择表示和标签之间的对齐函数。

HittER: Hierarchical Transformers for Knowledge Graph Embeddings

提出了HittER，一个Transformer模型来联合学习实体-关系组合和基于源实体邻域的关系上下文。该模型由两个不同的Transformer块组成:底部块提取源实体局部邻域内每个实体-关系对的特征，和顶部块聚合底部块输出的关系信息。

AfroMT: Pretraining Strategies and Reproducible Benchmarks for Translation of 8 African Languages

提出了AFROMT，一种适用于八种广泛使用的非洲语言的标准化、清洁和可复制的机器翻译基准。并开发了一套用于系统诊断的分析工具。此外还开发了两种新的基于数据增强的策略，利用词级别对齐信息和伪单语数据来训练多语言序列-序列模型

Filling the Gaps in Ancient Akkadian Texts: A Masked Language Modelling Approach

提出了一个模型，使用多语言预训练和对阿卡德文本上的微调，实现在阿卡德文本中进行缺失符号补全。我们发现在这样一个低资源的环境中，来自训练前的信号可能比

投稿或交流学习，备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易，还望给个在看！

你可能感兴趣的:(大数据,自然语言处理,算法,编程语言,python)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache