jinniulema

【论文笔记】A Survey on In-context Learning

A Survey on In-context Learning

论文题目：A Survey on In-context Learning

论文地址：[2301.00234] A Survey on In-context Learning (arxiv.org)

版本: [v3] Thu, 1 Jun 2023 12:23:40 UTC (6,761 KB)

参考文献列表: dqxiu/ICL_PaperList: Paper List for In-context Learning (github.com)

二作解读:A Survey on In-Context Learning 论文解读_哔哩哔哩_bilibili

二作解读ppt:In-Context Learning Survey Sharing-Lei-2300313.pdf - Google 云端硬盘

笔记参考：In-Context Learning玩法大全 (qq.com)

文章目录

A Survey on In-context Learning
- Abstract
- 1、Introduction
- 2、Overview
- 3、Definition and Formulation
- - definition
  - formulation
- 4、Model Warmup
- - 4.1 Supervised In-context Training
  - 4.2 Self-supervised In-context Training
  - Takeaway
- 5、Demonstration Designing
- - 5.1 Demonstration Organization
  - - 5.1.1 Demonstration Selection
    - - Unsupervised Method
      - Supervised Method
    - 5.1.2 Demonstration Ordering
  - 5.2 Demonstration Formatting
  - - 5.2.1 Instruction Formatting
    - 5.2.2 Reasoning Steps Formatting
  - Takeaway
- 6、Scoring Function
- - Takeaway
- 7、Analysis
- - 7.1 What influences ICL performance
  - - 7.1.1 Pre-training stage
    - 7.1.2 Inference stage
  - 7.2 Understanding Why ICL works
  - Takeaway
- 8、Evaluation and Resources
- - 8.1 Traditional Tasks
  - 8.2 New Challenging Tasks
  - 8.3 Open-source Tools
  - Takeaway
- 9、In-Context Learning Beyond Text
- - Takeaway
- 10、Application
- - Data engineering
  - Model Augmentating
  - Knowledge Updating
- 11、Challenges and Future Directions
- - 11.1 New Pretraining Strategies
  - 11.2 ICL Ability Distillation
  - 11.3 ICL Robustness
  - 11.4 ICL Efficiency and Scalability
- 12、Conclusion
- References

Abstract

随着大模型能力的增强，上下文学习（In-context learning, ICL）已成为自然语言处理的新范式，其中LLM仅仅基于添加了几个示例的上下文进行预测。探索ICL来评估和推断LLM的能力已经成为一种新的趋势。

本文旨在调查和总结ICL的进展和挑战。

首先给出了ICL 的正式定义，并阐明了它和相关研究的相关性。

然后，组织并讨论了先进的技术，包括训练策略，演示设计策略以及相关分析。

最后，讨论了ICL面临的挑战，并为进一步研究提供了潜在的方向。

希望我们的工作能够鼓励更多的研究来揭示ICL的工作原理并改进ICL。

1、Introduction

随着模型大小和语料大小的扩大，大模型展现了ICL的能力，即 从上下文的少量例子中学习。

LLMs可以通过ICL执行一系列复杂的任务，如解决数学推理问题。

ICL的核心思想就是 从类比中学习。

图1:上下文学习的说明。ICL需要一个演示上下文，其中包含一些用自然语言模板编写的示例。将演示和查询作为输入，大型语言模型负责进行预测。

图一给出了一个图示，描述了LLM怎样利用ICL进行决策。

首先，ICL利用几个例子构成一个演示上下文（demonstration context），示例通常由自然语言模板写成。
然后，ICL将一个查询问题（query question）和一段演示上下文拼接在一起，形成一个提示（prompt）
随后将提示输入到模型中进行预测问题的答案。

与监督学习的一个很大不同是， ICL不需要进行参数更新，而是直接对预训练的语言模型上进行预测。

ICL有很多优势：

由于演示是用自然语言编写的，因此它提供了一个可解释的接口来与LLM通信。这种范式通过改变演示和模板，使人类知识更容易融入LLM
上下文学习类似于人类通过类比学习的决策过程
与监督训练相比，ICL是一个无需训练的学习框架。这不仅可以大大降低模型适应新任务的计算成本，而且可以使语言模型即服务成为可能，并且可以很容易地应用于大规模的真实世界的任务。

还有一些有趣的问题和特性需要研究：

在预训练期间的adaption可以显著提高ICL的能力
ICL对特定设置很敏感，包括提示模板、上下文示例的选择、样本的顺序等等
ICL的工作机制仍不清楚

2、Overview

ICL的强大能力依赖于两个阶段：

培养LLM的ICL能力的训练阶段，此阶段LLM直接针对语言建模目标进行训练，例如从左到右生成。虽然没有针对上下文学习进行优化，但是LLM仍然表现出ICL能力。
LLM根据任务特定演示预测的推理阶段。对于提升ICL能力的方法，本文将给予详细的描述和比较，如选择合适的例子进行演示，针对不同的任务设计具体的评分方法

图2:上下文学习的分类。训练阶段和推理阶段是ICL的两个主要阶段。在训练阶段，现有的ICL研究主要以一个预训练的LLM为骨干，选择性地对模型进行预热，以增强和推广ICL能力。在推理阶段，演示设计和评分函数的选择是最终性能的关键。

图二展示了作者对上下文学习进展的分类，同时也是文章的组织结构。

关键部分如下：

ICL正式定义
Warmup方法
演示设计策略
主要评分函数
对ICL背后秘密的探索
针对ICL有用的评估和资源
ICL潜在应用场景
ICL的挑战和潜在方向

3、Definition and Formulation

definition

作者根据GPT-3 【1】 的论文，给出ICL的定义：ICL是一种范式，它允许LM根据以演示形式给出的示例来学习任务。本质上，它使用经过良好训练的语言模型估计潜在答案的可能性，条件是演示。

formulation

给定输入文本 $x$ ，一组候选答案 $Y=\{y_1,y_2,...y_m\}$ ( $Y$ 可能是类别标签或者一组自由文本序列)，预训练模型 $M$ 在给定演示集合 $C$ 的条件下，选取具有最高分数的候选答案作为预测结果。

$C$ 包含一个可选的任务指令 $I$ 和 $k$ 个演示示例，因此 $C=\{I,s(x_1,y_1),..,s(x_k,y_k)\}$ ,或者 $C=\{s(x_1,y_1),...,s(x_k,y_k)\}$ 。其中 $s(x_k,y_k,I)$ 是根据任务用自然语言编写的案例。一个候选答案 $y_i$ 的可能性可以通过模型 $\mathcal{M}$ 的整个输入序列的评分函数 $f$ 表示：
$P(y_j\mid x)\triangleq f_{\mathcal{M}}(y_j,C,x)$
最终的预测的标签是概率最高的候选答案
$\hat{y}=\arg\mathop{\max}\limits_{y_j\in Y} P(y_j|x)$
评分函数 $f$ 评估了给出演示和查询文本时当前答案的可能性。

根据定义，可以看到与ICL与其他相关概念的区别。

prompt learning:提示可以是离散模板或者软参数，鼓励模型预测期望的输出。严格地说，ICL可以看成prompt learning的一个子类，其中演示是提示的一部分。Liu等人 【2】 对prompt learning写了篇综述，但ICL并不在里面。
few-shot learning: 指的是在给定少量监督数据的情况下利用参数自适应来学习最佳模型参数的训练方法(引用自[Few- shot Learning : a survey ]这是v1的题目，最新版v3见 【3】 )。相反，ICL不需要参数更新，而是直接在预训练的LLM上。

4、Model Warmup

在预训练和ICL推理之间存在一个持续训练阶段，即模型预热Warmup阶段，可以进一步提高ICL推理能力。

这是一个可选过程，包括调整模型参数或者新增参数，与传统的finetune过程不同，finetune是为了提高LLM在特定任务上的性能，而 warmup是为了使得模型具备更好的通用ICL能力。

4.1 Supervised In-context Training

虽然与训练后的语言模型已经初步具备ICL能力，但是预训练的目标并不是为了ICL而优化的，因此与下游ICL目标还是存在gap，最直观的方法就是在有监督的ICL数据上进行训练，来消除两者之间的gap。

比如MetaICL 【4】 直接将很多任务调整为ICL形式并进行整合，增强了模型的few-shot能力。

此外，Google为了进一步鼓励模型学习输入-标签映射提出了symbol tuning方法 【5】 ，具体而言，用任意符号（比如，foo/bar）替换掉自然语言标签（比如，积极/消极情绪）。它利用了这样的直觉，当模型无法使用指令或自然语言标签来找出任务时，它必须通过学习输入-标签映射来实现。

还有部分研究专注于 instruction tuning，与MetaICL相比，它们更加考虑对于任务的解释，这种方式更容易扩展，比如LaMDA-PT 【6】 、FLAN 【7】 。

4.2 Self-supervised In-context Training

除了使用有监督的数据提升ICL能力外，也有工作尝试使用自监督的方式。

MetaAI提出根据下游任务的ICL格式构造自监督训练数据 【8】 。它们将原始文本转化为输入-输出对，探索4个自监督目标，包括masked token prediction 和classification task。

PICL(Pre-training for in-context learning) 【20】 也利用了原始语料，但是只使用了一个简单的语言建模目标，在保留了原来模型生成能力的同时，提示了基于上下文的任务推理和执行。

Takeaway

takeaway 可以指获得的心得，领悟，总结

无论监督训练还是自监督训练，都提出在ICL推理之前训练LLM，关键思想是通过引入接近上下文学习的目标来减少预训练和下游ICL格式之间的差距。与包含demonstration的in-context finetuning 相比，没有少量样本作为演示的instruction finetuning 更加简单和受欢迎。
在某种程度上，这些方法都通过更新模型参数来提高ICL能力，这意味着原始LLM的ICL能力有很大的改进潜力。因此，尽管ICL并不严格要求模型预热，但作者建议在ICL推理之前添加一个预热阶段。
当越来越多地放大训练数据时，预热带来的性能提升遇到了一个平台（plateau）。这种现象出现在有监督的上下文训练和自监督的上下文训练中，表明LLM只需要少量的数据来适应，以便在预热过程中从上下文中学习。

5、Demonstration Designing

一些研究表明，ICL的性能严重依赖于演示，包括演示的格式，演示示例的顺序。

下面从两方面来进行研究，演示组织和演示格式。

5.1 Demonstration Organization

这部分讨论如何从示例池中选取合适的示例以及怎样组织它们的顺序。

5.1.1 Demonstration Selection

对于ICL来说，哪些样本是好的？选取合适样本的方法分为两类：无监督与监督。

Unsupervised Method

句向量距离：Liu等人 【9】 的研究表明选择与输入的测试句子最相似的邻居作为ICL的例子是一个好的方案。（这种方式在GPT-NER论文【GPT-NER: Named Entity Recognition via Large Language Models】也提到过）。他们是用距离指标来衡量相似度，比如L2距离或余弦相似度。他们提出了KATE ，一个基于KNN的无监督提取器，用来选取上下文例子。
互信息（mutation information,MI)： 见论文 【10】 ，互信息可以用来表示两个变量之间是否有关系，以及关系的强弱。它的优势是不需要有标签的示例以及特定的LLM。

此外，还有学者尝试利用perplexity（PPL） 【11】 或者演示的多样性 【12】 等指标进行选取。

甚至，可以让LLM自己生成适合的演示，称为SG-ICL 【13】 。

还有其他研究利用LM的输出分数 $P (y ∣ C, x)$ 作为指标来选取示例，如Self-Adaptive ICL 【14】 、Informative Score 【15】 。

Supervised Method

Rubin等人 【16】 提出了一个两阶段的提取方法，先用无监督检索器召回若干相似的样本，再通过监督学习训练的Efficient Prompt Retriever（EPR）进行打分，从而筛选出最合适的样本。

Li等人 【17】 对上述方法的EPR进行了改进，得到了一个统一演示检索器Unified Demonstration Retriever （UDR），统一了不同任务间的演示选择。

此外，也有基于prompt tuning 和强化学习(如 【18】 采用了Q-Learning)的方式选择样本的方法。

5.1.2 Demonstration Ordering

挑选完演示示例后，如何对它们排序也很重要。 论文 【19】 证实了顺序敏感度是存在于很多模型中的一个普遍问题。

目前的研究并不多，有两种思路：

论文 【9】 根据这些示例与输入句子之间的距离进行排序，越相近的排在后面，也就是越靠近输入。
GlobalE&LocalE : 论文 【19】 定义了global 和 local entropy metrics（熵度量），找到了熵与ICL效果的联系，从而根据熵来决定最佳排序。

5.2 Demonstration Formatting

这部分讨论如何设计演示的格式？

最简单的方式就是将示例的x-y对按照顺序直接拼接到一起。但是对于复杂的推理问题，语言模型很难直接根据x推理出y，这种格式就不适用了。

通常有两种方式： instruction指令格式以及reasoning steps格式 。

5.2.1 Instruction Formatting

任务的指令描述非常依赖于人工，不过现在有很多人尝试让LLM自己生成任务描述并选择。

Honovich等人【21】展示了语言模型可以通过提示它们生成符合示例的自然语言指令，从一些示例中显式地推断出一个底层任务，并引入了 instruction induction 挑战，对生成指令的能力进行了评估。

Wang 等人【22】提出了 Self-instruct 方法，旨在引导LLM依靠自己的生成能力提高指令遵循能力(instrutction-following)。

5.2.2 Reasoning Steps Formatting

Wei 等人【23】在构建演示时，在输入和输出之间添加了中间推理步骤，这些步骤被称为 Chain-of-thoughts，即 CoT。

Qiao等人【24】对语言模型的推理能力的前沿研究做了全面综述。

CoT也有不同的设计策略。

Wei等人【23】采用的手工撰写CoT的方法，而Zhang等人【25】提出了Auto-CoT的方法，自动构建包含问题和推理链的说明信息。

此外，还有研究 Multi-stage ICL ,分多个步骤来完成任务，每一步都设计不同的演示，让模型一步步解答。比如 Self-Ask 【26】（让模型根据输入生成后续问题，并问自己这些问题）、iCAP 【27】（迭代上下文感知提示器）、Least-to-Most Prompting 【28】（将一个复杂的问题分为一系列更为简单的子问题，然后按顺序解决它们）。

此外，Xu等人【29】提出了 Super In-Context learning (SuperICL) ，利用LLM与较小模型的组合，较小模型作为插件，有效地执行任务。

Takeaway

作者对Prompt设计部分的工作进行了讨论

已有样例选择的策略都是基于单个样本的， 语料库级别的研究 更加重要并有待研究。
llm的输出分数或概率分布在实例选择中起着重要的作用
从k个样例的k！个排列中， 找到最优解是一个很有挑战的问题
CoT技术可以提升推理效果，怎么优化CoT有待探索
要善于利用LLM的生成能力来摆脱人工的限制，来辅助演示设计，如生成指令，演示，CoT 等。

6、Scoring Function

评分函数决定了我们如何将一个语言模型的预测转换为对一个特定答案的可能性的估计。

主要方法有：

Direct【1】：GPT-3中使用，直接取答案的条件概率，缺点是只能衡量固定模式的答案，如答案在输入序列的最后。

这里不太明白
PPL ：它计算整个句子的困惑度，消除了token位置的限制，但是需要额外的计算时间。
Channel：此方法与之前给定输入上下文的情况下估计标签的概率的方法不同，它计算了反向的条件概率，即估计给定标签的情况下，输入的可能。这个方法对于不平衡的数据表现很好。

此外，还有一个方向上合并超出上下文长度约束的信息来校准分数，如Structured Prompting 与 KNN Prompting 。

Takeaway

现有的评分函数都直接从llm的条件概率计算一个分数。关于通过评分策略来校准偏差或减轻敏感性的研究有限。

7、Analysis

作者还调研了可能会影响ICL效果的因素，如下表

7.1 What influences ICL performance

7.1.1 Pre-training stage

Shin等人【30】研究了预训练语料库的来源和大小对上下文学习的影响
- ICL的性能很大程度上取决于预训练语料库领域来源，语料库大小并不一定会决定ICL的出现
- 即使在单个语料库上不会出现ICL，在多个语料库的组合上训练也会产生ICL
- 与下游任务相关的预训练并不总是保证ICL能力的增强
- 语言建模和上下文学习之间的关系并不总是相关
Wei等人【31】发现预训练模型的参数量以及训练步数对ICL能力的产生有影响。

7.1.2 Inference stage

一些研究指出，在推理阶段，示例的属性也会影响ICL的性能。

比如，Min等人【32】提出了影响演示性能的四个方面：“the input-label pairing format”（即模板）、“the label space”、“the input distribution”、“the input-label mapping”（标签y是否正确）。他们证明了前三个因素对ICL性能有很大影响，但是标签的正确性影响很小。

但Kim等人【 33】却提出了相反的观点，认为正确的标签对ICL性能有影响，这却决于具体实现配置。

也有其他研究指出了影响ICL性能的其他因素，具体见表格3，相关论文为【33】、【34】、【9】。

7.2 Understanding Why ICL works

Distribution of Training Data ：跟训练数据的分布有关。有研究发现当训练数据表现出特定的分布属性时就会出现上下文学习，另外，也有学者认为ICL可能是隐式的Bayesian inference。
Learning Mechanism ：跟学习机制有关。比如Li等人【36】将ICL抽象为算法学习温柔，表明Transformer可以通过演示中的隐式经验风险最小化来实现合适的函数类。也有其他工作试图在ICL与微调之间建立联系。Dai等人【37】将大模型解释为元优化器然后将ICL立即为隐式微调，其实验表明，上下文学习的行为类似于从多个角度进行的显式微调。
Functional Components ：跟特定的功能模块有关。有学者【38】发现Transformer里有些注意力头会拷贝之前的模式来预测下一个token，他们认为感应头可能是大模型中ICL机制的来源。

Takeaway

表三中列出了可能影响ICL性能的因素，了解ICL可能的原理会帮助我们提高ICL的性能。
现有的对ICL解释的研究仅局限于小任务和小模型，需要考虑对更广泛任务和大模型的分析。其中，用梯度下降来理解ICL似乎是一个合理且有前景的未来方向，如果二者建立了清晰的联系，就可以借鉴之前传统深度学习的历史来提升ICL。

8、Evaluation and Resources

8.1 Traditional Tasks

在传统的数据集和基准上进行研究，例如SuperGLUE、SQuAD。但目前，于微调相比，ICL在传统的NLP任务上还有一定的进步空间。

8.2 New Challenging Tasks

研究人员更感兴趣于评估不要下游任务微调的大语言模型的内在能力。

Srivastava 等人【39】提出了 BIG-Bench （Beyond the Imitation Game benchmark），是一个涵盖了多种任务的大型benchmark。最好的模型已经在65%的BIG-Bench任务上超过了平均的人类评分结果。

在此基础上，Suzgun等人【40】提出了 BIG-Bench Hard （BBH），由23个具有挑战性的任务构成，这些任务最新模型都低于人类的性能。

此外，还有研究人员在寻找inverse scaling 任务，即当模型扩大的时候，模型性能反而下降的任务，这些任务突出显示了ICL范式的潜在问题。

Iyer等人提出了 OPT-IML Bench ，由8个现有benchmarks的2000个NLP任务构成，用来探索大模型的泛化能力。

此外，还有一系列的研究针对于ICL的推理能力，如MGSM（针对多语言环境下的思维链能力）、LLMAS（评估行为和变化方面的推理能力）等，具体见表4

8.3 Open-source Tools

OpenICL【42】，一个用于ICL和LLM评估的开源工具包，支持各种最先进的检索和推理方法、任务和零/少样本评估LLM。

Takeaway

由于icl对示范实例数量的限制，传统的评价任务必须适应few-shot设置;否则，传统的基准测试不能直接评估lms的ICL能力
由于ICL是一种新的学习范式，在许多方面不同于传统的学习范式，因此对ICL的评价提出了新的挑战和机遇。面对这些挑战，现有的评价方法的结果不稳定，对演示示例和指令尤为敏感。现有的评估准确率低估了ICL对指令扰动的敏感性，如何进行一致性的ICL评估仍然有待解决。由于ICL只需要几个实例进行演示，降低了数据构建的成本。

9、In-Context Learning Beyond Text

在NLP领域ICL的巨大成功引发了研究人员探索其在其他模态领域的潜力的热情，比如visual、vision+language、speech等任务。

这一部分简要的进行了阅读，暂时不做详细笔记，仅记录一下takeaway部分

Takeaway

适当格式化的数据和架构设计是激发ICL潜力的关键因素
在文本领域研究演示设计于选择的成果不能简单地转移到其他模态中去，需要针对特定领域做研究。

10、Application

ICL不止在传统的NLP任务上如机器翻译或信息抽取以及text-to-SQL上展示了突出性能，还在需要 复杂推理 （complexity reasoning）和 组合泛化 (compositional generalization) 的任务上表现显著。

ICL还为 meta-learning 以及 instruction-tuning 提供了潜力。

下面展示了几个新兴的应用场景：

Data engineering

数据注释：对于许多NLP任务来说，数据注释是一个耗时且费力的过程。使用GPT-3生成标签的成本比使用人类标签要低很多，并且，将伪标签与人类标签相结合，可以获得更好的性能。
知识图谱构建：利用上下文学习的范式，可以显著提高自动构造和完成知识图谱的水平，进而降低知识图谱构建的成本。

尽管，与人类标注相比，ICL可以以较低的成本生成相对质量高的数据，怎样在数据注释中利用ICL仍然有待解决。

Model Augmentating

ICL的上下文灵活性展示了提高检索增强方法的潜力。

比如，Ram等人提出的 In-context RALM (retrieval-augmented language modeling) 方法，保持了LM结构不变，并在输入前加入真实文档，利用现成的通用检索器，取得了可观的LM收益。

ICL还显示出了在安全方面的潜力，有学者使用ICL进行检索演示来引导模型朝着更安全的方向生成内容，减少偏见与毒性。

Knowledge Updating

LLM可能会包含错误或过时的知识，ICL可以有效编辑或更新这些知识。

比如，Si等人【44】发现当提供反事实 （counterfactual 通过未发生的条件来进行推理可能的结果，就是反事实推理）例子时，GPT-3在85%的时候都可以更新答案，并且更大的模型在上下文知识更新时表现更好。他们通过适当的提示，使得GPT-3在多个方面都比小规模的监督模型要可靠。

11、Challenges and Future Directions

11.1 New Pretraining Strategies

语言建模的目标和ICL的能力并不匹配【45】。第4章的方法可以减少两者之间的差距。而更进一步，为ICL量身定做的预训练目标和指标可能更能培养出具有强大ICL能力的LLM。

11.2 ICL Ability Distillation

随着计算规模和参数超过某个阈值，ICL能力就会出现。

如果能将ICL的能力转移到小模型上时，就可以极大地促进模型部署。

Magister【46】探索了通过知识蒸馏将推理能力转移到较小的模型上，还探索了模型和数据集大小的权衡。具体来说，他们在更大的教师模型产生的思维链输出上微调学生模型。

尽管实现了性能的提升，但改进可能来自于任务。 通过从更大的LLM中学习来提高推理能力的进一步研究可能是有趣的方向。

11.3 ICL Robustness

先前的研究证明，ICL的性能很不稳定，从瞎猜到SOTA不等，并且对很多因素敏感，包括演示的排列，演示的格式等。因此保持ICL的鲁棒性是一个挑战性的问题。

但很多研究陷入了准确性和鲁棒性的两难境地，甚至有人牺牲推理效果来提升鲁棒性。

为了有效提高 ICL 的鲁棒性，**需要对 ICL 的工作机制进行更深入的分析 **。从更理论的角度而不是经验角度分析 ICL 的鲁棒性可以得到未来对更鲁棒的ICL 的研究。

11.4 ICL Efficiency and Scalability

ICL需要的演示面对着一些挑战：

可扩展性：演示的数量受到LM的最大输入长度的显著，与微调相比，长度要少很多
效率性：当演示数量增加时，注意力机制的二次复杂性使得计算成本更高

第5章内容关注于利用有限数量的演示来实现更好的ICL性能，并提出了几种演示设计策略。 将ICL扩展到更多演示并提高其效率仍然是一种具有挑战性的任务。

已经有一些工作提出了解决方法，如 structured prompting、demonstration ensembling、dynamic prompting、iteration forward tuning、EVaLM等等。

12、Conclusion

作者调查了现有的ICL文献，并对先进的技术进行了回顾与总结，从warmup方法、演示设计策略、评估方法、数据集和资源等方面对ICL相关研究做了分析，并强调了一些具有挑战性的问题和未来方向。

References

[1] Language Models are Few-Shot Learners (neurips.cc)
[2] Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing | ACM Computing Surveys
[3] Generalizing from a Few Examples: A Survey on Few-Shot Learning
[4] NAACL MetaICL: Learning to Learn In Context - ACL Anthology
[5] [2305.08298] Symbol tuning improves in-context learning in language models (arxiv.org)
[6] [2201.08239] LaMDA: Language Models for Dialog Applications (arxiv.org)
[7] [2109.01652] Finetuned Language Models Are Zero-Shot Learners (arxiv.org)
[8] NAACL Improving In-Context Few-Shot Learning via Self-Supervised Training - ACL Anthology
[9] DeeLIO What Makes Good In-Context Examples for GPT-3? -
[10] ACL An Information-theoretic Approach to Prompt Engineering Without Ground Truth Labels - ACL Anthology
[11] [2212.04037] Demystifying Prompts in Language Models via Perplexity Estimation (arxiv.org)
[12] ACL [2212.06800] Diverse Demonstrations Improve In-context Compositional Generalization (arxiv.org)
[13] Self-Generated In-Context Learning: Leveraging Auto-regressive Language Models as a Demonstration Generator (arxiv.org)
[14] ACL [2212.10375] Self-Adaptive In-Context Learning: An Information Compression Perspective for In-Context Example Selection and Ordering (arxiv.org)
[15] [2302.13539] Finding Supporting Examples for In-Context Learning (arxiv.org)
[16] NAACL Learning To Retrieve Prompts for In-Context Learning - ACL Anthology
[17] ACL Unified Demonstration Retriever for In-Context Learning - ACL Anthology
[18] EMNLP Active Example Selection for In-Context Learning - ACL Anthology
[19] ACL Fantastically Ordered Prompts and Where to Find Them: Overcoming Few-Shot Prompt Order Sensitivity - ACL Anthology
[20] ACL Pre-Training to Learn in Context - ACL Anthology
[21] ACL Instruction Induction: From Few Examples to Natural Language Task Descriptions - ACL Anthology
[22] ACL Self-Instruct: Aligning Language Models with Self-Generated Instructions - ACL Anthology
[23] NeurIPS Chain-of-Thought Prompting Elicits Reasoning in Large Language Models (neurips.cc)
[24] ACL Reasoning with Language Model Prompting: A Survey - ACL Anthology
[25] [2210.03493] Automatic Chain of Thought Prompting in Large Language Models (arxiv.org)
[26] [2210.03350] Measuring and Narrowing the Compositionality Gap in Language Models (arxiv.org)
[27] EMNLP [2203.08383] Iteratively Prompt Pre-trained Language Models for Chain of Thought (arxiv.org)
[28] ICLR Least-to-Most Prompting Enables Complex Reasoning in Large Language Models Poster (iclr.cc)
[29] [[2305.08848] Small Models are Valuable Plug-ins for Large Language Models (arxiv.org)](https://arxiv.org/abs/2305.08848#:~:text=Small Models are Valuable Plug-ins for Large Language,models difficult to be tuned with common hardware.)
[30] ACL On the Effect of Pretraining Corpora on In-context Learning by a Large-scale Language Model - ACL Anthology
[31] TMLR [2206.07682] Emergent Abilities of Large Language Models (arxiv.org)
[32] EMNLP Rethinking the Role of Demonstrations: What Makes In-Context Learning Work? - ACL Anthology
[33] EMNLP [Ground-Truth Labels Matter: A Deeper Look into Input-Label Demonstrations - ACL Anthology](https://aclanthology.org/2022.emnlp-main.155/#:~:text=Ground-Truth Labels Matter%3A A Deeper Look into Input-Label,impact of the quality of demonstrations remain elusive.)
[34] ACL How Do In-Context Examples Affect Compositional Generalization? - ACL Anthology
[35] ACL Fantastically Ordered Prompts and Where to Find Them: Overcoming Few-Shot Prompt Order Sensitivity - ACL Anthology
[36] ICML Transformers as Algorithms: Generalization and Stability in In-context Learning Poster (icml.cc)
[37] ACL Why Can GPT Learn In-Context? Language Models Secretly Perform Gradient Descent as Meta-Optimizers - ACL Anthology
[38] [2209.11895] In-context Learning and Induction Heads (arxiv.org)
[39] [2206.04615] Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models (arxiv.org)
[40] [2210.09261] Challenging BIG-Bench Tasks and Whether Chain-of-Thought Can Solve Them (arxiv.org)
[41] [2212.12017] OPT-IML: Scaling Language Model Instruction Meta Learning through the Lens of Generalization (arxiv.org)
[42] ACL OpenICL: An Open-Source Framework for In-context Learning - ACL Anthology
[43] TACL [2302.00083] In-Context Retrieval-Augmented Language Models (arxiv.org)
[44] ICLR Prompting GPT-3 To Be Reliable Poster (iclr.cc)
[45] NAACL On the Effect of Pretraining Corpora on In-context Learning by a Large-scale Language Model - ACL Anthology
[46] ACL Teaching Small Language Models to Reason - ACL Anthology

你可能感兴趣的:(笔记)

C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
入门html这篇文章就够了 ξ流ぁ星ぷ132 html 前端
HTML笔记文章目录HTML笔记html介绍什么是htmlhtml的作用HTML标签介绍常用标签标签and标签and标签u标签del删除线br标签用于换行pre标签，预处理标签span标签div标签sub标签andsup标签hr标签h1,h2...h6标签：HTML5中的语义标签：特殊字符img标签a标签第一种用法：超链接第二种用法：锚点video标签表格标签：form标签input标签selec
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
vue3面试题(个人笔记) 武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js java 学习
vue3比vue2有什么优势？性能更好，打包体积更小，更好的ts支持，更好的代码组织，更好的逻辑抽离，更多的新功能。描述Vue3生命周期CompositionAPI的生命周期：onMounted()onUpdated()onUnmounted()onBeforeMount()onBeforeUpdate()onBeforeUnmount()onErrorCaptured()onRenderTrac
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
swagger【个人笔记】撰卢笔记 java
文章目录swagger导入mave坐标在配置类(WebMvcConfiguration)中加入knife4j相关配置设置静态资源映射，主要是让拦截器放行swagger常用注解@Api(tags="\[描述这个类的作用]")@ApiModel(description="\[描述这个类的作用]")@ApiModelProPerty("描述这个类的作用")@ApiOperation("\[描述方法的作用
【个人笔记】负载均衡撰卢笔记负载均衡运维
文章目录nginx反向代理的好处负载均衡负载均很的配置方式均衡负载的方式nginx反向代理的好处提高访问速度进行负载均衡保证后端服务安全负载均衡负载均衡，就是把大量的请求按照我们指定的方式均衡的分配给集群中的每台服务器负载均很的配置方式upstreamwebservers{server192.168.100.128:8080server192.168.100.129:8080}server{lis
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
5G标准学习笔记14 - CSI--RS概述刘孬孬沉迷学习 5G 学习笔记信息与通信
5G标准学习笔记14-CSI–RS概述大家好~，这里是刘孬孬，今天带着大家一起学习一下5GNR中一个非常非常重要的参考信号------------------CSI-RS信号，CSI-RS不是持续发送，UE只能在网络明确配置了CSI-RS的情况下才能使用其进行信道测量。前言对于CSI-RS，肯定还离不开前面所说的CSI（channelstateinformation），前面也讲过CSI对于MIMO
5G标准学习笔记06-基于AI/ML波束管理刘孬孬沉迷学习 5G 学习笔记
5G标准学习笔记06-基于AI/ML波束管理前言前面对于孬孬学习了波束管理的概述，下面要进一步来看一下传统波束管理和现在3GPP中推动的AL/ML波束管理之前的区别联系。一、传统波束管理方法流程传统BM流程主要包括以下步骤：波束扫描（BeamSweeping）：gNB通过顺序发送多个窄波束（SSB或CSI-RS），覆盖整个服务区域，UE测量每个波束的信号质量（如L1-RSRP或L1-SINR）。波
5G标准学习笔记03- CSI 反馈增强概述刘孬孬沉迷学习 5G 笔记学习
5G标准学习笔记03-CSI反馈增强概述大家好，最近在研究AI/ML3gpp标准NR空口的有关内容，后面可能会给大家介绍一下对应的有关内容AI/ML在3GPP标准中的研究进展在AI/ML在NR空口的应用中，对应标准主要聚焦了3个case进行讨论研究分别是：CSI反馈增强；波束管理；定位精度增强；这三个内容可能比较涉及RAN1/2的具体内容，后面会基于这个进行一定的介绍。今天主要是主要介绍CSI反馈
运维笔记＜4＞ xxl-job打通 GeminiJM 运维 java xxl-job
新的一天，来点新的运维业务，今天是xxl-job的打通其实在非集群中，xxl-job的使用相对是比较简单的，相信很多人都有使用的经验这次我们的业务场景是在k8s集群中，用xxl-job来做定时调度加上第一次倒腾，也是遇到了不少问题，在这里做一些记录1.xxl-job的集群安装首先是xxl-job的集群安装先贴上xxl-jobsql初始化文件的地址：xxl-job/doc/db/tables_xxl
两台pc如何高速度传输大文件费城之鹰其他两台电脑高速传输文件局域网不适用U盘传输资料网线直连两台电脑传资料
今天笔记本跑一个大一点的项目，8G的内存直接100%，i5的CPU直接75%并且在超频工作了，原本1.6Ghz的频率直接飙到了3.8Ghz，由于项目性质原因，采用的是公司配的笔记本，但是年初采购的联想E480，还在三包时间段内，公司不允许拆机增加内存，只能换一台新的台式机，听起来挺爽，有新设备，但是办公区域不准使用U盘这一类的存储设备，这就蛋疼了，大半年了项目代码，资料全在这个不够用的笔记本里，问
学习笔记(33):matplotlib绘制简单图表-绘制混淆矩阵热图宁儿数据安全 #机器学习学习笔记 matplotlib
学习笔记(33):matplotlib绘制简单图表-绘制混淆矩阵热图一、绘制混淆矩阵热图代码解析1.1、导入必要的库importmatplotlib.pyplotaspltfromsklearn.metricsimportconfusion_matriximportseabornassnsmatplotlib.pyplot：Python中最常用的绘图库，用于创建各种图表confusion_matr
玩转Docker | 使用Docker部署NotepadMX笔记应用程序心随_风动玩转Docker docker 笔记 eureka
玩转Docker|使用Docker部署NotepadMX笔记应用程序前言一、NotepadMX介绍工具简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署NotepadMX服务下载NotepadMX镜像编辑部署文件创建容器检查容器状态检查服务端口安全设置四、访问NotepadMX服务访问NotepadMX首页设置访问验证编辑笔记总结前言在如今快节奏的工作与学习中，一
【前端】异步任务风控验证与轮询机制技术方案（通用笔记版）
一、背景场景在某类生成任务中，例如用户点击“执行任务”按钮后触发一个较耗时的后端操作（如生成报告、渲染图像、转码视频等），由于其调用了模型、渲染服务或需要较长处理时间，为了防止接口被频繁恶意调用，系统需要加入风控验证机制。此外，因任务处理为异步，前端无法立即获得最终结果，因此需通过轮询方式定期查询任务状态，等待任务完成后展示结果。二、整体流程说明1.用户点击“执行任务”按钮：前端调用风控接口/ap
数据分析案例-电脑笔记本价格数据可视化分析3 艾派森数据分析信息可视化 python 数据分析数据挖掘电脑
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具
LLaMA 学习笔记 AI算法网奇深度学习基础人工智能深度学习
目录LLaMA模型结构：模型微调手册：推理示例：指定位置加载模型测试ok：模型下载：llama-stack下载modelscope下载LLaMA优化技术RMSNormSwiGLU激活函数旋转位置编码（RoPE）LLaMA模型结构：llama3结构详解-CSDN博客模型微调手册：大模型微调LLaMA详细指南（准备环境、数据、配置微调参数+微调过程）_llama微调-CSDN博客显存占用：FP16/B
BOOT_KEY按键（学习笔记）小高Baby@ 学习笔记
先来让我们了解一下GPIO是什么吧，它在单片机中也有很重要的作用，接下来我们来看看吧。esp32C3是QFN32封装（一种集成电路（IC）封装类型），GPIO引脚一共有22个，从GPIO-0到GPIO-21。从理论上来说，所有的IO引脚都可以复用为任何外设功能，但有些引脚用作连接芯片内部FLASH或者外部FLASH功能时，官方不建议用作其它用途。esp32c3的GPIO，可以用作输入、输出，可以配
多线程在Java项目中的使用案例(笔记) 车车不吃香菇 java基础 java
多线程在Java项目中的使用案例(笔记)实现runnable接口@OverridepublicBooleanaddMeetingExpertIds(MeetAddExpertDtomeetAddExpertDto,LonguserId){//会议关联到专家//如果需要发给专家newThread(newRunnable(){@Overridepublicvoidrun(){try{if(meetAd
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
Kotlin学习笔记 qq_26907861
1.Val和Varval:用于声明不可变量,不可变是指引用不可变;var:用于声明可变的变量;packagehello//可选的包头funmain(args:Array){//包级可见的函数，接受一个字符串数组作为参数vala="不可变的变量"//不可变的变量varn=2//可变println(a)println(n)}2.fun函数Kotlin中的函数可以这样声明:fun函数名(参数列表):返回
扔物线--Kotlin协程训练营2期-2
笔记仅做自己学习用，方便自己复习知识。若正好可以帮助到Viewer，万分欣喜~若博客侵权，扔物线大大不允许放上面，麻烦告知本文是扔物线Kotlin第二期协程训练营的第二篇文章没看过第一篇文章的可以先看第一篇：https://blog.csdn.net/bluerheaven/article/details/106969835目录一、Retrofit对协程的支持二、Retrofit和RxJava的结
20250707-3-Kubernetes 核心概念-有了Docker，为什么还用K8s_笔记 Andy杨 CKA-专栏 kubernetes docker 笔记
一、Kubernetes核心概念1.有了Docker，为什么还用Kubernetes1）企业需求独立性问题：Docker容器本质上是独立存在的，多个容器跨主机提供服务时缺乏统一管理机制负载均衡需求：为提高业务并发和高可用，企业会使用多台服务器部署多个容器实例，但Docker本身不具备负载均衡能力管理复杂度：随着Docker主机和容器数量增加，面临部署、升级、监控等统一管理难题运维效率：单机升
20250707-4-Kubernetes 集群部署、配置和验证-K8s基本资源概念初_笔记
一、kubeconfig配置文件文件作用:kubectl使用kubeconfig认证文件连接K8s集群生成方式:使用kubectlconfig指令生成核心字段:clusters:定义集群信息，包括证书和服务端地址contexts:定义上下文，关联集群和用户users:定义客户端认证信息current-context:指定当前使用的上下文二、Kubernetes弃用Docker1.弃用背景原因:
麒麟系统离线安装docker
随着CentOS全面停服，国产操作系统会慢慢代替centos系统，在后续的项目中，项目部署的环境都必将是国产操作系统，本文就国产操作系统下如何离线安装docker,做下笔记分享一、材料准备1、国产操作系统麒麟10，arm64v82、dokcer部署包（版本：docker-18.09.tgz）3、部署docker脚本（docker.service），已经启动命令脚本（install.sh）二、编写d
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本