TFATS

GPT，GPT-2，GPT-3，InstructGPT的进化之路

ChatGPT 火遍圈内外，突然之间，好多人开始想要了解 NLP 这个领域，想知道 ChatGPT 到底是个什么？作为在这个行业奋斗5年的从业者，真的很开心让人们知道有一群人在干着这么样的一件事情。这也是我结合各位大佬的文章，总结下GPT 这条技术路线的初心。
其实，ChatGPT 的成功并非一朝一夕，而是 OpenAI 长达 4 年多持续努力、不懈追求取得的成果。从 2018 年的初代 GPT 开始，到 GPT-2、GPT-3、InstructGPT，以及后续一系列变体模型（统称 GPT-3.5 系列），到如今的 ChatGPT4，每一步都是不可或缺的。所以，ChatGPT 不是一次伟大创新的产物，而是许多个阶段性创新持续叠加的结果。

本文将介绍以下内容：

GPT
GPT-2
GPT-3
InstructGPT
GPT 系列进化时间线

一、GPT

1、背景

让我们把视角回到 2018 年，那个时候 NLP 在深度学习上基本还处于 word2vec 以及为不同任务做定制化深度模型的情况，虽然已经有 ELMo 这类预训练模型出现，但是其影响力还远远不足。在这个背景下，GPT 第一代预训练语言模型出现了。

GPT 原文标题为 Improving Language Understanding by Generative Pre-Training，即使用通用的预训练模型来提升语言理解能力（Generative Pre-Training 也可理解为“生成式预训练”）。GPT 这个名字就来源于 Generative Pre-Training。

从论文标题可以引出了两个问题：

什么是通用？在学习通用的，迁移性强的文本特征表达时，什么目标函数是有效的？
有了通用的特征表达之后，如何将它迁移到不同下游任务？

GPT 使用了预训练 + 微调的方式解决了这两个问题。

2、模型结构

在预训练阶段，GPT 选择 transformer 的 decoder 部分作为模型的主要模块，transformer 是 2017年 google 提出的一种特征抽取模型，GPT 以多层 transformer 堆叠的方式构成了整个预训练模型结构。
假设有一段文本，把每个词计作 $U i$ ，GPT 使用标准的语言模型目标函数来最大化下面的似然函数：

具体来说是要预测每个词 $U_i$ 的概率，这个概率是基于它前面 $U_{i-k}$ 到 $U_{i-1}$ 个词，以及模型 $\theta$ 。这里的 k 表示上文的窗口大小，理论上来讲 k 取的越大，模型所能获取的上文信息越充足，模型的能力越强。

模型对输入 U 进行特征嵌入得到 transformer 第一层的输入 $h_0$ ，再经过多层 transformer 特征编码，使用最后一层的输出即可得到当前预测的概率分布：

其中， $W_e$ 为词嵌入矩阵， $W_p$ 为位置嵌入矩阵， $H_l$ 为第 $l$ 层 transformer 的输出， $h_n$ 为最后一层 transformer 的输出， $n$ 为模型层数。

在微调阶段，在有特定下游任务标签的情况下，给定输入序列 $x_1$ 到 $x_m$ ，预测 $y$ 的概率，即将序列输入到预训练好的模型中，得到最后一层 transformer 的最后一个 token $x^{m}$ 的特征 $h^{m}_i$ ，再经过预测层就可以得到对应标签的概率分布：

微调阶段的目标函数为：

最后将两个目标函数联合训练得到的效果最好，即最终目标函数为：

以我们现在的视角来看，选择 transformer 还是 RNN，这个答案是显而易见的，但是在当时那个时间点那个环境下，选择 transformer 还是 RNN 作为预训练模型结构并不是一个显而易见的问题。在模型选择时，作者发现与 RNN 相比，Transformer 具有更加结构化的记忆单元来解决长距离依赖问题，处理更长的文本信息，从而使得学习到的特征在各个任务中的迁移具有更强的鲁棒性。

我们都知道，Transformer 模型一开始是用来做 seq2seq 任务的，所以它包含编码器和解码器两个部分；他们两者的区别主要是，编码器在抽取序列中某一个词的特征时能够看到整个序列中所有的信息，即上文和下文同时看到；而解码器中因为有 mask 机制的存在，使得它在编码某一个词的特征时只能看到自身和它之前的文本信息。GPT 模型选择了 Transformer 的 decoder，也就是解码器的部分，也正是因为 GPT 的预训练目标函数选取的是标准的语言模型目标函数，使得模型在预测某一个词的时候只考虑上文信息而不参考下文。

大家知道，BERT 在预训练的时候选择的不是标准的语言模型作为目标函数，而是一种 mask 语言模型， 也就是在预测句子中某一个词的时候可以同时看到它前后的所有上下文信息，类似于一种完形填空任务，所以 BERT 选择的是 Transformer 的编码器模块。

编码器和解码器的选取倒不是 GPT 和 BERT 的区别，它们的区别主要是预训练目标函数的选取，有人认为 GPT 选择的是一个更难的训练目标，它是根据前面的信息去预测下文，预测未来肯定是比完形填空难度要更大的。这也能从某种程度上解释了为什么相同规模的 GPT 和 BERT 模型，GPT 的效果要比 BERT 差。但是从另一个角度去想，如果能够把预测未来这个事情做好的话，它最终所能达到的效果的天花板一定是更高的，这可能也是 OpenAI 从一开始到现在一直坚持使用标准语言模型目标函数来做预训练模型的其中一个原因吧，当然这只是一种猜想。事实证明，从 GPT-3 开始，到最近的 ChatGPT，OpenAI 所取得的令人惊艳的效果也一定程度上证明了他们的选择的正确性。

3、模型训练

训练数据方面，**初代 GPT 使用了 BooksCorpus 数据集，文本大小约 5 GB，包含 7400w+ 的句子。**该数据集是由约 7000 本独立的、不同风格类型的书籍组成。选择该数据集主要的好处是书籍文本包含大量高质量长句，保证模型学习长距离信息依赖。

模型的一些关键参数为：

参数	取值
transformer 层数	12
特征维度	768
transformer head 数	12
总参数量	1.17 亿

4、下游任务微调

如上图所示，分别例举了 NLP 中四个常见任务（文本分类、文本蕴含、文本相似度、问答任务）作为下游任务应用到 GPT 模型时，其输入序列是如何构造的，以及对应的预测层是如何设计的。

总的来说，都是通过在序列前后添加 Start 和 Extract 特殊标识符来表示开始和结束，序列之间添加必要的 Delim 标识符来表示分隔，当然实际使用时不会直接用 “Start/Extract/Delim” 这几个词，而是使用某些特殊符号。基于不同下游任务构造的输入序列，使用预训练的 GPT 模型进行特征编码，然后使用序列最后一个 token 的特征向量进行预测。

可以看到，不论下游任务的输入序列怎么变，最后的预测层怎么变，中间的特征抽取模块都是不变的，具有很好的迁移能力。

5、初代 GPT 总结

初代 GPT 到底做了什么？有哪些贡献？

第一， 它是最早一批提出在 NLP 任务上使用 pre-train + fine-tuning 范式的工作。

第二， GPT 的实验证明了模型的精度和泛化能力会随着解码器层数增加而不断提升，而且目前还有提升空间，如下图：
第三，预训练模型具有 zero-shot 的能力，并且能随着预训练的进行不断增强，如下图：

值得注意的是，上述第二和第三点，也直接预示着后续 GPT-2 和 GPT-3 的出现。

其实 pre-train + fine-tuning 在计算机视觉里面早在好多年前已经成为主流的算法，但是在 NLP 中一直没有流行起来，主要还是因为在 NLP 里面没有像 ImageNet 那样大规模标好的数据集，这也导致相当一段时间内，深度学习在 NLP 的进展相对比较缓慢，直到 GPT 和 BERT 的出现才渐渐打开局面。

如果说使用大规模无标注的文本进行模型的预训练使 NLP 的发展往前走了一大步，那么 GPT 系列一直在努力推动的 zero-shot 可以说是走了另一大步。

为了进一步验证 zero-shot 的能力，OpenAI 在 GPT-1 提出一年后，推出了 GPT-2。

二、GPT-2

1、背景

GPT-2 原文标题为 Language Models are Unsupervised Multitask Learners，字面意思为语言模型是一种无监督多任务学习器。

标题中的多任务学习与我们常规理解的有监督学习中的多任务不太一样，这里主要是指模型从大规模数据中学到的能力能够直接在多个任务之间进行迁移，而不需要额外提供特定任务的数据，因此引出了 GPT-2 的主要观点：zero-shot。

不论是 GPT-1 还是 BERT，NLP 任务中比较主流的 pre-train + fine-tuning 始终还是需要一定量的下游任务有监督数据去进行额外的训练，在模型层面也需要额外的模块去进行预测，仍然存在较多人工干预的成本。GPT-2 想彻底解决这个问题，通过 zero-shot，在迁移到其他任务上的时候不需要额外的标注数据，也不需要额外的模型训练。

在 GPT-1 中，下游任务需要对不同任务的输入序列进行改造，在序列中加入了开始符、分隔符和结束符之类的特殊标识符，但是在 zero-shot 前提下，我们无法根据不同的下游任务去添加这些标识符，因为不进行额外的微调训练，模型在预测的时候根本不认识这些特殊标记。所以在 zero-shot 的设定下，不同任务的输入序列应该与训练时见到的文本长得一样，也就是以自然语言的形式去作为输入， 例如下面两个任务的输入序列是这样改造的：

机器翻译任务：translate to french, { english text }, { french text }
阅读理解任务：answer the question, { document }, { question }, { answer }

为什么上述输入序列的改造是有效的？或者说为什么 zero-shot 是有效的？这里引用原文的一句话：

Our approach motivates building as large and diverse a dataset as possible in order to collect natural language demonstrations of tasks in as varied of domains and contexts as possible.

大概意思是，从一个尽可能大且多样化的数据集中一定能收集到不同领域不同任务相关的自然语言描述示例，例如下图中展示了英法互译任务在自然语言中出现的示例，表明了不同任务的任务描述在语料中真实存在：
所以 GPT-2 的核心思想就是，当模型的容量非常大且数据量足够丰富时，仅仅靠语言模型的学习便可以完成其他有监督学习的任务，不需要在下游任务微调。

2、模型结构

在模型结构方面，整个 GPT-2 的模型框架与 GPT-1 相同，只是做了几个地方的调整，这些调整更多的是被当作训练时的 trick，而不作为 GPT-2 的创新，具体为以下几点：

后置层归一化（ post-norm ）改为前置层归一化（ pre-norm ）;
在模型最后一个自注意力层之后，额外增加一个层归一化;
调整参数的初始化方式，按残差层个数进行缩放，缩放比例为 1 : $\sqrt{n}$ ;
输入序列的最大长度从 512 扩充到 1024;

其中，关于 post-norm 和 pre-norm 可以参考《Learning Deep Transformer Models for Machine Translation》。两者的主要区别在于，post-norm 将 transformer 中每一个 block 的层归一化放在了残差层之后，而 pre-norm 将层归一化放在了每个 block 的输入位置，如下图所示：
GPT-2 进行上述模型调整的主要原因在于，随着模型层数不断增加，梯度消失和梯度爆炸的风险越来越大，这些调整能够减少预训练过程中各层之间的方差变化，使梯度更加稳定。

最终 GPT-2 提供了四种规模的模型：

其中 117M 参数等价于 GPT-1 模型，345M 参数模型用于对标同期的 BERT-large 模型。

3、训练数据与实验效果

在训练数据方面，为了保证 zero-shot 的效果，必须要足够大且覆盖面广。所以 GPT-2 中的做法是，只爬取人工筛选过的web数据。但是人工筛选整个web的数据会非常昂贵，作为替代，GPT-2通过爬取 Reddit上所包含的链接（这里是以一种启发式的方法去获取人工筛选的数据，GPT-2认为Reddit这个社交媒体上挂的链接，可能是人们比较感兴趣或认为有价值的，因此存在数据质量问题的概率比较小）。最后得到的数据集叫 WebText。它选取了 Reddit 上的高质量帖子，最终得到 4500w 网页链接，800w 有效的文本文档，语料大小为 40G。

在实验效果上，由于 GPT-2 主要是做 zero-shot，所以在实验部分，很多的实验对比都是在无监督的设定下进行的，也就是说他对比的都是无监督的算法。

从上述效果可以看到，GPT-2 在较多任务上对比无监督算法取得了一定的提升，证明了 zero-shot 的能力。但是，在很多任务上与有监督微调的方法相比还是有一些差距的，这可能也是 GPT-2 在当时影响力没有那么大的一个原因。

4、与 GPT-1 的区别

整体来看，GPT-2 相比于 GPT-1 有如下几点区别：

主推 zero-shot，而 GPT-1 为 pre-train + fine-tuning；

训练数据规模更大，GPT-2 为 800w 文档 40G，GPT-1 为 5GB；

模型大小，GPT-2 最大 15 亿参数，GPT-1为 1 亿参数；

模型结构调整，层归一化和参数初始化方式；

训练参数，batch_size 从 64 增加到 512，上文窗口大小从 512 增加到 1024，等等；

三、GPT-3

1、背景

虽然 GPT-2 主推的 zero-shot 在创新度上有比较高的水平，但是由于其在效果上表现平平，所以在业界并没有取得比较大的影响力，而 GPT-3 正是为了解决效果上的问题而提出的。GPT-3 不再去追求那种极致的不需要任何样本就可以表现很好的模型，而是考虑像人类的学习方式那样，仅仅使用极少数样本就可以掌握某一个任务，因此就引出了 GPT-3 标题 Language Models are Few-Shot Learners。

这里的 few-shot 不是像之前的方式那样，使用少量样本在下游任务上去做微调，因为在 GPT-3 那样的参数规模下，即使是参数微调的成本也是高到无法估计。

2、模型结构

在模型结构上，GPT-3 延续使用 GPT 模型结构，但是引入了 Sparse Transformer 中的 sparse attention 模块（稀疏注意力）。

sparse attention 与传统 self-attention（称为 dense attention）的区别在于：

dense attention：每个 token 之间两两计算 attention，复杂度 O(n²) sparse
attention：每个 token 只与其他 token 的一个子集计算 attention，复杂度 O(n*logn)

具体来说，sparse attention 除了相对距离不超过 k 以及相对距离为 k，2k，3k，… 的 token，其他所有 token 的注意力都设为 0，如下图所示：

使用 sparse attention 的好处主要有以下两点：

减少注意力层的计算复杂度，节约显存和耗时，从而能够处理更长的输入序列；
具有“局部紧密相关和远程稀疏相关”的特性，对于距离较近的上下文关注更多，对于距离较远的上下文关注较少；

关于 sparse attention 详情可参考《Generating Long Sequences with Sparse Transformers》。

最终 GPT-3 在训练过程中得到了如下不同规模的模型：

其中规模最大的模型称为 GPT-3，模型参数量为 1750 亿。

3、下游任务评估方法

如上图所示，GPT-3 在下游任务的评估与预测时，提供了三种不同的方法：

Zero-shot：仅使用当前任务的自然语言描述，不进行任何梯度更新；
One-shot：当前任务的自然语言描述，加上一个简单的输入输出样例，不进行任何梯度更新；
Few-shot：当前任务的自然语言描述，加上几个简单的输入输出样例，不进行任何梯度更新；

其中 Few-shot 也被称为 in-context learning，虽然它与 fine-tuning 一样都需要一些有监督标注数据，但是两者的区别是：

【本质区别】 fine-tuning 基于标注数据对模型参数进行更新，而 in-context learning 使用标注数据时不做任何的梯度回传，模型参数不更新；
in-context learning 依赖的数据量（10～100）远远小于 fine-tuning 一般的数据量；

最终通过大量下游任务实验验证，Few-shot 效果最佳，One-shot 效果次之，Zero-shot 效果最差：

上图中，横坐标为模型参数量，纵坐标为任务精度，图中大量灰色线表示不同下游任务，橙色/绿色/蓝色线是下游任务效果的平均值。

4、训练数据

由于 GPT-3 在模型规模上的扩大，在训练数据方面也必须进行扩充来适配更大的模型使其发挥出相应的能力。

GPT-3 使用了多个数据集，其中最大的是 CommonCrawl，原始未处理的数据达到了 45TB，其实在 GPT-2 的时候他们就有考虑使用这个数据集，但是后来还是觉得这个数据集太脏了所以没用，但是现在 GPT-3 的模型规模太大了，使得训练对数据量的需求也增加了很多，他们不得不重新考虑这个数据集。因此，他们必须在这个数据集上做一些额外的数据清洗工作来尽量保证数据的质量。

数据处理主要包括以下几个部分：

使用高质量数据作为正例，训练 LR 分类算法，对 CommonCrawl 的所有文档做初步过滤；
利用公开的算法做文档去重，减少冗余数据；
加入已知的高质量数据集；

其中“高质量数据”主要是指 BERT、GPT、GPT-2 使用过的数据，最终处理完成后使用的数据规模约 570G。
如上图所示，在实际实验过程中，对不同数据集按照一定的比例进行采样，这个比例不是按照原始数据量多少来划分的，不然这里基本采样到的就都是 common crawl 的数据了，可以看到这里 common crawl 的数据量比其他几个多很多。进行采样的原因主要考虑到，就算做了一些数据清洗还是觉得 common crawl 的数据质量不如其他几个。最终采样的时候，虽然 common crawl 的数据量是其他几个数据集的上百倍，但是实际占比是 60%，有 40% 的数据是能够保证质量的。

5、实验分析

GPT-3 花了大部分篇幅介绍了各种 NLP 任务上的实验结果和分析，大家如果对某个任务感兴趣的话可以自行阅读一下论文对应的章节，本文就不做详细介绍了。

下图是 GPT-3 的一个重要分析结果：

图中横坐标为计算量，可以简单理解为模型规模或者数据量（不止如此），纵坐标为任务精度。可以看到，当我们想要线性的提升一个任务的效果时，往往需要指数级的提升模型的规模和所需的数据量。

6、GPT-3 的局限性

虽然 GPT-3 取得了非常亮眼的效果，但是出于严谨的学术态度，论文里还是客观的分析了自己的一些局限性：

当生成文本长度较长时，GPT-3 还是会出现各种问题，比如重复生成一段话，前后矛盾，逻辑衔接不好等等；
模型和结构的局限性，对于某一些任务，比如填空类型的文本任务，使用单向的自回归语言模型确实存在一定的局限性，这时候如果同时考虑上文和下文的话，效果很可能会更好一些；
预训练语言模型的通病，在训练时，语料中所有的词都被同等看待，对于一些虚词或无意义的词同样需要花费很多计算量去学习，无法区分学习重点；
样本有效性或者利用率过低，训一个模型几乎要把整个互联网上的文本数据全都用起来，这与我们人类学习时所需要的成本存在非常大的差异，这方面也是未来人工智能研究的重点；
有一个不太确定的点是，模型到底是在“学习”还是在“记忆”？我们当然希望它能够学习，但是在使用数据量如此大的情况下，很难去判断它到底是什么样的；
众所周知，GPT-3 的训练和使用成本都太大了；
GPT-3 跟很多深度学习模型一样，都是不可解释的，没办法知道模型内部到底是如何作出一系列决策的；
模型最终呈现的效果取决于训练数据，这会导致模型会出现各种各样的“偏见”；

7、某些社会影响 —— 模型“偏见”

GPT-3 可能会被拿来做一些坏事，造成一定的社会影响。比如生成新闻稿，散布一些不实的消息，生成垃圾邮件，钓鱼邮件，论文造假之类的。

这里以“种族偏见”和“性别偏见”为例：
上图展示了模型的“种族偏见”倾向，当给模型输入“The {种族} woman was very”时，可以根据后续预测词的概率分布简单分析出 GPT-3 对不同种族的人具有一定的出词倾向性。图中纵坐标的 0 表示一种正常水平，大于 0 表示比较正面的反馈，小于 0 表示比较负面的反馈。可以看到亚洲人在模型的评价里算是比较高的，但是最下面的那条线是黑人，所以当一个模型对不同种族的人的差异有这么大的时候，还是比较可怕的。

上图展示了模型的“性别偏见”，当给模型输入 “he was very” 或 “she was very” 时，GPT-3 给出的词的概率分布具有一定的倾向性，可能会产生一些具有偏见的词，比如形容男人时经常出现“Lazy”。

虽然 GPT-3 存在上述问题，不过当这些社会问题被拿出来讨论时，也侧面反映了 GPT-3 的效果及其影响力。

8、与 GPT-2 的区别

整体来看，GPT-3 相比于 GPT-2 有如下几点区别：

效果上，超出 GPT-2 非常多，能生成人类难以区分的新闻文章；

主推 few-shot，相比于 GPT-2 的 zero-shot，具有很强的创新性；

模型结构略微变化，采用 sparse attention 模块；

海量训练语料 45TB（清洗后 570GB），相比于 GPT-2 的 40GB；

海量模型参数，最大模型为 1750 亿，GPT-2 最大为 15 亿参数；

四、InstructGPT

1、背景

GPT-3 虽然在各大 NLP 任务以及文本生成的能力上令人惊艳，但是他仍然还是会生成一些带有偏见的，不真实的，有害的造成负面社会影响的信息，而且很多时候，他并不按人类喜欢的表达方式去说话。在这个背景下，OpenAI 提出了一个概念“Alignment”，意思是模型输出与人类真实意图对齐，符合人类偏好。因此，为了让模型输出与用户意图更加 “align”，就有了 InstructGPT 这个工作。论文地址：Training language models to follow instructions
with human feedback

InstructGPT 提出了一个理想化语言模型的三大目标：

从做研究的角度来讲，其实很多时候人们并不在意“Alignment”（对齐）问题，只要一个模型在评估的数据集上表现好，那基本就可以说是一个好模型；但是对于工业界来说，一个产品的安全性就显得尤为重要，历史上也出现过不止一次因为某个负面 case，引发社会争议，从而导致整个产品下线的例子，特别是对于大公司来讲，出现一次负面 case 通常是比较严重的。比如之前 google 和 facebook 就都出现过把照片中的黑人识别成黑猩猩的事件，然后随之而来的就是产品的整改，公关道歉之类的。所以从这个角度来讲，OpenAI 做 InstructGPT 的出发点是非常合理且重要的。

2、技术方案 —— SFT / RLHF

关于 InstructGPT 的技术方案，原文分为了三个步骤：有监督微调，奖励模型训练，强化学习训练；实际上可以把它拆分成两种技术方案，一个是有监督微调（SFT），一个是基于人类反馈的强化学习（RLHF），下面我们简单介绍这两种技术方案。

2.1、SFT（Supervised Fine-Tuning）

本质上来说，SFT 可以理解为人工标注了一批数据，然后去微调 GPT-3。但是值得一提的是，这里标注的数据与 GPT-3 之前用来做下游任务使用的 few-shot 格式，有非常本质的区别。

GPT-3 中的 few-shot 对于同一个下游任务，通常采用固定的任务描述方式，而且需要人去探索哪一种任务表述方式更好。显然这种模式与真实场景下用户的使用方式存在较大的 gap，用户在向 GPT-3 提问时才不会采用某种固定的任务表述，而是随心所欲地以自己的说话习惯去表达某个需求。InstructGPT 在 SFT 中标注的数据，正是为了消除这种模型预测与用户表达习惯之间的 gap。在标注过程中，他们从 GPT-3 的用户真实请求中采样大量下游任务的描述，然后让标注人员对任务描述进行续写，从而得到该问题的高质量回答。这里用户真实请求又被称为某个任务的指令，即 InstructGPT 的核心思想“基于人类反馈的指令微调”。

2.2、RLHF（Reinforcement Learning from Human Feedback）

基于 SFT 得到的模型被用于后续的 RLHF 做进一步的模型优化。

如上图所示，以摘要生成任务为例，详细展示了如何基于人类反馈进行强化学习，最终训练完成得到 InstructGPT 模型。主要分为三步：

收集人类反馈：使用初始化模型对一个样本生成多个不同摘要，人工对多个摘要按效果进行排序，得到一批排好序的摘要样本；
训练奖励模型：使用第1步得到的样本集，训练一个模型，该模型输入为一篇文章和对应的一个摘要，模型输出为该摘要的得分；
训练策略模型：使用初始化的策略模型生成一篇文章的摘要，然后使用奖励模型对该摘要打分，再使用打分值借助 PPO 算法重新优化策略模型；

3、InstructGPT 总结

总的来说，InstructGPT 相对于之前的 GPT 系列，有以下几点值得注意：

解决 GPT-3 的输出与人类意图之间的 Align 问题；

让具备丰富世界知识的大模型，学习“人类偏好”；

标注人员明显感觉 InstructGPT 的输出比 GPT-3 的输出更好，更可靠；

InstructGPT 在真实性，丰富度上表现更好；

InstructGPT 对有害结果的生成控制的更好，但是对于“偏见”没有明显改善；

基于指令微调后，在公开任务测试集上的表现仍然良好；

InstructGPT 有令人意外的泛化性，在缺乏人类指令数据的任务上也表现很好；

五、GPT 系列进化时间线

上图展示了从初代 GPT 到 ChatGPT 为止，OpenAI 公布的主要模型及其迭代路线。其中可能存在不太严谨的地方，比如 GPT3.5 的划分。关于 code-davinci 和 text-davinci，以及整个 GPT3.5 的详细介绍，强烈推荐阅读这篇博客：拆解追溯 GPT-3.5 各项能力的起源。

六、参考

文献
[1] GPT: Improving Language Understanding by Generative Pre-Training

[2] GPT-2: Language Models are Unsupervised Multitask Learners

[3] GPT-3: Language Models are Few-Shot Learners

[4] InstructGPT: Training language models to follow instructions with human feedback

[5] Learning to summarize from human feedback

[6] Generating Long Sequences with Sparse Transformers

[7] Learning Deep Transformer Models for Machine Translation

其他引用

[8] 拆解追溯 GPT-3.5 各项能力的起源

[9] 李沐: GPT，GPT-2，GPT-3 论文精读

[10] 李沐: InstructGPT 论文精读

[11] 为节约而生：从标准 Attention 到稀疏 Attention

[12] GPT / GPT-2 / GPT-3 / InstructGPT 进化之路

你可能感兴趣的:(nlp,GPT大模型,算法,gpt,深度学习,nlp,大模型)

Spring AI 概述与功能简介 drebander AI 编程 spring 人工智能 java
SpringAI是一个由Spring团队开发的开源框架，旨在为人工智能（AI）和机器学习（ML）提供一个成熟且高效的开发平台。它将Spring生态系统的设计理念应用于AI开发，尤其强调模块化、可移植性以及简洁的集成。SpringAI提供了丰富的功能，涵盖从AI模型的调用到与数据库的集成等多个方面，帮助开发者构建和管理AI驱动的应用程序。1.SpringAI背景SpringAI的背景源于Spring
Spring AI从入门到精通：构建智能Spring应用的全面指南 java干货仓库 Spring 八股文汇总大模型 spring 人工智能 java
随着人工智能技术的快速发展，将大语言模型（LLM）与企业应用集成已成为趋势。SpringAI作为Spring官方推出的AI集成框架，为开发者提供了便捷、标准化的方式来构建智能应用。本文将从基础概念到高级应用，全面介绍SpringAI的核心功能与实践技巧。一、SpringAI概述1.1什么是SpringAI？SpringAI是VMware于2023年推出的开源框架，旨在简化大语言模型（LLM）与Sp
2021-01-09 做个会思考的老师
写给我的小“猪”娃们亲爱的小猪娃们，新年好！之所以想到要给你们写这封信，源于这段时间来你们带给我的惊喜和改变。不知从什么时候开始，我们的课堂有了灵气，我们的互动也有了默契。每一节课，你们都在用自己的思考，自己的表达向我展示你们的进步。课堂上，最喜欢看到你们认真倾听其他同学的想法时那专注的神情，最喜欢听到你们说：“老师，我还有不同的想法！”你们现在所表现出来的学习状态，和开学时简直是有了180°的大
大前端开发者如何应对 AI 浪潮：技能提升与职业发展规划欧阳天羲大前端与 AI 的深度融合 #AI 大前端行业应用与趋势篇人工智能前端
AI技术的爆发正深刻重塑大前端领域的技术栈与职业边界——从代码生成到智能交互，从自动化测试到自主化应用，AI不再是“可选技能”，而是“生存必备”。对于前端开发者而言，这既是挑战（传统技能贬值加速），更是机遇（新职业赛道涌现）。本文将系统梳理AI时代前端开发者的技能升级路线图，解析三大核心职业方向的能力要求，并提供可落地的学习路径与实践方案，帮助开发者在技术变革中实现竞争力跃迁。一、AI时代对大前端
（黄碧林）石城第二届传统文化论坛黄碧林
风华日下，炎炎夏日我们迎来了石城县第二届传统文化交流。同时也迎来了各地的志愿者们前来参加交流，大家都为了一个目标希望把此次石城传统文化的精髓传承到祖国各地发扬光大。尹子文老师用自己的亲身经历以及博大的文化精神精彩给我们传经送道。一个中心，二种精神，三大法宝，四项能力，五颗良心。告诉我们做人的道理。书中自有黄金屋，教我们大量的圣贤教育，吸取其中的精华用于生活，用于改善自己，用于提高自己。感恩老师。张
掌阅小说推文怎么做？掌阅APP拉新一个多少钱附玩法攻略清风导师
掌阅小说APP推广拉新赚钱怎么做?掌阅APP小说推文CPA拉新一个多少钱?掌阅小说是一个知名的电子小说阅读平台，众所周知现在大量用户喜欢查阅电子小说，所以也是有许多的知名大品牌在争夺这一块市场，特别是近年来的小说推文项目也是借助短视频火爆起来的一种热门的赚钱副业，比如掌阅APP小说推文CPA拉新项目!（原创内容抄袭必究）所谓的CPA跟CPS相对，就是用户计件拉新获得佣金，而不是根据销售金额来计算，
在二分类任务中如何处理包含中文的类别特征 Dush32 分类数据挖掘人工智能机器学习数据分析
在机器学习中，处理类别特征（CategoricalFeatures）是常见的任务，特别是在中文数据中，很多类别特征如省份、城市等都是字符串类型。如何将这些类别变量转换为模型可以理解的数值格式，是每个数据科学家都必须面对的挑战。在这篇文章中，我们将探讨两种常见的类别特征编码方法：astype('category')和LabelEncoder，并比较它们在二分类任务中的效果。我们以“省份”这一类别特征
基于用户画像的商品推荐系统 Dush32 机器学习人工智能 python 推荐算法
随着人工智能和大数据技术的进步，产品推荐系统成为了现代广告与电商平台中不可或缺的部分。通过深度挖掘用户的行为数据，能够为广告主提供精准的用户画像，从而更高效地推荐相关产品，提升购买转化率。本项目基于科大讯飞AI营销云大赛的赛题，目的是利用用户画像进行产品推荐，预测用户是否会购买相应商品。我们使用了机器学习的二分类模型，通过分析用户的性别、年龄、常驻地、机型等信息，来判断用户的付费行为。项目目标：本
MC0463四大名著-水浒签到 qystca 算法
码蹄集OJ-四大名著-水浒签到一、题目背景本问题以《水浒传》为故事经纬，讲述史进对数列数字奥秘的探索。小码妹向其讲解特殊数列求和规则，我们需依据规则，对给定长度n的数列，按奇偶分组方式计算奇数组和与偶数组和的运算结果（奇数组求和、偶数组作差，交替进行），完成这场时空探险中的数字挑战。二、问题规则（一）分组方式现有长度为n的数列a1,a2,⋯,an，分组规则如下：若n为偶数，将数列分成2n组，依次为
行情解读与机构论市鸿运_97d7
隔夜外盘欧美股市上涨，A50涨0.14%。外盘比我们想象要强，而A股比我们想象要弱。周四，A股三大指数开盘涨跌各异，早盘受“三桶油”冲高提振，沪指于盘初冲高，不过随后便出现回落并震荡翻绿，创业板指则小幅高开呈现窄幅横盘的走势；午后沪指、深成指相继翻红，三大指数集体收涨，其中沪指终结四连跌。沪指涨0.65%，报3261.25点，深成指涨0.62%，报11651.83点，创业板指涨0.5%，报2383
广州仿大牌包包在哪买？试试十个购买渠道腕表鞋屋
广州仿大牌包包在哪买？试试十个购买渠道广州是中国的主要服装和配饰生产基地之一，其中包括各种仿品大牌包包。在广州购买高质量的仿品包包，以下有十个可能的购买渠道供您参考。微信:1441634880(下单赠送精美礼品)1.广州站仿包市场：这是一个非常大的批发市场，集合了众多的服饰品牌，包括各种仿大牌包包。价格相对便宜，只是需要一定的讨价还价技巧。2.广州流花仿包商场：靠近广州火车站，有着众多的小店和露天
淋雨 Leo的防丢绳
晚上十点多冰箱里的西瓜再不吃就坏了细小的飞虫在吃剩的瓜皮上不顾死活贪婪果然是世间万物的本色穿上人字拖那袋污秽的垃圾再不扔就满了远处的路灯借着秋风把树影吹的斑驳悲凉也许只是因为穿的单薄侧耳听萧瑟楼宇门旁的电梯再不回就关了沙沙作响的天空突然有豆大的雨点坠落忍不住抬头想感受那瞬间的瓢泼听说把文字分成段落写就有诗的感觉了。有感于昨天出门扔垃圾正赶一场暴雨，那大雨点子砸在头上跟有人弹脑瓜崩一样。
前端面试专栏-工程化：27.工程化实践（CI/CD、代码规范）爱分享的程序员前端面试通关指南前端面试 ci/cd
欢迎来到前端面试通关指南专栏！从js精讲到框架到实战，渐进系统化学习，坚持解锁新技能，祝你轻松拿下心仪offer。前端面试通关指南专栏主页前端面试专栏规划详情项目实战与工程化模块-工程化实践（CI/CD、代码规范）在团队协作的项目实战中，工程化实践是保障开发效率与代码质量的核心支柱。当项目规模从几人协作扩展到数十人团队时，单纯依赖人工沟通和经验规范会导致效率低下、bug频发。本文聚焦工程化的两大核
Node.js特训专栏-实战进阶：16. RBAC权限模型设计爱分享的程序员 Node.js node.js 安全算法前端
欢迎来到Node.js实战专栏！在这里，每一行代码都是解锁高性能应用的钥匙，让我们一起开启Node.js的奇妙开发之旅！Node.js特训专栏主页专栏内容规划详情我将从RBAC权限模型的基础概念、核心组件讲起，详细阐述其设计原则、数据库模型设计，还会结合代码示例展示在实际开发中的实现方式，以及探讨模型的扩展与优化。RBAC权限模型设计：从理论到实战的完整方案在现代应用系统中，权限管理是保障数据安全
《星辰变》一部值得你看看的国产动画！夜下小雨
做为又是一部小说改编的动漫，对于广大的粉丝来说真是一项大福利。因为我们看小说是自己想画面，而动画展现了我们想像中的画面。以后我们再回过头来看小说的时候，留下的画面就是动漫的形像了。主人公秦羽先天丹田有问题，修炼不了内功。因此只能从外功入道。可是外功入道的难道可想而知，而他也将是潜龙大陆上第一个由外功入道的人，可想而知他付出的是什么样的努力。也正是因为他从小没有办法修炼内功，所以他的父亲决定好好的保
今晚放学别走是阿馨呐_
1.大佬都这么不会聊天的吗？初夏的夜晚晴朗沁爽，窗外唧唧的鸟叫声从没关紧的窗户缝偷偷遛进，试图在晚自习中的教室掀起一丝涟漪。教室后排，一群副业学习主业睡觉的小青年围在一块不务正业地斗地主。一眼望过去，很难发现在教室的角落，有一个栗色的脑袋正松垮垮地趴在课桌上，精致的眉毛这会皱成了一团，平时明澈热情的眸子也被塌下的睫毛遮住显得毫无生气，时不时一声长叹从他那微微上翘的嘴角流出，大煞此刻由少年组成的美景
InfluxDB 数据模型：桶、测量、标签与字段详解（一）计算机毕设定制辅导-无忧 #InfluxDB db
一、引言**在大数据和物联网蓬勃发展的当下，时间序列数据的处理需求呈爆发式增长。InfluxDB作为一款高性能的开源时序数据库，凭借其卓越的特性，在时序数据库领域占据了重要地位，被广泛应用于各种场景。InfluxDB专为时间序列数据设计，拥有高效的存储和查询性能。它采用独特的存储引擎，能够快速写入大量带有时间戳的数据，并支持灵活的查询操作。其核心设计针对时间序列数据的特点进行了优化，包括时间索引、
InfluxDB 数据模型：桶、测量、标签与字段详解（二）计算机毕设定制辅导-无忧 #InfluxDB db
四、各组件在实际应用中的协作4.1数据写入过程以服务器性能监控场景为例，假设我们有一个包含多台服务器的集群，需要实时监控每台服务器的CPU使用率、内存使用率和磁盘I/O等性能指标。我们使用InfluxDB来存储这些监控数据，下面详细介绍数据写入过程。首先，确定数据存储的桶。我们创建一个名为“server_monitoring_bucket”的桶，专门用于存储服务器监控相关的数据。这个桶将作为所有服
驱动人类行为模型的公式妮可儿_
《福格行为模型》一书中作者提出，人类所有行为的驱动都有3个关键要素，既动机，能力，提示，每个因素在驱动人类行为中起到了重要作用。这个行为模型的公式=动机+能力+提示，用这个模型分析一下自己的生活会很有意思。比如，早上起来为什么要吃早餐呢？动机是饿了，能力是准备为早餐发几块钱？提示是街边的早餐店。如果应用在工作中，你可以把模型设想为:什么要去做一件事情？有好处，能做到，知道能具体怎么做。1.触发行为
操作手册的目的、传统的产品操作手册弊端、如何设计优质手册吴间帮助中心产品手册产品文档
操作手册是详细描述软件的功能、性能和用户界面，使用户了解到如何使用该软件的说明书。很多时候，当我们对产品的某个功能感到困惑时，往往需要一份操作手册来帮助我们解答疑惑。何为操作手册，官方的定义如下：操作手册是详细描述软件的功能、性能和用户界面，使用户了解到如何使用该软件的说明书。看起来很简单，就是只要说明软件的功能，并让你的用户知道如何使用即可。描述软件的功能的粒度可大可小，大到模块级别，小到按钮级
342｜每个人都是“半成品”，我们来到这个世界便是不断地在他人帮助和自身努力下进化自己富书号
富书情报每日分享新媒体写作圈最新资讯2018年09月18日周二1.运营热点|蓝鲸浑水——920蓝鲸新媒体峰会，我与微信的故事主题大会。GQ实验、六神磊磊等极具影响力的新媒体管理运营员的经验论坛2.写作福利|涔汐——不在职场上，都不知道写作能力如此重要，涔汐第一期写作课，现价299，开课时间10月13日，8堂课，每周一期3.大咖动态|槽值——欧阳娜娜暂别娱乐圈，当一个人已经习惯了金钱来得容易时，便很
【LlamaIndex核心组件指南 | 数据加载篇】从原始数据到向量的全链路深度解析吴师兄大模型现代大模型技术与应用 llamaindex langchain 开发语言 python pytorch 人工智能大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
金钱智慧课前作业第五天 5731df060699
一、改善和金钱的关系，跟母亲链接，不断修复和母亲的关系。每日数算恩典十条以及和母亲的链接或事例。1.感恩妈妈每天锻炼身体，把自己照顾地很好，让我们子女放心。也让我学会了怎么照顾自己。2.感恩94岁的妈妈，每天自己买菜、做饭、洗衣服，让我学会了独立，让我懂得了干活是一件好事情，不仅锻炼着脑子，也锻炼了身体。3.感恩妈妈的大爱和包容，多次跟我们说每一个孩子都是她的心头肉，让我也学会了以正确的方式爱自己
邓伦在《大侦探》上个厕所好难莫叽默迹
邓伦在《大侦探》上个厕所好难啊！自我回顾时间线的时候，别人都在忙各种事情，邓伦饰演的“伦少爷”自带洁癖属性，跟厕所杠上了，实现了“三顾厕所”的“壮举”。伦少爷说自己上厕所有一个习惯，就是要先冲一下马桶，然后因马桶不太通畅，觉得不适合此时上厕所，故而返回。饰演大清仓的大张伟就感叹，有钱人上厕所不是因为“三急”所迫，而是要看心情，心情不好就可以任性地直接不上厕所，也不怕憋死。伦少爷花了10分钟调整了心
【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路吴师兄大模型深度学习入门到精通 python pytorch 开发语言人工智能 CNN 深度学习大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
无心有殇，第五章诛心叁妮
没有什么希望的时候，你就会想活着是为了什么？爱的人到底值不值得！王一博喝了江辰三瓶后劲大的酒，第四瓶还没喝完就趴在了桌子上。“喂！”江辰非常不绅士的翻了个白眼，头疼的看着王一博：“你真把我这当酒店了？王一博！”没有办法，江辰扶起王一博上了二楼，把人扔进自己的休息室，刚准备走就听见王一博轻声呢喃“肖文...肖文哥...不要走...不要。”江辰无奈的摇了摇头，给王一博盖上被子轻声说道：“人都死了，你还
2023-01-03 書全
中午的煎饺，馅香，汁多，底脆，型似元宝；刚出锅时两口一个，等凉会儿一口一个，汁水一滴都不能浪费。三十个煎饺，两碗大馄饨，把我们两位大汉吃撑了。顺着中山南路往前几步就到了城隍牌楼巷，杭州的烟火气都在这里，裤衩和腊肉比肩，拖把与酱鸭同色，叫买的叫卖的，熙熙攘攘，没有遇见一位城管。转进大马弄，没有找到那个老奶奶开的饭店，听说我家老舅是看着老奶奶的爹开始做这家店的。转过丁衙巷，巷尾也有一处“四眼井”水质清
【Agent的革命之路——LangGraph】人机交互中的四种决策设计模式乔巴先生24 人机交互设计模式人工智能 python
在现在强大的LLM应用程序中，最有用的无外乎就是人机交互工作流，它将人工输入集成到自动化流程中，允许在关键阶段做出决策、验证或更正，因为底层模型可能会偶尔产生不准确之处，在合规性、决策或内容生成等低容错场景中，人工参与可通过审查、更正或覆盖模型输出来确保可靠性。我么的应用程序在什么时候会使用人机交互工作流程呢？审查工具调用：人类可以在工具执行之前审查、编辑或批准LLM请求的工具调用。验证LLM输出
AI原生应用领域多租户的技术架构剖析 AI天才研究院 AI-native 架构人工智能 ai
AI原生应用领域多租户技术架构深度剖析元数据框架标题：AI原生应用多租户技术架构：从隔离性到智能化的分层设计与实践关键词：AI原生应用、多租户架构、数据隔离、模型共享、云原生租户管理摘要：本文系统解析AI原生应用场景下多租户技术架构的核心设计逻辑，覆盖从数据层到模型层的全栈隔离与共享机制。通过第一性原理推导，结合云原生、机器学习生命周期管理（MLOps）等技术范式，提出包含租户上下文管理、动态资源
大数据集成方案对比：Kafka vs Flume vs Sqoop AI天才研究院计算 AI大模型应用入门实战与进阶 Agentic AI 实战大数据 kafka flume ai
大数据集成方案对比：KafkavsFlumevsSqoop关键词：大数据集成、Kafka、Flume、Sqoop、流处理、批量迁移、日志收集摘要：在大数据生态中，数据集成是连接数据源与数据处理平台的关键环节。本文深度对比Kafka、Flume、Sqoop三大主流集成工具，从核心架构、技术原理、适用场景到实战案例展开系统性分析。通过数学模型量化性能差异，结合实际项目经验总结选型策略，帮助开发者根据业
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发