汀、人工智能

大语言模型的预训练[3]之Prompt Learning：Prompt Engineering、Answer engineering、Multi-prompt learning详情

大语言模型的预训练[3]之Prompt Learning：Prompt Engineering、Answer engineering、Multi-prompt learning、Training strategy详解

1.Prompt Learning

1.1 Prompt Learning 的出现背景

目前学术界一般将 NLP 任务的发展分为四个阶段，即 NLP 四范式：：

第一范式：传统机器学习模型的范式，基于全监督学习（fully supervised learning）的方法。通过构建特征工程（feature engineering），利用领域知识从数据中提取好的特征，直接解决下游任务。例如tf-idf特征 + 朴素贝叶斯等机器算法。
第二范式：基于深度学习模型的范式，通过设计结构工程（architecture engineering），即设计一个合适的网络结构来把归纳偏置（inductive bias）引入模型中，训练一个端到端的模型，利用学习好的特征，直接解决下游任务。例如word2vec 特征 + LSTM 等深度学习算法，相比于传统方法，模型准确有所提高，特征工程的工作也有所减少。
第三范式：基于预训练模型 + finetuning 的范式，即预训练 + 微调（pre-train and fine-tune）。在这个模式中, 先用一个固定的结构预训练一个语言模型（language model, LM），预训练的方式就是让模型补全上下文（比如完形填空）。相比于深度学习模型，模型准确度显著提高，模型也随之变得更大，小数据集也可以训练出效果好的模型。
第四范式：基于预训练模型 + Prompt + 预测的范式，跟第三范式一样，先获得大型语言模型，然后通过引入额外的参数或微调来适应到下游任务上。这就逐渐形成了目标工程（objective engineering），即为预训练任务和微调任务设计更好的目标函数。如 BERT + Prompt 的范式相比于第三范式，模型训练所需的训练数据显著减少。

NLP 四个范式对比如下所示：

1.2 Prompt Learning 的定义

**Prompt Learning 就是期望预训练语言模型在下游任务中，在不显著改变预训练语言模型结构和参数的情况下，通过向模型输入增加 “提示信息”，只需要模型本身就能够解决问题。**即通过为输入内容添加额外的文本 (重新定义任务) 的方式，来更好的挖掘预训练语言模型本身能力的一种方法。

传统的监督学习任务，是去训练一个模型 P(y|x)，接收 x 作为输入，去预测 y。Prompt learning 是**依赖于预训练语言模型 P(x)，通过引入合适的模版将输入 x 调整为完形填空格式的 x’，调整后的输入 x’里含有空槽，利用语言模型 P 将空槽填充后就可以推断出对应的 y。**例如，对于情感分析任务，传统的做法就是训练一个判别模型，去预测输入 x 对应的标签是 positive 或者 negative，但是如果是 prompt learning，则是利用合适模版，将输入 x 调整为 [x], it is [z]。然后作为语言模型的输入去预测相应 z 的取值，如果 z 是 positive 相关的词，就表示原始输入 x 是 positive，反之就是 negative 的。

Prompt learning 包括三个部分，分别是 prompt addition，answer search， answer mapping。

Prompt addition

选择合适的模版，定义函数 fprompt(x)，可以将原始的输入 x 转化为 x‘，即 fprompt(x)=x’。经过该函数转化得到的输入都是带有空槽，这个位置一般在句中或者句末，位置以及数量都可能对结果造成影响，需要人工构造，空槽上的预测值会直接决定最后的结果。

模板是：【X】Overall,it was a 【Z】 course。
【Z】在句中，这种 prompt 称为 cloze prompt。
如果在句末，则这种 prompt 称为 prefix prompt。

另外，这里的模版不仅仅可以是离散化的 token，也可以连续的向量。在不同的下游任务，可以灵活调整，选择合适的模版。
Answer search

Answer search 指的是从所有可能的候选槽值进行搜索，然后选择合适的槽值填充到对应的空槽里。这里槽值的所有可能结果的集合为 Z，对于生成任务而言，Z 包括所有的 token，但是对于分类任务而言，Z 只包含跟特定分类任务相关的一部分 token。例如对于之前那个例子而言，Z={positive 相关的词语，negative 相关的词语}
Answer mapping

当通过 answer search 得到合适的槽值时，需要根据槽值推断最终的预测结果。这部分比较直接，假如是生成任务，那么填充的槽值就是最终的结果。但如果是分类任务，就需要根据相应的槽值归纳到具体的类中。例如情感分类中，如果把跟 positive 相关的槽值都归类到 positive 一类，把跟 negative 相关的槽值归类到 negative 一类中。

Prompt Engineering 的核心思想，主要就是将已有的下游 NLP 任务重构成 token 级的预测任务，在不改变原有的 pre-trained LM 的前提下（也就是说不进行 fine tuning）直接将 LM 应用的过程，换言之，是在用下游任务适配 LM。融入了 Prompt 的模式大致可以归纳成 “Pre-train, Prompt, and Predict”，在该模式中下游任务被重新调整成类似预训练任务的形式。

1.3 Prompt Learning的方法

在了解 prompt learning 的基本组成后，有以下几个方面都会影响 prompt learning 的最终效果。

Prompt engineering，设计合适的模版函数，是整个 prompt learning 的第一个步。
预训练语言模型的选择，预测空槽位置上的答案依赖于预训练语言模型的得分，同时预训练语言模型又有 4 大类。
Answer engineering，构建一个合适的答案候选集以及一个从答案到最终结果的映射。
Expanding the paradigm，基于基础的 prompt learning 去扩展，包括 multi prompt 等。
Training strategy，选择训练策略，去训练一个合适的模型。

1.4 Prompt engineering

Prompt engineering 是创建 prompting 函数 $f p ro m pt (x)$ 的过程，即构建一个合适的模版函数，使下游任务能取得最高效的表现。Prompt learning 利用预训练语言模型去预测最终结果，那么如何将输入 x 转化为语言模型擅长处理的样式就是 Prompt engineering 的工作。一个不合适的 prompt function 会导致语言模型不能做出令人满意的预测。

根据【Y】的位置 Promp shape 可以分为填充文字字符串空白的完形填空（cloze prompt）和用于延续字符串前缀的前缀（prefix prompt）。
对于有关生成任务或使用标准自回归 LM 解决的任务，使用 prefix prompt，因为与模型从左到右的性质吻合。PS:“I’m not sure I understand this point。Please continue to write:【Y】”
对于使用掩码（Mask）LM 解决的任务（ps.BERT）,cloze prompt 更合适，因为与预训练任务的形式匹配。PS:“The course taught by the teacher is easy to understand. Overall it was a 【Y】course“

为了最终任务的效果，需要根据语言模型和下游任务的特性，去构建合理的 prompt。构建 prompt 方式有三种：

1) 人工构建
**Prompt learning 最直接的方式是通过专业人士的经验知识构建合理的 prompt，给模型增加合适的提示。**通过人工构建的 prompt，由于附带人的专业知识，非常直观理解，过程简单，效果相对可控，可供快速尝试。能支持强大预训练模型实现 few shot 甚至 zero shot，媲美那些有监督学习的方法。同时，人工构建 prompt 的方式有很广泛的应用，可以直接去支持下游任务，也可以辅助半监督学习方法去构建数据集，做数据增强等等。人工构建 prompt 的方式，作为一种简单有效的方式，也验证了 prompt learning 的价值，减轻了对有监督数据的依赖，提供了一个将庞大的预训练模型应用到众多下游任务的方向。

虽然这种方式直观，但是**人工构建 prompt 的方式有两个弊端，一方面人工构建 prompt 和测试 prompt 效果耗费时间跟精力，另一方面是即便是专业人士也不一定能通过人工的方式构建最优的 prompt。**为了解决这个问题，自然而然就衍生自动构建 prompt 的方式，自动构建 prompt 可以分为离散型的 prompt（prompt 可以用具体的字符表示）和连续型的 prompt(prompt 由向量替代)。
2) 离散型 prompt
- **离散 Prompts 指的是自动生成由自然语言的词组成的 Prompt，因此其搜索空间是离散的。**通常是先由人工构建，然后可以通过种子 prompt 去扩充，也可以通过生成方式去获取。在构建得到 prompt 候选集后，可以在下游任务上评估，也可以通过语言模型去打分。最终可以只选择最合适的一种 prompt，也可以集成多个 prompt。离散的主要包括 Prompt Mining, Prompt Paraphrasing, Gradient-based Search, Prompt Generation 和 Prompt Scoring。
- Prompt Mining. 该方法需要一个大的文本库支持，例如 Wikipedia。给定输入 x 和输出 y，要找到 x 和 y 之间的中间词或者依赖路径，然后选取出现频繁的中间词或依赖路径作为模板，即 “[X] middle words [Z]”。
- Prompt Paraphrasing. Paraphrasing-based 方法是基于释义的，主要采用现有的种子 prompts(例如手动构造)，并将其转述成一组其他候选 prompts，然后选择一个在目标任务上达到最好效果的。一般的做法有：将提示符翻译成另一种语言，然后再翻译回来；使用同义或近义短语来替换等。
- Gradient-based Search. 梯度下降搜索的方法是在单词候选集里选择词并组合成 prompt，利用梯度下降的方式不断尝试组合，从而达到让 PLM 生成需要的词的目的。
- Prompt Generation. 既然 Prompt 也是一段文本，那是否可以用文本生成的方式来生成 Prompt 呢？该类方法就是将标准的自然语言生成的模型用于生成 prompts 了。例如，Gao 等人将 T5 引入了模板搜索的过程，让 T5 生成模板词；Ben-David 等人提出了一种域自适应算法，训练 T5 为每个输入生成一种唯一的域相关特征，然后把输入和特征连接起来组成模板再用到下游任务中。
- Prompt Scoring. Davison 等人在研究知识图谱补全任务的时候为三元组输入（头实体，关系，尾实体）设计了一种模板。首先人工制造一组模板候选，然后把相应的 [X] 和[Z]都填上成为 prompts，并使用一个双向 LM 给这些 prompts 打分，最后选取其中的高分 prompt。
3) 连续型 prompt
构造 Prompt 的初衷是能够找到一个合适的方法让 Pre-trained Language Model（PLM）更好地输出我们想要的结果，但其实并不一定要将 Prompt 的形式设计成人类可以理解的自然语言，只要机器理解就行了。连续性 prompt 可以摆脱人类理解的自然语言，直接作用到模型的 Embedding 空间，通过梯度更新优化。由于可以进行梯度优化，它的效果通常优于离散型 prompt，而离散型 prompt 由于不可导只能采用近似梯度或其他方式去优化。

连续型 prompt 的初始化很重要，一般会采用合理的 token 进行初始化，这些 token 可以是手工设计的离散型 prompt。模版中词语的 Embedding 可以是整个自然语言的 Embedding，不再只是有限的一些 Embedding 模版的参数不再直接取 PLM 的参数，而是有自己独立的参数，可以通过下游任务的训练数据进行调整。

连续 Prompts 相比于离散 Prompts 来说不再拘泥于人类可以理解的语言，会将机器可以理解的向量 embedding 也作为 Prompt 模板。目前的连续 prompts 方法大致可以分为下面三种：
- Prefix Tuning. 在输入前添加一串连续的向量的方法，该方法保持 PLM 的参数不动，仅训练合适的前缀（prefix）。freeze 预训练参数，单纯调参每一层前缀提示向量参数。它的形式化定义是，在给定一个可训练的前缀矩阵Mφ和一个固定的参数化为θ的 PLM 的对数似然目标上进行优化，即：maxϕlogP(y∣x;θ;ϕ)=maxϕΣyilogP(yi∣h 其中 h指的是所有神经网络层在第 i 个时间步的连接。如果对应的时间步在前缀中，即hiisMϕ[i], 则它可以直接从前缀矩阵中复制过来；否则需要使用 PLM 进行计算。类似地，输入序列前面加上特殊的 token 来组成一个模板，然后直接调整这些 token 的 embedding。和上面的 Prefix Tuning 的方法相比，他们的方法相对来说参数较少，因为没有在每一层网络中引入额外的参数。

 
  2. 预训练语言模型的选择 
   
   Left-to-Right LM: GPT, GPT-2, GPT-3 
   Masked LM: BERT, RoBERTa 
   Prefix LM: UniLM1, UniLM2 
   Encoder-Decoder: T5, MASS, BART 
   
  3.Answer engineering 
  **Answer engineering 旨在寻找一个合适的答案空间 Z 以及一个从答案到最终输入 y 的一个映射，从而得到一个有效的预测模型。Prompt learning 之所以能实现 few shot 甚至 zero shot，是依仗于预训练语言模型强大的泛化能力。**但是语言模型在预测时都是针对全词表的，对于下游任务而言并不一定需要全词表的，例如情感分析任务下如果预测到人称代词时要怎么推断最终结果的情绪呢？为此，Answer engineering 要去寻找一个跟下游任务匹配的答案空间，也就是构建候选集，并定义好答案空间到最终输出之间的映射，候选词跟最终输出的对应关系。 
  Answer 的形式决定了它的任务，常见的选择包括：
 Token：预训练 LM 词汇表中的一个 token，或者词汇子集；
 Span：短的 multi-token span，这些通常与 cloze prompt 一起使用；
 句子或文档：通常与前缀 prompt 一起使用。 
  Token 跟 Span 的情形多见于分类相关任务，句子或文档多见于生成相关任务。答案空间同样可以通过人工构建，也可以通过模型去搜索查找。大部分的方法构造的候选集都是离散化的，只有很少部分方法是连续化的。与 prompt engineering 相同，answer engineering 同样有人工设计与自动获取两种方法。 
   
    人工设计答案： 人工设计分为两类 空间。Unconstrained spaces 中的空间包含了输出空间的所有结果，token 级的话则是全部词表中的词 (比如 W2V 的输出层)，其余类型相同。这类方法可以直接找到 Z 与 y 的映射关系。Constrained spaces，这类方法通常输出是在一个限定范围内 (比如 positive 和 negative)，这类方法就需要一个映射关系来映射 Z 与 y。特点: 直观，自然，费力，经验。
  
    自动学习答案： 人工设计 answer 的方式最终很有可能在获得一个次最优的语言模型，通过人工设计 answer 的方式依旧依赖于专业人士的知识，不容易迁移到更多场景。基于此，出现了一些自动设计 answer 的工作。 
     
      1)Answer paraphrasing：首先初始化一个答案空间然后用这些答案的释义去扩充答案空间直至收敛。这种扩充 answer 的方式可以理解为单个的答案候选可能不太稳定，如果语言模型对它理解不到位会导致最后结果偏差较大，所以通过回译的方式扩充答案空间从而获得每个类别的多个候选表达，综合考虑模型对多个候选表达的预测结果会得到更加鲁棒的结果。最终实验也证明了通过这种方式得到的多样化的表示可以有效提高语言模型在多选 QA 问题的表现。
  
      2)Prune-then-search：先对答案候选空间进行裁剪，然后再通过算法去搜索得到最终合适的答案候选。
  
      3)Label Decomposition：由于类别标签已经包含了很多真实的语义信息，所以 Adaprompt 直接将类别标签分解为多个 token 作为该类别的候选答案，例如一个类别是”per: city_of_death”，把这里一些没有语义的连接词 (例如 of) 去掉后，从而得到对应的候选答案是{person, city, death}。
  
      4) 连续型答案自动搜索：这类工作较有代表性的 WRAP 在词嵌入部分为每个类别指定了一个连续的变量去表征这个类别，然后通过梯度回传去更新这个表征类别的词嵌入。
  
    
  
   
  4.Multi-prompt learning 
  以上的 prompt 工程方法主要集中于为输入构建单个 prompt。相对于单个 prompt，多个 prompt 往往能提高 prompting methods 的有效性。常见的多个 prompt 的方法有以下几种类型。 
   
    a) Ensemble
 多个 prompt，每个 prompt 都按照单 prompt 的方法并行进行，然后再把最终的结果汇总，可以通过加权或者投票的方式汇总多个单 prompt 的方法的结果。 
     
     可以利用不同 prompt 的优势实现互补。 
     可以缓解 prompt engineering 中寻找一个最优 prompt 的繁重工作。 
     可以在下游任务表现得更加稳定。 
    
  
    b) Augmentation
 又称为模仿学习，它的思路跟 GPT2 的 few shot 做法极为相似，就是给出一些完整的样例（[MASK]位置被正确预测了的完形填空格式，也称 answered prompt），跟当前的完形填空格式一同输入语言模型，这样语言模型就会按照完整的样例，举一反三，对当前问题的 [MASK] 位置做出更加准确的预测。增强的方式其实就是找一个跟当前问题相似的 case，然后将这个 case 跟当前输入 x‘一起输入，这种模型就可以根据那个 case 对 x‘做出更精准的预测了。
  
    c) Composition
 所有可组合的语言任务可以由多个基本的子任务组成，prompt composition 利用多个子 prompt 构建 prompt 函数，每个子 prompt 针对一个子任务，把多个 prompt 的内容融合到一起，可以定义更加复杂的 prompt，同时进行多个子任务的预测。例如关系抽取任务，有的 prompt 负责实体识别，有的 prompt 负责判断实体间的关系。
  
    d) Decomposition
 跟 prompt composition 刚好反过来，对于有些问题，想通过定义一个完整的 prompt 去解决会非常具有挑战，于是一个直观的做法就是将这个问题分解为多个问题，分别定义多个子 prompt 去分别处理。例如命名实体问题，可以将文本划分为多个片段，然后用各个子 prompt 分别去识别这些片段是否是实体或者对应的是实体类型，最后汇总所有片段的结果即可。prompt composition 跟 prompt decomposition 都是需要明确问题是由哪些子任务组成的，设计完相应的子 prompt 后再根据具体场景决定是用分解还是组合的方式解决。
  
   
  5.Training strategy 
  在大部分情况下，prompt learning 可以在不经过任何语言模型的显示训练下直接应用到下游任务中。如同典型的 zero shot，通过跟下游任务相关的 prompt，将原始文本转化为带 [MASK] 标记的完形填空问题，用语言模型直接去预测 [MASK] 位置的 token。整个过程不涉及训练，也不需要另外的训练数据。 
  然而，有一定训练数据的加持能进一步提升模型的效果，所以也衍生跟 prompt learning 相关的一些训练策略，尤其是对于 few shot learning，加入一点点相关训练数据的训练可以驱使模型往正确的方向演变，从而更加有效。对于 prompt learning 相关的方法一般有两部分参数，一部分是预训练语言模型自身的参数，另一部分是跟 prompt 相关的参数，那类参数应该更新是一项重要的设计决策。 
  研究者基于底层语言模型的参数是否需要调整、是否有额外的 prompt 参数和这些额外的 prompt 参数是否需要调整这三个方面总结以下调整策略, 把可能的参数更新方法分为 5 种类型。 
   
    a)Prompt fine-tuning
 首先乱入的是跟 prompt learning 没有任何关系的方法，也是常见的 finetune，这种类型的方法不涉及 prompt，不需要 prompt 相关设计，也没有 prompt 相关的参数。这种类型的方法最大的短板在于对训练数据量有一定要求，这就限制了它在低资源场景下的广泛应用。 
     
     优势：简单，不需要另外设计 prompt，直接在训练数据上调整语言模型的参数即可。 
     劣势：训练数据不足时容易过拟合或者不稳定。 
    
  
    b)Tuning-free Prompting
 这种类型的方法其实就是 GPT 中的 zero shot，不需要训练数据，没有训练过程，基于 prompt 直接生成答案，无需调参。之前提及的离散型 prompt 自动构建或者人工构建 prompt 的方法多属于这种类型。 
     
     优势：高效，不需要参数更新过程，固定语言模型参数，可以在下游任务直接 zero shot。 
     劣势：需要准确的 prompt 设计。 
    
  
    c)Fixed_LM Prompt Tuning
 引进了额外的跟 prompt 相关的的参数，通过固定语言模型参数，去微调跟 prompt 相关的参数，使下游任务更好作用于 prompt 的产生。之前介绍过的连续型 prompt 的自动构造相关的方法基本都属于这种类型。 
     
     优势：适合小样本学习，跟 tuning-free prompting 类似，能够保留语言模型的知识，并且适用于 few shot 场景，效果也会比 tuning-free prompting 好。 
     劣势：不适用于零样本学习，prompt engineering 相关工作很重要，微调得到的 prompt 也基本不是人能理解和掌握的。 
    
  
    d)Fixed-prompt LM Tuning
 跟 Fixed-LM Prompt Tuning 相反，同样会引入额外的跟 prompt 相关的参数，但是会固定跟 prompt 相关的参数，只微调语言模型自身的参数。如果使用离散型 prompt 并据此进一步优化语言模型参数的话就属于这种类型的方法。 
     
     优势：prompt engineering 跟 answer engineering 更完整的说明了任务，更适用于 few shot 场景。 
     劣势：严重依赖于 prompt engineering 和 answer engineering 的效果，最终效果可能不及没有使用 prompt 的方法。 
    
  
    e)Prompt+LM Tuning
 Prompt 相关参数跟语言模型自身参数都进行微调，跟常规的预训练语言模型微调很像，新增的 prompt 可以在模型的训练开始时提供一种增强策略，适合大数据集，小数据集易过拟合。 
     
      优势：最具表达能力的模型，适用于有充足数据的场景。
  
      劣势：需要一定的训练，对数据量有一定要求，需要存储所有模型的参数，包括语言模型自身的参数和跟 prompt 相关的参数。
  
    
  
   
  在训练条件充足的条件下，prompt learning 相对于常规的 finetune 没有明显优势，prompt learning 的价值还是体现在 few shot 甚至 zero shot 场景下。同时可以看到对于不微调 prompt 相关参数的方法，模型效果都严重依赖于 prompt engineering 和 answer engineering。对于那些可以微调 prompt 相关参数的方法，又对于训练数据量有一定要求，如果连语言模型的参数也要调整的话，那么就需要更多的训练数据。所以对于 few shot 场景，由于训练数据量限制，选择固定语言模型参数只微调 prompt 相关参数的方法更受青睐，对于每一个具体下游任务只需要保存 prompt 相关的参数即可，也为 prompt learning 的大范围应用提供了可能。 
  6.小结 
  Prompt learning，充分利用了预训练语言模型强大的泛化能力，极大的减少了对下游任务有监督数据的依赖，能实现 few shot 甚至 zero shot，对于当下数量众多的 NLP 下游任务，有很大的应用前景。但是关于如何构建 prompt，如何选择语言模型，构建候选答案空间，构建答案到最终输出的映射，如何选择训练策略，如何寻找一个最佳配置使得下游任务效果达到最优，依旧是个需要持续探索的事情。Prompt learning 是包括众多环节的一个学习任务，包括 prompt engineering, answer engineering, tuning strategy, pretrain language model, multi prompt learning 等，每个环节都有若干种不同的选择，如何在如此繁多的可能性中搜索一个最优的组合确实是需要持续探索的事情。 
  6.1 Prompt Learning 使得所有的 NLP 任务成为一个语言模型的问题 
   
   Prompt Learning 可以将所有的任务归一化预训练语言模型的任务 
   避免了预训练和 fine-tuning 之间的 gap，几乎所有 NLP 任务都可以直接使用，不需要训练数据。 
   在少样本的数据集上，能取得超过 fine-tuning 的效果。 
   使得所有的任务在方法上变得一致 
   
  6.2 Prompt Learning 和 Fine-tuning 的范式区别 
   
   Fine-tuning 是使得预训练语言模型适配下游任务 
   Prompting 是将下游任务进行任务重定义，使得其利用预训练语言模型的能力，即适配语言模型 
   
  6.3 挑战与展望 
  Prompt 的设计问题。目前使用 Prompt 的工作大多集中育分类任务和生成任务，其它任务则较少，因为如何有效地将预训练任务和 prompt 联系起来还是一个值得探讨的问题。另外，模板和答案的联系也函待解决。模型的表现同时依赖于使用的模板和答案的转化，如何同时搜索或者学习出两者联合的最好效果仍然很具挑战性。 
  Prompt 的理论分析和可解释性。尽管 Prompt 方法在很多情况下都取得了成功，但是目前 prompt-based learning 的理论分析和保证还很少，使得人们很难了解 Prompt 为什么能达到好的效果，又为什么在自然语言中意义相近的 Prompt 有时效果却相差很大。 
  Prompt 在 PLM debias 方面的应用。由于 PLM 在预训练过程中见过了大量的人类世界的自然语言，所以很自然地受到了影响。在应用的过程中，Prompt 暴露了 PLM 学习到的很多偏见，比如种族歧视、恐怖主义、性别对立等等。已有相关研究关注是否可以利用 Prompt 来对这些偏见进行修正，但还处在比较初级的阶段，这也会是一个值得研究的方向。

深度学习模型开发文档 Ares代码行者深度学习
深度学习模型开发文档1.简介2.深度学习模型开发流程3.数据准备3.1数据加载3.2数据可视化4.构建卷积神经网络(CNN)5.模型训练5.1定义损失函数和优化器5.2训练过程6.模型评估与优化6.1模型评估6.2超参数调优7.模型部署8.总结参考资料1.简介深度学习是人工智能的一个分支，利用多层神经网络从数据中提取特征并进行学习。它被广泛应用于图像识别、自然语言处理、语音识别等领域。本文将以构建
【ChatGPT】实用 Prompt 指令大全 —— 一文教你如何更好地挖掘 GPT 的价值 AI天才研究院 ChatGPT chatgpt gpt 人工智能机器学习 Prompt工程
目录ChatGPT实用Prompt指令大全——一文教你如何更好地挖掘GPT的价值1.ChatGPT简介2.如何构建有效的Prompt指令3.形式化问题4.准确化任务需求5.别样表达6.提供上下文信息7.实用Prompts案例ChatGPT指令大全1.生成列表2.修改文本格式3.提供定义或解释4.编写文章或散文5.提供建议或指导6.讲述历史事件或演讲人物7.生成创意内容8.编辑或审查文本9.回答问题
AI 基础设施的儿童保护：智能化儿童安全监护系统 AI天才研究院【精选大厂面试题详解】大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI基础设施的儿童保护：智能化儿童安全监护系统随着人工智能技术的快速发展，AI基础设施在儿童保护方面发挥着越来越重要的作用。智能化儿童安全监护系统通过应用AI技术，为儿童的安全保驾护航。本文将探讨该领域的典型问题/面试题库和算法编程题库，并给出详尽的答案解析说明和源代码实例。1.AI技术在儿童保护中的应用题目：请简要介绍AI技术在儿童保护中的几种应用。答案：AI技术在儿童保护中的应用主要包括：人脸
免费的AI提示词生成网站花生糖@ AIGC学习资料库 ai 提示词
为使用AI生成最合适的提示词完全免费，适配多种场景，快速生成，一键复制，可用于创作、写作、游戏等多种场景网站地址：AI提示词生成器为使用AI生成最合适的提示词，完全免费，适配多种场景，快速生成，一键复制，可用于创作、写作、游戏等多种场景。https://prompt-generator.ilovecoke.cc/
2024全球十大工程成就：文生视频大模型Sora引领AI时代前端
2024年，中国工程院院刊《Engineering》公布了备受瞩目的“2024全球十大工程成就”，这不仅是对过去一年工程科技领域杰出贡献的肯定，更标志着全球科技发展进入一个新的阶段。这十大成就涵盖了航天探索、生物医学、人工智能、新能源等多个领域，体现了当今科技前沿的最高水平。其中，文生视频大模型Sora的入选尤为引人注目，它代表着AI代码生成技术在内容创作领域的突破性进展，预示着未来内容生产方式的
【论文速读】| 评估并提高大语言模型生成的安全攻击探测器的鲁棒性 llm
基本信息原文标题：EvaluatingandImprovingtheRobustnessofSecurityAttackDetectorsGeneratedbyLLMs原文作者：SamuelePasini,JinhanKim,TommasoAiello,RocíoCabreraLozoya,AntoninoSabetta,PaoloTonella作者单位：UniversitàdellaSvizze
Python二叉树用法介绍很酷的站长编程笔记 python 开发语言
二叉树是一种非常重要的数据结构，它在计算机科学中得到了广泛应用，例如在搜索算法、图形渲染和游戏AI等领域。本文将以Python二叉树为中心，从多个角度对其进行详细阐述，包括二叉树定义、二叉树遍历、二叉搜索树、平衡二叉树等内容。一、二叉树定义二叉树是一种有根树，它满足以下条件：每个节点最多有两个子节点每个节点只有一个父节点左子节点是其父节点的左子树，而右子节点是其父节点的右子树按照这个定义，我们可以
CES Asia 2025优惠期倒计时5天，科技盛宴即将开启赛逸展张胜科技
随着时间的推移，备受瞩目的CESAsia2025优惠期已进入最后5天倒计时。作为亚洲顶级的消费电子盛会，CESAsia2025将汇聚众多国内外知名的科技企业，展示涵盖智能家居、智能出行、虚拟现实、人工智能等热门赛道的顶尖成果，是行业交流、商贸合作、趋势洞察的绝佳平台。在这最后的优惠时段内，参展商们仍有机会享受到展位费用的梯度折扣，越早锁定，优惠力度越大，还能优先挑选心仪展位，获得额外的宣传推广资源
AI Agent 原理解析及应用场景深度洞察 power-辰南大模型算法实战工程人工智能 ai agent 大模型
在当今科技飞速发展的时代，AIAgent作为人工智能领域的重要分支，正以其独特的智能特性和广泛的应用潜力，逐渐渗透到各个行业和我们生活的方方面面。它为解决复杂问题、提升系统效率和实现智能化交互提供了全新的途径。本文将深入剖析AIAgent的原理，并详细探讨其在多个领域的关键应用场景。一、AIAgent的定义与基本概念AIAgent，即人工智能代理，是一种能够感知其所处环境，并基于所感知的信息自主地
[实战]Ubuntu使用工具和命令无法ssh,但使用另一台Ubuntu机器可以用命令ssh,非root用户。江湖一码农 ubuntu ssh linux
现象新安装一台Ubuntu22.04服务器，各种远程工具都无法SSH，但使用公司的另一台Ubuntu22.04的机器可以正常SSH。并且我使用的是非root用户。百度、谷哥上能试的方案全试了一遍，使用命令ssh仍然提示permissiondeniedpleasetryagain。使用工具ssh提示还是Accessdenied。原因经过排查，发现新安装的服务器出现了IP冲突。重新换一个IP即可。我这
Bootstrap4网格系统详解半点寒12W css css3
一、基本概念Bootstrap4的网格系统是其核心部分，它基于一个12列的布局，能够帮助你轻松创建响应式的网页布局。这种网格系统可以让你将页面内容划分为不同的行和列，使得内容在不同设备上都能呈现出最佳的显示效果。二、容器（Container）容器的作用：容器是用来包裹页面内容的元素，它提供了一个水平居中的布局空间，并为内部的行和列设置了合适的内边距。容器的类型：**.container：**这是一
深度学习环境配置指南！（Windows、Mac、Ubuntu全讲解） Charmve #AI学习指导：从入门到进阶软件安装环境配置计算机视觉实战文档详细开放源码 cuda linux gpu anaconda ubuntu
关注“迈微AI研习社”，内容首发于公众号作者：伍天舟、马曾欧、陈信达入门深度学习，很多人经历了从入门到放弃的心酸历程，且千军万马倒在了入门第一道关卡：环境配置问题。俗话说，环境配不对，学习两行泪。如果你正在面临配置环境的痛苦，不管你是Windows用户、Ubuntu用户还是苹果死忠粉，这篇文章都是为你量身定制的。接下来就依次讲下Windows、Mac和Ubuntu的深度学习环境配置问题。一、Win
html简单项目案例张小特 html css css3
数据展示/*全局样式*/body{font-family:Arial,sans-serif;margin:0;padding:0;background-color:#f9f9f9;display:flex;flex-direction:column;min-height:100vh;}/*页面容器*/.container{max-width:1200px;margin:0auto;padding:
在亚马逊云科技上用AI提示词优化功能写出漂亮提示词（下）佛州小李哥人工智能 aws 亚马逊云科技云计算语言模型 ai 科技
提示工程（PromptEngineering）对各位小伙伴们来说是再熟悉不过了，提示词工程技术是通过编写指令词，指导开发者们调用AI基础模型（FMs）获得期望的响应。但是经常写提示词的朋友们会知道，为了获取理想的输出，我们可能需要花费数月时间不断进行实验和调整才能得到最优的提示词，同时不同基础模型的提示词最佳实践也不尽相同，这意味着我们要设计兼容不同模型类别的提示词。此外提示词通常是与特定模型和特
循环语句例如计算1+2+3+4+5+......+100 *Star_* 算法数据结构 c++
一、for循环基本形式：for(循环变量赋初值;循环条件;循环变量增值){语句;}#includeintmain(){inti=1,sum=0;for(i=1;iintmain(){inti=1,sum=0;while(i=1){sum+=i;i++;}printf("%d",sum);return0;}三、do......while循环基本形式：dowhile循环与while循环的主要区别在于它
Qt双击桌面快捷方式激活并使程序窗口置于最前端 Chervin Qt Windows qt 前端
Qt双击桌面快捷方式激活并使程序窗口置于最前端亲测有效对于已经打开的Qt桌面程序，我们希望用户再次双击桌面的快捷方式时，程序可以自动激活到其他所有程序的最前面，而不是重新打开一次程序。此时我们采用QSharedMemory方式，加上WindowAPI函数操作程序，保证已打开程序不重复打开，并激活程序窗口到最前面在main()函数中添加如下代码//WindouwAPI依赖头文件#include#in
opencv c++ 调用 cornerHarris函数一直报错OpenCV(4.5.5) Error: Assertion failed (src.type() == CV_8UC1 || src. Wsyoneself cv opencv
报错：OpenCV(4.5.5)Error:Assertionfailed(src.type()==CV_8UC1||src.type()==CV_32FC1)in。。。原因：该函数的源矩阵（第一个参数）必须是单通道图像解决：三通道转为单通道之后再调用cvtColor(src,sc_img,COLOR_RGB2GRAY);//将三通道转为单通道cornerHarris(sc_img,dst,2,3
笔记：qt窗体界面激活显示在最前 Czx.¹²³ qt 开发语言
1、利用Qt带有显示窗口在最前的方式this->setWindowFlags(pMainForm->windowFlags()&~Qt::WindowStaysOnTopHint);this->showNormal();该代码会导致该窗体霸道的总是在最前，无法切换到诸如浏览器等其他应用，不能取消“总在最前”的状态。2、如下代码即可解决以上问题，将窗口显示到最前的效果，且无其他副作用：if(this
archlinux安裝手记（Win10+Arch、GPT+UEFI、lvm） weixin_30481087 操作系统运维 php
目录准备工作工具和必要技能分区和挂载分区建立和格式化分区挂载基础安装配置镜像源连接网络安装基础系统建立fstab文件进入系统激活lvm2钩子用户管理设置时区主机名网络配置系统引导系统配置图形界面显卡驱动桌面环境/窗口管理器字体中文本地化声音软件包管理器pacmanAUR和yaourt设备连接触摸板蓝牙NTFS分区U盘和MTP设备其他配置(问题解决)选择grub为第一启动项无法启动图形界面非root
pythonAI算法中使用ffmpeg推流记录脱僵的的野码 ffmpeg 网络
首先呢需求是这样的需要在远端播放检测的画面这个事情解决的思路1.用的网络摄像头，将摄像头的流推到rtmp1流地址2.项目中的输入流就是rtmp1的地址视频流3.开始对视频各种检测，检测后将帧的frame推到rtmp24.随便找个播放器去播放rtmp2的流期间遇到了一些问题就是推上去的流在远端播放就直接裂开了大概4秒一卡顿，后来发现是ffmpg-r参数默认值是25我的frame推上去的流fps才11
1. 基于大模型能力，如何提炼出优质prompt（入门版）姚瑞南 prompt系列课程人工智能 AIGC chatgpt
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）本文简介：入门版：基于大模型能力，如何提炼出优质prompt提示词的重要性和价值大模型基础能力简介prompt的基本定义如何定义优质的promptprompt的万能公式与套路prom
C语言编程题—1+2+3+....+n（循环）止酒 C语言练习题 c语言
1+2+3+....+n（循环）#includemain(){inta=1,sum=0,n;printf("Inputn:");scanf("%d",&n);do{sum+=a;a++;}while(a<=n);printf("sum=%d\n",sum);}
求两个矩阵的乘积理智的灰太狼 pta题目15分矩阵算法线性代数
求两个矩阵的乘积分数15全屏浏览切换布局作者C课程组-hwr-zy单位浙江大学输入三个正整数m，l，n(0usingnamespacestd;intm,l,n;inta[11][11],b[11][11],c[11][11];intmain(){cin>>m>>l>>n;for(inti=0;i>a[i][j];}}for(inti=0;i>b[i][j];}}for(inti=0;i
论文阅读--Qwen2&2.5技术报告 __如果论文阅读 qwen
Qwen21引言所有模型都是在超过7trilliontoken（7万亿）的高质量、大规模数据集上预训练的2Tokenizer&Model2.1Tokenizer沿用Qwen（Bai等人，2023a）的做法，我们采用了基于字节级字节对编码的相同Tokenizer所有大小的模型都采用一个共有词汇表，包含151,643个常规词元和3个控制词元2.2模型架构基于Transformer架构的大型语言模型，具
蓝桥杯day5刷题日记-分巧克力-天干地支-求和 _yukinoshita_yukino 蓝桥杯蓝桥杯算法数据结构刷题笔记
P8647[蓝桥杯2017省AB]分巧克力思路：二分查找#includeusingnamespacestd;intn,k;inth[100010],w[100010];boolcheck(intx){intsum=0;for(inti=0;i=k)returntrue;}returnfalse;}intmain(){cin>>n>>k;for(inti=0;i>h[i]>>w[i];}intl=1
`Port: Direct Attach Copper` 和 `Port: Twisted Pair` 喝醉酒的小白 Liunx 网络
目录标题这些端口类型的来源结论1.**IntelNetworkInterfaceCards(NICs)**2.**Broadcom/AvagoTechnologies**3.**MellanoxTechnologies(现为NVIDIA)**4.**ChelsioCommunications**5.**Realtek**6.**Netgear/TP-Link/ASUS**总结你提到的Port:Di
从System Prompt来看GPT-3.5到GPT-4的进化 herosunly 大模型 system prompt gpt-3 chatgpt gpt4 gpt4o
大家好，我是herosunly。985院校硕士毕业，现担任算法t研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了从SystemPrompt来看GPT-3.5到GPT-4的进化之路，希
大模型GUI系列论文阅读 DAY3续4：《TREE SEARCH FOR LANGUAGE MODEL AGENTS》 feifeikon 语言模型人工智能自然语言处理
摘要自主代理由语言模型（LMs）驱动，已在执行诸如网页自动化等决策任务方面展示出良好前景。然而，语言模型的一个主要局限在于：它们主要针对自然语言理解和生成进行了优化，在解决现实世界的计算机任务时，难以应对多步推理、规划以及环境反馈的利用。为了解决这一问题，我们提出了一种推理时搜索算法，使语言模型代理能够在交互式网页环境中执行显式的探索和多步规划。我们的方法是一种基于最佳优先（best-first）
JNI Android Bitmap 和 cv::Mat 互相转换安卓手机运行Opencv动态库或普通c++函数配置指南 chezabo6116 android
JNIAndroidBitmap和cv::Mat互相转换https://blog.csdn.net/tyfwin/article/details/140714946安卓手机运行Opencv动态库或普通c++函数配置指南https://blog.csdn.net/snjs000111/article/details/135067493
tkinter事件处理 Aaron_liu1 python tkinter
事件类型用户通过鼠标、键盘、游戏控制设备在与图形界面交互时，就会触发事件。tkinter事件通常采用了将事件名称放置于尖括号内的字符串表示，尖括号中的内容我们称之为事件类型。事件类型有其通用的定义方式。如下：其中方括号内的内容为可选参数modifier为组合键的定义，例如，同时按下Ctrl键；type为通用类型，例如，键盘按键（KeyPress）detail用于具体信息，如按下键盘中‘B’键常用类
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(

大语言模型的预训练[3]之Prompt Learning：Prompt Engineering、Answer engineering、Multi-prompt learning详情

大语言模型的预训练[3]之Prompt Learning：Prompt Engineering、Answer engineering、Multi-prompt learning、Training strategy详解

1.Prompt Learning

1.1 Prompt Learning 的出现背景

1.2 Prompt Learning 的定义

1.3 Prompt Learning的方法

1.4 Prompt engineering

2. 预训练语言模型的选择

3.Answer engineering

4.Multi-prompt learning

5.Training strategy

6.小结

6.1 Prompt Learning 使得所有的 NLP 任务成为一个语言模型的问题

6.2 Prompt Learning 和 Fine-tuning 的范式区别

6.3 挑战与展望

你可能感兴趣的:(AI前沿技术汇总,语言模型,prompt,人工智能,NLP,自然语言处理,GPT)