算法小陈

大模型开发(九)：基于Few-Shot-LtM提示工程复现SCAN数据集下的指令翻译任务

全文共9000余字，预计阅读时间约30~50分钟 | 满满干货(附复现代码)，建议收藏！

本文目标：复现论文：《LEAST-TO-MOST PROMPTING ENABLES COMPLEX REASONING IN LARGE LANGUAGE MODELS》，并提出改进策略，采用LtM提示方法在text-davinci-003模型上完成对SCAN数据集准确率高达99.7%的预测，实现一个基于大模型的完整建模流程。

代码下载链接

一、介绍

对大语言模型(LLMs)来说，组合泛化能力是最重要的涌现能力之一，也是模型能够理解复杂语义、进行准确推理的底层能力。所以验证提示工程效果最有效的方式就是观察该方法是否能高效提升模型组合泛化能力。

在这篇文章中，大模型开发(八)：基于思维链(CoT)的进阶提示工程，通过一系列的实践和结合相关论文的结论，基本印证了：EAST-TO-MOST PROMPTING（LtM提示法）是截至目前围绕模型推理能力提升的最为有效的提示学习方法。

所以本文就复现论文：《LEAST-TO-MOST PROMPTING ENABLES COMPLEX REASONING IN LARGE LANGUAGE MODELS》，并提出改进策略，采用LtM提示方法在text-davinci-003模型上完成对SCAN数据集准确率高达99.7%的预测，实现一个基于大模型的完整建模流程。

二、数据背景

SCAN数据集，由纽约大学和Facebook于2018年提出，该数据集包含2万条基于隐藏语义关系的指令及对应的翻译动作序列，是目前公认的用于测试深度学习算法组合泛化能力的基准数据集，该数据集建模难度极大，目前最前沿的深度学习算法都无法进行非常精准的预测，在大模型诞生之前，人们甚至需要单独围绕这个数据集提出全新的深度学习架构，才能完成较高进度的预测。

2.1 数据形式

该数据集是一系列的指令和对应的行为序列组成的纯文本数据集，指令在数据集中以IN的形式进行申明，是一串描述动作序列的英文句子，例如"walk twice and jump twice"；行为序列是以OUT的形式进行申明，是指令所指代的一系列精准步骤，例如““WALK”, “WALK”, “JUMP”, “JUMP””，总共包含2万条样本（2万个IN-OUT对），对比传统的结构化数据集，IN相当于是特征，OUT相当于是标签。数据集基本结构如下：

2.2 数据难度

这个数据集存在一定的“黑箱”性质，比如“walk twice and jump twice”可以很明显的看出来指代[”WALK", “WALK”, “JUMP”, “JUMP”]，但有些命令和行为之间的关系却不是很好理解，例如上图中的最后一个命令：“walk opposite left twice and run”，为何指代[”TURN_LEFT",“TURN_LEFT”,“WALK”,“TURN_LEFT”,“TURN_LEFT”,“WALK”,“RUN”]并不能通过自然语言的语法规则进行理解。

根据官方的解释是：这套数据集是根据一套隐藏的语法规则创建的指令和行为数据集，指令和动作在现实中并没有特殊的含义，但它们模拟了一种常见的问题：理解和执行一系列指令。这种问题在很多实际应用中都会遇到，例如：编程（理解并执行一系列代码指令）、机器人导航（理解并执行一系列的导航指令），甚至是日常生活中的任务（如烹饪、装配家具等，需要理解并执行一系列步骤）。

据此不难理解，SCAN这个人工数据集创建的目的，就是为了测试模型能否找到这个隐藏的语法规则，并根据IN准确的预测OUT，预测准确率越高，说明模型对这个隐藏语法规则学习的越准确，模型性能越强。

从专业的角度来说，SCAN数据集就是一个用于评估模型在理解和执行指令上的组合泛化能力的基准数据集。

2.3 建模难度

SCAN数据集是目前建模难度非常大的数据集，主要原因由以下两点：

一、SCAN数据集数据集的主要特点是其指令和相应的行动序列的生成，是完全基于某种预定义的、结构化的语法规则。这意味着模型不能仅依赖于表面层次的统计规律或者局部的模式匹配来进行预测，必须理解和掌握数据的底层结构和规则。

二、从模型本身的角度来说，深度学习模型、特别是序列到序列的模型，通常依赖于大量的数据和计算资源来学习和泛化复杂的模式，而SCAN数据集则需要模型具备强大的组合泛化能力，即只通过少量数据集的训练，就需要理解没有直接见过的组合指令并执行正确的行动序列。例如，虽然模型可能在训练中见过"jump"和"twice"这两个单词，但是如果没有直接见过"jump twice"这个组合，那么模型可能就无法正确地理解和执行这个指令。

因此截至目前，传统的深度学习方法、哪怕是最先进的深度学习模型也难以在该数据集上达到高水平的性能。

但这样的一个业内难题，却能够被大语言模型“轻易”的解决。根据《LEAST-TO-MOST PROMPTING ENABLES COMPLEX REASONING IN LARGE LANGUAGE MODELS》论文中的描述，根据**基于合理的LtM提示学习，"code-davinci-002"模型只需要输入14条训练样本，就能够对SCAN数据集做到几乎100%的准确预测（准确率为99.7%）****

三、复现针对SCAN数据预测的LtM提示流程

3.1 SCAN数据集下载

SCAN数据集目前托管在Hugging Face上，所以使用Hugging Face的datasets库进行在线下载和导入，代码如下：

# !pip install datasets

import os
import openai
openai.api_key = os.getenv("OPENAI_API_KEY")

from datasets import load_dataset

# 加载数据集
dataset = load_dataset("scan", "simple")

# 打印数据集信息
print(dataset)

dataset已经被划分为训练集和测试集两个数据集，其中训练集总共包含16728条数据，而测试集总共包含4182条数据

看一下数据形式：

scan_train = dataset["train"]
scan_train.to_pandas()

输出如下：

3.2 尝试使用Zero-shot

挑选几条相对简单的数据：

代码如下：

# 挑选三条比较简单的数据
Command1 = 'look thrice after jump' 
Action1 = 'JUMP LOOK LOOK LOOK'

Command2 = 'run left and walk' 
Action2 = 'TURN LEFT RUN WALK'

Command3 = 'look opposite right' 
Action3 = 'TURN RIGHT TURN RIGHT LOOK'

# 使用text-davinci-003模型预测
response_Zero_shot = openai.Completion.create(
                          model="text-davinci-003",
                          prompt=Command1,
                          max_tokens=1000,
                          )

response_Zero_shot["choices"][0]["text"].strip()

结果如下：

从结果上，模型完全无法给出答案，进一步给它点提示试试：

Command1 = 'look thrice after jump' 
Action1 = 'JUMP LOOK LOOK LOOK'


response_Zero_shot = openai.Completion.create(
                          model="text-davinci-003",
                          prompt= "%s should be translated as" % Command1,
                          max_tokens=1000,
                          )

response_Zero_shot["choices"][0]["text"].strip()

看下结果：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lp4eFCsk-1689927541835)(https://snowball100.oss-cn-beijing.aliyuncs.com/images/202307211615039.png)]

模型将其翻译为了西班牙语，还是一样没什么效果。

3.3 尝试使用Few-shot

以第一、二条数据作为few-shot，围绕第三条数据进行预测，代码如下：

few_shot_prompt = 'Q: "%s", A: "%s", Q: "%s", A: "%s", Q: "%s", A: ' % (Command1, Action1, Command2, Action2, Command3)

response_Few_shot = openai.Completion.create(
                          model="text-davinci-003",
                          prompt=few_shot_prompt,
                          max_tokens=1000,
                          )

response_Few_shot["choices"][0]["text"].strip()

看下结果：

简单的以问题+答案组成的few-shot，比Zero-shot靠谱点。根据原论文的描述，few-shot提示方法在SCAN数据集上的准确率不到17%，依旧很低。

3.4 尝试使用Zer-shot-LtM

论文中给出的最佳方法就是进行一种基于Few-shot的LtM提示工程，在大模型开发(八)：基于思维链(CoT)的进阶提示工程中提到的LtM是一种Zer-shot-LtM方法。

其基本流程是这样的：

所以根据"to solve…，we need to first solve"提示模板来进行问题拆解，代码如下：

Zero_shot_LtM_prompt = "In order to translate '%s', we need to first solve" % Command1

response_Zero_shot_LtM = openai.Completion.create(
                          model="text-davinci-003",
                          prompt=Zero_shot_LtM_prompt,
                          max_tokens=1000,
                          )

response_Zero_shot_LtM["choices"][0]["text"].strip()

看下结果：

在Zero-shot-LtM提示指令下，模型仍然无法精准理解问题，其实这个效果也可以理解，对于SCAN数据集中的指令翻译问题，本身指令翻译的规则就不是自然语言规则，模型也从未学习过相关规则，在Zero-shot下，模型拆解的问题也几乎不会有助于最终的指令翻译任务，拆解的子问题是毫无意义的。

3.5 使用few-shot-LtM复现

3.5.1 思路

论文中提出了一种Few-shot-LtM提示工程流程来解决该问题，这种Few-shot-LtM提示流程在原有流程上进行了以下两方面改进：

1、首先通过**引入Few-shot来引导模型进行有价值的中间问题拆解并进行回答。**但是，通过自然语言描述的拆分问题的方法很多，同时也没有标准答案。因此，这方面的Few-shot的设计就需要建模人员大量的工作经验+大量的尝试，来寻找到最佳的Few-shot拆分示例。

2、进行第1个过程的同时，在Few-shot的示例中，尝试引导模型进行多步分解进而提升模型进行翻译的准确率。即Decompose Question into Subquestions环节，多步拆分多个子问题回答，即可以尝试围绕某个拆解之后的子问题进一步拆分子问题，进而提升子问题的回答准确率，例如假设将一个问题拆分成三个子问题，则LtM提示回答的基本过程如下：

Few-shot实际上是两个部分，既需要利用Few-shot告诉模型应该如何拆解问题，同时也需要通过Few-shot来告诉模型应该如何进行问题的回答。

在论文中，将Few-shot-LtM提示的两个阶段进行重新命名，第一阶段Decompose Questions into Subquestions被重新命名为Command decomposition，即命令分解，也就是问题拆解，第二个阶段Sequentially Solve Subquestion则重新命名为Command mapping，即指令翻译。本质也就是依次翻译拆解的指令以及原始指令。

了解上述思想后，来尝试复现论文是如何在SCAN数据集上进行Few-shot-LtM提示工程的。

3.5.2 指令拆解(Command decomposition)

第一步，采用Few-shot的方法围绕命令进行拆解。Few-shot中的提示示例是人工手动编写，每个示例都是借助"__ can be solved by:__"提示模板进行提问，进而引导模型对Commands进行问题拆解。

说白了就是为了解读长的指令，要首先解读那些与之相关的短指令。论文挑选了几个指令并进行拆解，拆解过程如下：

CD_Few_shot = 'Q: “look opposite right thrice after walk” \
               A: “look opposite right thrice” can be solved by: “look opposite right”, “look opposite right \
               thrice”. “walk” can be solved by “walk”. So, “look opposite right thrice after walk” can be \
               solved by: “walk”, “look opposite right”, “look opposite right thrice”. \
               Q: “look around right thrice and walk” \
               A: “look around right thrice” can be solved by: “look right”, “look around right”, “look around \
               right thrice”. “walk” can be solved by “walk”. So, “look around right thrice and walk” can be \
               solved by: “look right”, “look around right”, “look around right thrice”, “walk”. \
               '

通过这组提示示例告诉模型应该如何进行指令拆解、即告诉模型指令拆解的基本规范，例如“look opposite right thrice after walk”可以被拆解为“walk”, “look opposite right”, “look opposite right thrice”这三个短的指令，而“look around right thrice and walk”，则可以被拆解为“look right”, “look around right”, “look around right thrice”, “walk”。

一般情况Few-shot规则是Q表示问题，A表示答案，例如Command：“look opposite right thrice after walk”对应的Action为“I_WALK I_TURN_RIGHT I_TURN_RIGHT I_LOOK I_TURN_RIGHT I_TURN_RIGHT I_LOOK I_TURN_RIGHT I_TURN_RIGHT I_LOOK”，代码如下：

df = scan_train.to_pandas()

# 精确查找 "commands" 列中为 "look opposite right thrice after walk" 的行
matching_rows = df[df["commands"] == "look opposite right thrice after walk"]

# 取出与这个命令对应的 "actions" 值
actions = matching_rows["actions"].values

print(actions)

# # 如果有多个匹配，这将返回一个包含所有匹配行的 "actions" 值的数组。
# # 如果你只想要第一个匹配，你可以使用以下代码：
# first_action = actions[0] if len(actions) > 0 else None

# print(first_action)

所以此时提示示例应该为：

'Q: “look opposite right thrice after walk” \
A: “I_WALK I_TURN_RIGHT I_TURN_RIGHT I_LOOK I_TURN_RIGHT I_TURN_RIGHT I_LOOK I_TURN_RIGHT I_TURN_RIGHT I_LOOK”. \
Q: “look around right thrice and walk” \
A: “I_TURN_RIGHT I_LOOK I_TURN_RIGHT I_LOOK I_TURN_RIGHT I_LOOK \
I_TURN_RIGHT I_LOOK I_TURN_RIGHT I_LOOK I_TURN_RIGHT I_LOOK I_TURN_RIGHT \
I_LOOK I_TURN_RIGHT I_LOOK I_TURN_RIGHT I_LOOK I_TURN_RIGHT I_LOOK I_TURN_RIGHT \
I_LOOK I_TURN_RIGHT I_LOOK I_WALK”. \
'

但LtM提示流程的不同之处就在于设置了多个阶段进行分段提示，其中：

第一个阶段的提示结果只是为了创建中间结果——即分解子问题（命令拆解），因此Few-shot-LtM第一个阶段的提示示例也就是展示如何进行指令拆解。这个中间结果并没有标准答案，因此如何拆解基本就是人工尝试+经验的总结。对于大语言模型来说，不同的提示模板、语言风格、甚至是不同提示示例，都会对模型造成不同的引导，这种引导是极为灵活且具有创造力的。为了获得一个更好的最终结果，中间环节的Few-shot或许要经历千百次的尝试。

很多时候Few-shot就可以看成是训练集，大语言模型的建模过程和机器学习类似，都是在训练集上进行训练，然后在新的数据集上验证效果。

围绕数据集进行拆解，以第二条数据集为例，commands是做模型输入X，对应的actions是为模型输出y，代码如下：

X = scan_train[1]['commands']
y = scan_train[1]['actions']

prompt_CD = CD_Few_shot + 'Q：“%s” A:' % X
prompt_CD

带入模型：

response_CD = openai.Completion.create(
              model="text-davinci-003",
              prompt=prompt_CD,
              temperature=0.5,
              max_tokens=1000
              )

response_CD["choices"][0]["text"].strip()

看下结果：

很明显能看出来，原始指令’run opposite left after walk right’被拆分成了“walk right”, “run left”, “run opposite left”三个短指令。

Few-shot的提示过程也可以看成是让模型举一反三的过程，尽管训练数据中没有’run opposite left after walk right’这个指令拆解的方法，但通过Few-shot，模型学会了其底层拆解命令的逻辑，因此也顺利完成了对这个新指令的拆解。

模型将X拆分成三个子命令，就相当于是将一个原始问题拆分成了三个问题，并且需要注意的是，这三个问题是有先后顺序的，相当于是“walk right”是最底层的子问题、“run left”是上一层的子问题，“run opposite left”则是第一层子问题。后续在解决这些子问题的时候，是按照由下往上的顺序依次进行解决，并且每一个子问题的解决都需要将下一层子问题的问题+答案作为Few-shot（最底层的子问题除外）

3.5.3 指令翻译(Command mapping)

在围绕原问题（原命令）拆分除了多个子问题（短命令）之后，接下来就需要依次解答（翻译）这一系列的子问题。

这个阶段总共有两部分工作，其一是通过Few-shot教会模型短命令的翻译方法，其二则是在翻译原始指令时，需要先翻译短指令，然后将短指令的问题和答案都作为prompt的一部分，带入到原指令的翻译过程中。其中，第二部分工作也就是LtM提示方法的根本流程——将子问题的问题+答案作为原问题提示内容的一部分，从而让模型更好的解决原问题。

看下原论文中给出的部分短指令翻译，代码如下：

CM_Few_shot = 'Q: “jump left” \
               A: The output of “jump left” concatenates: the output of “turn left”, the output of “jump”. “turn \
               left” outputs “TURN LEFT”. “jump” outputs “JUMP”. So concatenating the output of “turn \
               left” and the output of “jump” leads to “TURN LEFT” + “JUMP”. So the output of “jump left” \
               is “TURN LEFT” + “JUMP”. \
               Q: “run and look twice” \
               A: The output of “run and look twice” concatenates: the output of “run”, the output of “look \
               twice”. “run” outputs “RUN”. “look twice” outputs “LOOK” * 2. So concatenating the output of \ \
               “run” and the output of “look twice” leads to “RUN” + “LOOK” * 2. So the output of “run and \
               look twice” is “RUN” + “LOOK” * 2. \
               Q: “walk opposite left” \
               A: The output of “walk opposite left” concatenates: the output of “turn opposite left”, the output of \
               “walk”. “turn opposite left” outputs “TURN LEFT” * 2. “walk” outputs “WALK”. So concatenating the \
               output of “turn opposite left” and the output of “walk” leads to “TURN LEFT” * 2 + “WALK”. So the \
               output of “walk opposite left” is “TURN LEFT” * 2 + “WALK” '

这些提示就是通过两阶段的逻辑引导，将一些相对较短的指令翻译成了最终行为序列。

借助这些翻译的示例，对测试数据X完成Command mapping过程，具体过程如下：

翻译第一个子命令walk right

prompt_CM_1 = CM_Few_shot + 'Q:“walk right” A：'

response_CM_1 = openai.Completion.create(
                model="text-davinci-003",
                prompt=prompt_CM_1,
                temperature=0.5,
                max_tokens=1000
                )

response_CM_1["choices"][0]["text"].strip()

看下结果：

该结果就是第一个子命令的翻译得到结果。

翻译第二个子命令run left

在翻译第二个子命令时，将第一个子命令时的问答结果作为Few-shot的一个示例

prompt_CM_2 = prompt_CM_1 + response_CM_1["choices"][0]["text"].strip() + 'Q:“run left” A：'

response_CM_2 = openai.Completion.create(
                model="text-davinci-003",
                prompt=prompt_CM_2,
                temperature=0.5,
                max_tokens=1000
                )

response_CM_2["choices"][0]["text"].strip()

结果如下：

翻译第三个子命令run opposite left

第三个子命令的翻译，则需要同时将此前两个子命令的问答都加入Few-shot中，然后再进行提问，代码如下：

prompt_CM_3 = prompt_CM_2 + response_CM_2["choices"][0]["text"].strip() + 'Q:“run opposite left” A：'

response_CM_3 = openai.Completion.create(
                model="text-davinci-003",
                prompt=prompt_CM_3,
                temperature=0.5,
                max_tokens=1000
                )

response_CM_3["choices"][0]["text"].strip()

结果如下：

提问原始问题，流程如下

在获得了每个子命令的问答结果之后，接下来，将每个子命令的问答结果都拼接到Few-shot中，并对模型提问原始问题，流程如下：

prompt_CM = prompt_CM_3 + response_CM_3["choices"][0]["text"].strip() + 'Q：“%s” A:' % X

response_CM = openai.Completion.create(
              model="text-davinci-003",
              prompt=prompt_CM,
              temperature=0.5,
              max_tokens=1000
              )

response_CM["choices"][0]["text"].strip()

结果如下：

获得原始问题的答案为“TURN RIGHT” + “WALK” + “TURN LEFT” * 2 + “RUN”，该*回答和该条指令的真实标签y一致。

获取结果

将response_CM[“choices”][0][“text”].strip()对象转化为y格式，函数代码如下：

import re

def transform_expression(s):
    # Regular expression pattern
    pattern = r'is “.*'

    # Find the match
    match = re.search(pattern, s) 
    
    s = match.group()[3: -1].replace('“', '"').replace('”', '"')
    # Step 1: Handle multiplications
    pattern = r'"([^"]+)" \* (\d+)'
    matches = re.findall(pattern, s)
    for match in matches:
        replacement = ' '.join([f'"{match[0]}"'] * int(match[1]))
        s = s.replace(f'"{match[0]}" * {match[1]}', replacement)

    # Step 2: Replace spaces within quotes with underscores
    pattern = r'"([^"]+)"'
    matches = re.findall(pattern, s)
    for match in matches:
        replacement = match.replace(' ', '_')
        s = s.replace(f'"{match}"', f'"{replacement}"')

    # Step 3: Add 'I_' prefix within quotes
    pattern = r'"([^"]+)"'
    matches = re.findall(pattern, s)
    for match in matches:
        replacement = 'I_' + match
        s = s.replace(f'"{match}"', f'"{replacement}"')

    # Step 4: Remove quotes
    s = s.replace('"', '')
    s = s.replace(' +', '')

    return s

transform_expression(response_CM["choices"][0]["text"].strip())

输出如下：

上述完成了一次完整的基于复杂语义问题的LtM提示工程流程，并顺利获得准确答案。Few-shot-LtM提示流程非常复杂，以下是X到y翻译过程总结：

四、SCAN数据集完整预测流程

在了解了Few-shot-LtM的基本流程之后，实现一个更加自动化的Few-shot-LtM过程，并在完整的SCAN数据集上建模。

Step 1：提取数据流

from datasets import load_dataset

# 加载数据集
dataset = load_dataset("scan", "simple")

scan_test = dataset["test"]
scan_train = dataset["train"]

Step 2：提示示例补充

根据原论文的描述，为了更好的完成完整数据集的预测，第一阶段命令拆解需要设置8组问答示例，第二阶段命令映射则需要设置14组问答示例

CD_Few_shot = 'Q: “look right after look twice” \
               A: “look right after look twice” can be solved by: “look right”, “look twice”. \
               Q: “jump opposite right thrice and walk” \
               A: “jump opposite right thrice” can be solved by: “jump opposite right”, “jump opposite right thrice”. \
               “walk” can be solved by: “walk”. So, “jump opposite right thrice and walk” can be solved by: “jump \
               opposite right”, “jump opposite right thrice”, “walk”. \
               Q: “run left twice and run right” \
               A: “run left twice” can be solved by: “run left”, “run left twice”. “run right” can be solved by “run right”. \
               So, “run left twice and run right” can.be solved by: “run left”, “run left twice”, “run right”. \
               Q: “run opposite right” \
               A: “run opposite right” can be solved by “run opposite right”. \
               Q: “look opposite right thrice after walk” \
               A: “look opposite right thrice” can be solved by: “look opposite right”, “look opposite right thrice”. \
               “walk” can be solved by “walk”. So, “look opposite right thrice after walk” can be solved by: “look \
               opposite right”, “look opposite right thrice”, “walk”. \
               Q: “jump around right” \
               A: “jump around right” can be solved by: “jump right”, “jump around right”. So, “jump around right” \
               can be solved by: “jump right”, “jump around right”. \
               Q: “look around right thrice and walk” \
               A: “look around right thrice” can be solved by: “look right”, “look around right”, “look around right \
               thrice”. “walk” can be solved by “walk”. So, “look around right thrice and walk” can be solved by: \
               “look right”, “look around right”, “look around right thrice”, “walk”. \
               Q: “turn right after run right thrice” \
               A: “turn right” can be solved by: “turn right”. “run right thrice” can be solved by: “run right”, “run \
               right thrice”. So, “turn right after run right thrice” can be solved by: “turn right”, “run right”, “run right \
               thrice”. \
               '

CM_Few_shot = 'Q: “turn left” \
               A: “turn left” outputs “TURN LEFT”. \
               Q: “turn right” \
               A: “turn right” outputs “TURN RIGHT”. \
               Q: “jump left” \
               A: The output of “jump left” concatenates: the output of “turn left”, the output of “jump”. “turn left” \
               outputs “TURN LEFT”. “jump” outputs “JUMP”. So concatenating the output of “turn left” and the output of “jump” leads to “TURN LEFT” + “JUMP”. So the output of “jump left” is “TURN LEFT” + “JUMP”. \
               Q: “run right” \
               A: The output of “run right” concatenates: the output of “turn right”, the output of “run”. “turn right” \
               outputs “TURN RIGHT”. “run” outputs “RUN”. So concatenating the output of “turn right” and the \
               output of “run” leads to “TURN RIGHT” + “RUN”. So the output of “run right” is “TURN RIGHT” + \
               “RUN”. \
               Q: “look twice” \
               A: The output of “look twice” concatenates: the output of “look”, the output of “look”. “look” outputs \
               “LOOK”. So repeating the output of “look” two times leads to “LOOK” * 2. So the output of “look \
               twice” is “LOOK” * 2. \
               Q: “run and look twice” \
               A: The output of “run and look twice” concatenates: the output of “run”, the output of “look twice”. \
               “run” outputs “RUN”. “look twice” outputs “LOOK” * 2. So concatenating the output of “run” and the \
               output of “look twice” leads to “RUN” + “LOOK” * 2. So the output of “run and look twice” is “RUN” + \
               “LOOK” * 2. \
               Q: “jump right thrice” \
               A: The output of “jump right thrice” concatenates: the output of “jump right”, the output of “jump \
               right”, the output of “jump right”. “jump right” outputs “TURN RIGHT” + “JUMP”. So repeating the \
               output of “jump right” three times leads to (“TURN RIGHT” + “JUMP”) * 3. So the output of “jump \
               right thrice” is (“TURN RIGHT” + “JUMP”) * 3. \
               Q: “walk after run” \
               A: The output of “walk after run” concatenates: the output of “run”, the output of “walk”. “run” outputs \
               “RUN”. “walk” outputs “WALK”. So concatenating the output of “run” and the output of “walk” leads to \
               “RUN” + “WALK”. So the output of “walk after run” is “RUN” + “WALK”. \
               Q: “turn opposite left” \
               A: The output of “turn opposite left” concatenates: the output of “turn left”, the output of “turn left”. \
               “turn left” outputs “TURN LEFT”. So repeating the output of “turn left” twice leads to “TURN LEFT” * \
               2. So the output of “turn opposite left” is “TURN LEFT” * 2. \
               Q: “turn around left” \
               A: The output of “turn around left” concatenates: the output of “turn left”, the output of “turn left”, the \
               output of “turn left”, the output of “turn left”. “turn left” outputs “TURN LEFT”. So repeating the output \
               of “turn left” four times leads to “TURN LEFT” * 4. So the output of “turn around left” is “TURN LEFT” \
               * 4. \
               Q: “turn opposite right” \
               A: The output of “turn opposite right” concatenates: the output of “turn right”, the output of “turn \
               right”. “turn right” outputs “TURN RIGHT”. So repeating the output of “turn right” twice leads to \
               “TURN RIGHT” * 2. So the output of “turn opposite right” is “TURN RIGHT” * 2. \
               Q: “turn around right” \
               A: The output of “turn around right” concatenates: the output of “turn right”, the output of “turn right”, \
               the output of “turn right”, the output of “turn right”. “turn right” outputs “TURN RIGHT”. So repeating \
               the output of “turn right” four times leads to “TURN RIGHT” * 4. So the output of “turn around right” \
               is “TURN RIGHT” * 4. \
               Q: “walk opposite left” \
               A: The output of “walk opposite left” concatenates: the output of “turn opposite left”, the output of \
               “walk”. “turn opposite left” outputs “TURN LEFT” * 2. “walk” outputs “WALK”. So concatenating the \
               output of “turn opposite left” and the output of “walk” leads to “TURN LEFT” * 2 + “WALK”. So the \
               output of “walk opposite left” is “TURN LEFT” * 2 + “WALK”. \
               Q: “walk around left” \
               A: The output of “walk around left” concatenates: the output of “walk left”, the output of “walk left”, \
               the output of “walk left”, the output of “walk left”. “walk left” outputs “TURN LEFT” + “WALK”. So \
               repeating the output of “walk around left” four times leads to (“TURN LEFT” + “WALK”) * 4. So the \
               output of “walk around left” is (“TURN LEFT” + “WALK”) * 4. \
              '

Step 3：第一阶段的提示工程

做命令拆解，代码如下：

def extract_phrases(text):
    # 查找最后一个 "solved by:" 后面的所有内容
    last_solved_by = text.rsplit("solved by:", 1)[-1]
    
    # 使用正则表达式提取引号中的短语
    phrases = re.findall(r'“([^”]*)”', last_solved_by)
    
    return phrases

测试一下函数：

response_CD["choices"][0]["text"].strip()
CD_result = extract_phrases(response_CD["choices"][0]["text"].strip())
CD_result

Step 4: 第二阶段提示工程

from tqdm import tqdm

CM_Few_shot_temp = CM_Few_shot
sub_qs = CD_result

for qs in tqdm(sub_qs):
    CM_Few_shot_temp += 'Q:“%s” A：' % qs
    response_CM = openai.Completion.create(
                        model="text-davinci-003",
                        prompt=CM_Few_shot_temp,
                        temperature=0.5,
                        max_tokens=1000,
                        )
    CM_Few_shot_temp += response_CM["choices"][0]["text"].strip()
    
CM_Few_shot_temp

看下结果：

Step 5：对原始问题提问并获取最终结果，代码如下：

for data in scan_test:
    print(data['commands'])
    print(data['actions'])
    break
    
prompt_CM = CM_Few_shot_temp + 'Q：“%s” A:' % data['commands']

response_CM = openai.Completion.create(
              model="text-davinci-003",
              prompt=prompt_CM,
              temperature=0.5,
              max_tokens=1000,
              )

CM_result = response_CM["choices"][0]["text"].strip()
transform_expression(CM_result)

看下最终结果：

Step 6：完整函数封装

CD_Few_shot = 'Q: “look right after look twice” \
               A: “look right after look twice” can be solved by: “look right”, “look twice”. \
               Q: “jump opposite right thrice and walk” \
               A: “jump opposite right thrice” can be solved by: “jump opposite right”, “jump opposite right thrice”. \
               “walk” can be solved by: “walk”. So, “jump opposite right thrice and walk” can be solved by: “jump \
               opposite right”, “jump opposite right thrice”, “walk”. \
               Q: “run left twice and run right” \
               A: “run left twice” can be solved by: “run left”, “run left twice”. “run right” can be solved by “run right”. \
               So, “run left twice and run right” can.be solved by: “run left”, “run left twice”, “run right”. \
               Q: “run opposite right” \
               A: “run opposite right” can be solved by “run opposite right”. \
               Q: “look opposite right thrice after walk” \
               A: “look opposite right thrice” can be solved by: “look opposite right”, “look opposite right thrice”. \
               “walk” can be solved by “walk”. So, “look opposite right thrice after walk” can be solved by: “look \
               opposite right”, “look opposite right thrice”, “walk”. \
               Q: “jump around right” \
               A: “jump around right” can be solved by: “jump right”, “jump around right”. So, “jump around right” \
               can be solved by: “jump right”, “jump around right”. \
               Q: “look around right thrice and walk” \
               A: “look around right thrice” can be solved by: “look right”, “look around right”, “look around right \
               thrice”. “walk” can be solved by “walk”. So, “look around right thrice and walk” can be solved by: \
               “look right”, “look around right”, “look around right thrice”, “walk”. \
               Q: “turn right after run right thrice” \
               A: “turn right” can be solved by: “turn right”. “run right thrice” can be solved by: “run right”, “run \
               right thrice”. So, “turn right after run right thrice” can be solved by: “turn right”, “run right”, “run right \
               thrice”. \
               '

CM_Few_shot = 'Q: “turn left” \
               A: “turn left” outputs “TURN LEFT”. \
               Q: “turn right” \
               A: “turn right” outputs “TURN RIGHT”. \
               Q: “jump left” \
               A: The output of “jump left” concatenates: the output of “turn left”, the output of “jump”. “turn left” \
               outputs “TURN LEFT”. “jump” outputs “JUMP”. So concatenating the output of “turn left” and the output of “jump” leads to “TURN LEFT” + “JUMP”. So the output of “jump left” is “TURN LEFT” + “JUMP”. \
               Q: “run right” \
               A: The output of “run right” concatenates: the output of “turn right”, the output of “run”. “turn right” \
               outputs “TURN RIGHT”. “run” outputs “RUN”. So concatenating the output of “turn right” and the \
               output of “run” leads to “TURN RIGHT” + “RUN”. So the output of “run right” is “TURN RIGHT” + \
               “RUN”. \
               Q: “look twice” \
               A: The output of “look twice” concatenates: the output of “look”, the output of “look”. “look” outputs \
               “LOOK”. So repeating the output of “look” two times leads to “LOOK” * 2. So the output of “look \
               twice” is “LOOK” * 2. \
               Q: “run and look twice” \
               A: The output of “run and look twice” concatenates: the output of “run”, the output of “look twice”. \
               “run” outputs “RUN”. “look twice” outputs “LOOK” * 2. So concatenating the output of “run” and the \
               output of “look twice” leads to “RUN” + “LOOK” * 2. So the output of “run and look twice” is “RUN” + \
               “LOOK” * 2. \
               Q: “jump right thrice” \
               A: The output of “jump right thrice” concatenates: the output of “jump right”, the output of “jump \
               right”, the output of “jump right”. “jump right” outputs “TURN RIGHT” + “JUMP”. So repeating the \
               output of “jump right” three times leads to (“TURN RIGHT” + “JUMP”) * 3. So the output of “jump \
               right thrice” is (“TURN RIGHT” + “JUMP”) * 3. \
               Q: “walk after run” \
               A: The output of “walk after run” concatenates: the output of “run”, the output of “walk”. “run” outputs \
               “RUN”. “walk” outputs “WALK”. So concatenating the output of “run” and the output of “walk” leads to \
               “RUN” + “WALK”. So the output of “walk after run” is “RUN” + “WALK”. \
               Q: “turn opposite left” \
               A: The output of “turn opposite left” concatenates: the output of “turn left”, the output of “turn left”. \
               “turn left” outputs “TURN LEFT”. So repeating the output of “turn left” twice leads to “TURN LEFT” * \
               2. So the output of “turn opposite left” is “TURN LEFT” * 2. \
               Q: “turn around left” \
               A: The output of “turn around left” concatenates: the output of “turn left”, the output of “turn left”, the \
               output of “turn left”, the output of “turn left”. “turn left” outputs “TURN LEFT”. So repeating the output \
               of “turn left” four times leads to “TURN LEFT” * 4. So the output of “turn around left” is “TURN LEFT” \
               * 4. \
               Q: “turn opposite right” \
               A: The output of “turn opposite right” concatenates: the output of “turn right”, the output of “turn \
               right”. “turn right” outputs “TURN RIGHT”. So repeating the output of “turn right” twice leads to \
               “TURN RIGHT” * 2. So the output of “turn opposite right” is “TURN RIGHT” * 2. \
               Q: “turn around right” \
               A: The output of “turn around right” concatenates: the output of “turn right”, the output of “turn right”, \
               the output of “turn right”, the output of “turn right”. “turn right” outputs “TURN RIGHT”. So repeating \
               the output of “turn right” four times leads to “TURN RIGHT” * 4. So the output of “turn around right” \
               is “TURN RIGHT” * 4. \
               Q: “walk opposite left” \
               A: The output of “walk opposite left” concatenates: the output of “turn opposite left”, the output of \
               “walk”. “turn opposite left” outputs “TURN LEFT” * 2. “walk” outputs “WALK”. So concatenating the \
               output of “turn opposite left” and the output of “walk” leads to “TURN LEFT” * 2 + “WALK”. So the \
               output of “walk opposite left” is “TURN LEFT” * 2 + “WALK”. \
               Q: “walk around left” \
               A: The output of “walk around left” concatenates: the output of “walk left”, the output of “walk left”, \
               the output of “walk left”, the output of “walk left”. “walk left” outputs “TURN LEFT” + “WALK”. So \
               repeating the output of “walk around left” four times leads to (“TURN LEFT” + “WALK”) * 4. So the \
               output of “walk around left” is (“TURN LEFT” + “WALK”) * 4. \
              '

# 定义辅助函数，分别用于进行子问题的提取和最终问题结果的翻译

def extract_phrases(text):
    # 查找最后一个 "solved by:" 后面的所有内容
    last_solved_by = text.rsplit("solved by:", 1)[-1]
    
    # 使用正则表达式提取引号中的短语
    phrases = re.findall(r'“([^”]*)”', last_solved_by)
    
    return phrases

import re

def transform_expression(s):
    # Regular expression pattern
    pattern = r'is “.*'

    # Find the match
    match = re.search(pattern, s) 
    
    s = match.group()[3: -1].replace('“', '"').replace('”', '"')
    # Step 1: Handle multiplications
    pattern = r'"([^"]+)" \* (\d+)'
    matches = re.findall(pattern, s)
    for match in matches:
        replacement = ' '.join([f'"{match[0]}"'] * int(match[1]))
        s = s.replace(f'"{match[0]}" * {match[1]}', replacement)

    # Step 2: Replace spaces within quotes with underscores
    pattern = r'"([^"]+)"'
    matches = re.findall(pattern, s)
    for match in matches:
        replacement = match.replace(' ', '_')
        s = s.replace(f'"{match}"', f'"{replacement}"')

    # Step 3: Add 'I_' prefix within quotes
    pattern = r'"([^"]+)"'
    matches = re.findall(pattern, s)
    for match in matches:
        replacement = 'I_' + match
        s = s.replace(f'"{match}"', f'"{replacement}"')

    # Step 4: Remove quotes
    s = s.replace('"', '')
    s = s.replace(' +', '')

    return s

# 是每条数据的预测过程

def SCAN_predict(dataSet=scan_test, model="text-davinci-003", CD_Few_shot=CD_Few_shot, CM_Few_shot=CM_Few_shot):
    # 转化为dataframe
    data_frame = dataSet.to_pandas()
    # 最后一列标记为unkown
    data_frame['actions_predict'] = 'unkown'
    # 在字典中循环
    for i,data in enumerate(dataSet):
        # 阶段一：拆解命令
        prompt_CD = CD_Few_shot + 'Q：“%s” A:' % data['commands']
        response_CD = openai.Completion.create(
              model="text-davinci-003",
              prompt=prompt_CD,
              temperature=0.5,
              max_tokens=1000
              )
        # 拆解命令结果
        CD_result = extract_phrases(response_CD["choices"][0]["text"].strip())
        # 阶段二：短命令翻译
        CM_Few_shot_temp = CM_Few_shot
        sub_qs = CD_result
        for qs in sub_qs:
            CM_Few_shot_temp += 'Q:“%s” A：' % qs
            response_CM = openai.Completion.create(
                                model="text-davinci-003",
                                prompt=CM_Few_shot_temp,
                                temperature=0.5,
                                max_tokens=1000,
                                )
            CM_Few_shot_temp += response_CM["choices"][0]["text"].strip()
        # 对原始问题提问
        prompt_CM = CM_Few_shot_temp + 'Q：“%s” A:' % data['commands']
        response_CM = openai.Completion.create(
              model="text-davinci-003",
              prompt=prompt_CM,
              temperature=0.5,
              max_tokens=1000,
              )
        # 将结果保存在dataframe的对应位置
        data_frame['actions_predict'][i] = transform_expression(CM_result)
        
    return data_frame

# 验证实际预测效果，谨慎运行，可能会造成大量的费用
data_frame = SCAN_predict(dataSet=scan_test)

输出如下：

(data_frame['actions'] == data_frame['actions_predict']).sum() / data_frame.shape[0]

输出为1.0，在completion模型text-davinci-003预测下，SCAN数据集的预测准确率能够达到100%。

五、总结

Few-shot-LtM提示流程进行总结：

类似SCAN指令翻译这种复杂问题，很多时候Zero-shot都是无法解决的，对于更强的Few-shot来说，它的提示示例像是一个数据集中的训练数据，实际提示流程，就相当于是先让大模型学习训练数据来总结规律技巧，然后再进一步应用于新数据集上的预测。

和机器学习直接在完整数据集上随机划分训练集和测试集不同的是，Few-shot往往不需要太多数据（受限于模型的上下文限制，也无法输入太多数据），但需要合理的挑选问答示例，并详细的展示由问到答的推理过程，才能够更好的给与模型启发。

**在实际执行过程中，往往是先确定提示流程、再编写Few-shot。**提示工程流程是提示工程方法最高度的抽象，这方面创新难度较大，一般来说都是按照既有的提示框架进行完善和补充，就目前来看，LtM提示框架是最有效的提示框架。

在编写Few-shot的过程中，则是先从少部分数据中进行测试，刚开始编写和测试中间环节的问题和Few-shot会非常困难，往往都需要丰富的技术经验和一定的技术灵感。就本次复现实验来说，在基于对英文语义充分理解的情况下，核心工作是以介词为界进行短命令处理，而第二个阶段的Few-shot则是先从不包含介词的短语入手进行指令翻译，然后尝试围绕带入介词的短语进行翻译，当模型能够理解部分介词+动词+副词的组合含义后，即可将其推广至更为一般的情况。

从这个过程不难看出，大语言模型(LLMs)具备非常强的“迁移学习”能力，对于类似SCAN数据集这种学习难度非常大的任务，模型仍然可以在只带入非常少的数据的情况下完成底层推理规则的学习，由此也确实能看出大语言模型恐怖的涌现能力。

最后，感谢您阅读这篇文章！如果您觉得有所收获，别忘了点赞、收藏并关注我，这是我持续创作的动力。您有任何问题或建议，都可以在评论区留言，我会尽力回答并接受您的反馈。如果您希望了解某个特定主题，也欢迎告诉我，我会乐于创作与之相关的文章。谢谢您的支持，期待与您共同成长！

你可能感兴趣的:(LtM,openai,SCAN数据集,提示工程Prompt,思维链CoT,Few,Shot,LtM,论文复现)

【Tailwind CSS】bg-red-50 和 bg-blue-50 的用法详解
文章目录一、TailwindCSS中的颜色背景类1.背景颜色的命名规则2.bg-red-50和bg-blue-50的颜色特点二、bg-red-50和bg-blue-50的基本用法示例三、bg-red-50和bg-blue-50的设计理念1.bg-red-50的使用场景2.bg-blue-50的使用场景四、实际应用场景解析1.信息提示框的使用2.页面分区的背景色3.使用交替背景色提升阅读性五、配合其
【Tailwind CSS】font-light 和 my-4 的样式详解 Peter-Lu #Tailwind css 前端 react.js javascript typescript
文章目录一、`font-light`与字体粗细的控制1.`font-light`的作用2.`font-weight`的等级划分3.使用示例二、`my-4`与垂直外边距的控制1.`my-4`的作用2.Tailwind的边距控制系统3.使用示例三、`font-light`和`my-4`的实际应用场景1.用于标题和描述文本的排版2.用于卡片组件的内容分隔3.用于导航菜单的轻量提示四、设计风格的提升：使用
汇编语言：基于x86处理器（原书第7版）所有课后习题答案 Up to the mountain 汇编 masm
包含3-13章所有习题答案，覆盖率95%以上，除了意义不大和重复的，高难度题目我全做了包含vs2015工程，使用时将对应的习题拖到vs工程的源码底下，一次编译一个，如果莫名报错，请将文件名改成简单英文或数字名，如a31.asm---引用请注明出处---下载地址：汇编语言：基于x86处理器（原书第7版）所有课后习题答案_汇编语言基于x86处理器第七版课后答案-其它文档类资源-CSDN下载
StringBuilder练习项目代码及相关知识点
1.动态字符串操作需求：编写一个程序，接收用户输入的多个单词，并将它们组合成一个完整的句子，同时支持以下功能：动态添加单词删除某些单词将句子反转importjava.util.Scanner;publicclassStringBuilderDemo{publicstaticvoidmain(String[]args){StringBuildersb=newStringBuilder();Scann
AI智能体——实现关键技术
1、CoT思维链CoT（Chainof‏Thought）思维链是一种让AI像人类一؜样“思考”的技术，帮助AI在处理复杂问题时能够按步骤思考。对于复杂的推理类问题，先思考后‌执行，效果往往更好。而且还可以让模型在生成答案时‏展示推理过程，便于我们理解和优化AI。CoT的实现方式其实很简单‏，可以在输入Prompt时，给模型提供额外的提示或؜引导，比如“让我们一步一步思考这个问题”，让模型以逐步推理
技术支持工程师
OS与云桌面一、核心概念解析操作系统（OS）定义：管理硬件资源（CPU、内存、存储等）并为应用程序提供运行环境的系统软件，如Windows、Linux、UOS、银河麒麟等。作用：承担进程调度、文件管理、设备驱动等基础功能，是任何计算设备的“大脑”。云桌面定义：基于云计算技术的虚拟桌面服务，将传统PC的桌面环境（操作系统、应用、数据）集中部署在远端服务器，用户通过终端设备（如瘦客户机、PC、手机）远
Docker 和 Kubernetes 入门到精通：运维工程师的实战笔记 (近5万字) 运维小贺运维 linux docker 容器 kubernetes 云原生 kubelet
文章目录1.Docker1.1Docker是什么？1.1.1容器服务原理1.2Docker的三大概念1.2.1镜像1.2.2容器1.2.3仓库1.2.4总结1.3Docker常用命令1.3.1镜像常用命令1.3.2容器常用命令1.4Dockerfile1.4.1commit的局限1.4.2Dockerfile是什么？1.4.3如何使用Dockerfile制作镜像?1.4.4Dockerfile中常
「源力觉醒创作者计划」_以FastDeploy为例部署ERNIE-4.5-21B大模型全流程实践 cooldream2009 大模型基础 AI技术文心大模型 FastDeploy
目录前言1环境准备与依赖安装1.1硬件要求1.2Python环境与pip升级2下载ERNIE-4.5模型权重2.1安装HuggingFaceCLI工具2.2设置国内镜像加速（可选）2.3下载模型文件3安装FastDeploy与Paddle推理引擎3.1安装PaddlePaddle-GPU版本3.2安装FastDeploy-GPU4启动ERNIE-4.5本地服务4.1启动OpenAI兼容API服务4
LSTM 论文（Hochreiter & Schmidhuber, 1997）精读（三）
文章：SeppHochreiter,JürgenSchmidhuber;LongShort-TermMemory.NeuralComput1997;9(8):1735–1780.doi:https://doi.org/10.1162/neco.1997.9.8.1735第2节PreviousWork（已有研究），这是论文对以往方法的一个评述，总结了已有递归神经网络在面对时间序列学习、尤其是长时依赖
技术解析｜可灵AI全球首部AI单元剧《新世界加载中》工作流揭秘：提示词工程如何解决口型同步/复杂动作生成？
昨天，在北京首映礼的暗场中，一段黏土风格的荒诞喜剧画面投映在银幕上：一根「宇宙肥肠」在太空中漂浮，讽刺着人类对虚假进步的盲目崇拜。这便是快手可灵AI与异类Outliers团队共同推出的《新世界加载中》，全球首部AI单元剧集。这部与传统短剧不同的全新作品，用全新的呈现方式为观众带来了更具视觉冲击力的视觉效果和观影体验，成为AIGC领域的创新之作。然而，涵盖7个不同题材的单元剧集，必定涉及复杂的人物表
《解决 Idea Gradle Build 中 Build Tools 相关问题》只因在人海中多看了你一眼摸索学习心得 ide android studio
在使用IntelliJIDEA进行Android项目开发时，最近在执行Gradlebuild过程中遇到了一个棘手的问题：问题现象在运行Gradlebuild时，出现了这样的错误提示：Couldnotdeterminethedependenciesoftask‘:app:compileReleaseJavaWithJavac’.InstalledBuildToolsrevision35.0.0isc
解决登录Docker Desktop后Unable to pull postgres:latest (HTTP code 401) unexpected - authentication xxx报错
博主刚刚安装好DockerDesktop在拉取镜像时出现了这个报错解决方法打开命令行，输入：dockerlogin然后按照提示，输入与dockerdesktop相同的用户名username与密码password，回车即可看到：LoginSucceeded然后就可以操控DockerDesktop拉取镜像什么的了问题解析参考链接https://github.com/docker/hub-feedbac
python中提示‘pyinstaller‘ 不是内部或外部命令，也不是可运行的程序或批处理文件。
一、出现这个问题的原因：来自于首先安装这个pyinstaller的时候，没有将D:\01_SoftWare\python3.9.13\Scripts或者D:\01_SoftWare\python3.9.13或者是D:\01_SoftWare\python3.9.13\Lib添加到环境变量中，那需要做的第一步就是添加下系统的环境变量。这样就可以了。到这里，可能一部分人，再次安装就好了，但是这边尝试看
ChatTTS实现文本转语音（TTS）全流程教程【附完整代码 & 环境配置】文浩（楠搏万）语言模型 Chattts 大语言模型 AI 人工智能 python 生成
言简意赅的讲解ChatTTS解决的痛点‍本教程手把手带你从零上手ChatTTS，实现文本到语音（TTS）转换，适合自媒体配音、有声内容创作、AI语音实验等场景。配套提供完整代码和环境配置方法，一键复现，无压力！什么是ChatTTS？ChatTTS是由清华大学团队开源的一款中文文本转语音（Text-to-Speech,TTS）模型。它的特点包括：️语音自然流畅，情感丰富️支持自定义发音人音色（spe
基于odoo17的设计模式详解---外观模式
大家好，我是你的Odoo技术伙伴。在构建复杂的企业级应用时，我们常常会遇到一个棘手的问题：一个单一的业务操作，比如“确认一张销售订单”，背后可能需要与库存、财务、采购、项目等多个子系统进行复杂的交互。如果让调用者（比如一个按钮的点击事件）直接去协调所有这些子系统，代码将会变得极其混乱和脆弱。为了解决这个问题，软件工程领域引入了外观模式（FacadePattern）。今天，我们就来深入探讨这一模式，
（部署服务器系列四）部署Vue步骤（使用nodejs）玄尺_007 #个人博客项目 #前端服务器 vue.js 运维
1.构建项目（打包Vue）：构建前设置main.js//关闭开发模式提示Vue.config.devtools=falseVue.config.productionTip=false设置指向的服务端后端ip和端口，我的常量属性统一放在了constants.jsexportconstAIOS_BASE_URL="http://192.168.0.111/api"exportconstIMG_BASE
2024年最新4大典型安全漏洞是怎么来的？如何解决？，【2024网络安全最新学习路线】 2401_84297193 程序员 web安全学习网络
还有兄弟不知道网络安全面试可以提前刷题吗？费时一周整理的160+网络安全面试题，金九银十，做网络安全面试里的显眼包！王岚嵚工程师面试题（附答案），只能帮兄弟们到这儿了！如果你能答对70%，找一个安全工作，问题不大。对于有1-3年工作经验，想要跳槽的朋友来说，也是很好的温习资料！【完整版领取方式在文末！！】93道网络安全面试题内容实在太多，不一一截图了黑客学习资源推荐最后给大家分享一份全套的网络安全
「论文导读」LLM高效推理与模型量化雷羿 LexChien prompt 人工智能 LLM 论文阅读
1.论文背景作者：HugoTouvron等人，來自MetaAI来源：arXiv:2302.13971，2023年2月主题：介绍LLaMA系列模型（LLaMA-7B、13B、33B、65B），专为研究用途设计，强调高效能与低资源需求的语言模型推理。论文探讨如何通过优化训练数据、模型架构和推理技术，在有限硬体资源（如单一GPU或CPU）上实现高效推理。学术背景：随着大型语言模型（LLM）如GPT-3的
30个网络抓包/调试工具-IT运维与网络工程师必会，从零基础到精通，收藏这篇就够了！程序员羊羊黑客网安工程师网络安全网络运维安全数据库压力测试 web安全
运维老兵都知道，网络抓包这活儿，就像给网络做CT，透视内部问题。但工具再多，用不对也是白搭。今天咱就来聊聊30款抓包/调试“神器”，别再只会用Wireshark了！一、协议分析工具：别光看表面，还得懂“潜台词”Wireshark：老牌劲旅，但别迷信它简介：开源界的扛把子，协议分析界的“瑞士军刀”，跨平台支持是基本操作。特点：协议多？那是必须的，2000+协议解析，过滤表达式（tcp.port==8
在学校研究学习的偏算法，秋招投递开发岗位还有希望吗程序员
前言Thelasttime,Ihavelearned这是星球同学，在周五晚上答疑聊天的时候对我的提问：如果简历上的项目偏算法，但是自学了一些操作系统和计网的知识，秋招的时候投递偏开发的岗位有希望吗？简历上是否也要加上相关项目？估计也是很多朋友的疑问，毕竟很多同学读研，有些老师疯狂push，要成果，发论文。要想尽快发论文，那只能“研究”人工智能、算法的一些东西了。但是众所周知，算法要求很高，不仅要求
AlphaEvolve：谷歌的算法进化引擎 | 从数学证明到芯片设计的AI自主发现新纪元大千AI助手人工智能 Python #OTHER 算法人工智能深度学习 AlphaEvolve google gemini
AlphaEvolve：谷歌的算法进化引擎|从数学证明到芯片设计的AI自主发现新纪元——结合大语言模型与进化计算，重塑科学发现与工程优化的通用智能体本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！⚙️一、核心定义与技术架构AlphaEvolve是由谷歌DeepMind开发的通用科学AI智能体，其核心
Apache SeaTunnel × Hive 深度集成指南：原理、配置与实践数据库
在大数据处理的复杂生态中，数据的高效流转与整合是实现数据价值的关键。ApacheSeaTunnel作为一款高性能、分布式、易扩展的数据集成框架，能够快速实现海量数据的实时采集、转换和加载；而ApacheHive作为经典的数据仓库工具，为结构化数据的存储、查询和分析提供了坚实的基础。将ApacheSeaTunnel与Hive进行集成，能够充分发挥两者的优势，构建起高效的数据处理链路，满足企业多样化的
不止HTTPS：深入理解SSL/TLS证书的实践之道后端
在当今互联网，https://开头的网址和浏览器地址栏的“小锁”图标已成为安全访问的标配。这背后，SSL/TLS证书扮演着至关重要的角色。对于开发者、运维工程师和安全从业者而言，理解其工作原理、选型策略以及部署维护的“坑”，远不止于让网站挂上那把锁那么简单。本文将带你深入SSL/TLS证书的实战世界。一、基石：不只是加密，更是身份与信任核心作用：加密传输(Confidentiality)：这是最广
操作系统领域的新宠儿：鸿蒙应用深度剖析操作系统内核探秘操作系统内核揭秘 harmonyos 华为 ai
操作系统领域的新宠儿：鸿蒙应用深度剖析关键词：鸿蒙操作系统、微内核架构、分布式软总线、ArkUI框架、DevEcoStudio、跨设备开发、全场景生态摘要：本文深度剖析华为鸿蒙操作系统的核心技术架构与应用开发体系，从微内核设计、分布式协同技术、UI框架创新到全场景开发工具链展开分析。通过数学模型解析分布式一致性算法，结合Python代码演示核心调度逻辑，并以实战案例演示跨设备应用开发流程。探讨鸿蒙
Java构建区块链版权交易平台：从智能合约到法律合规的全栈实战墨夶 Java学习资料1 java 区块链智能合约
——基于HyperledgerFabric与SpringBoot的版权交易系统设计数字版权时代的“信任危机”与技术破局在数字内容爆炸式增长的今天，版权侵权问题日益严峻。据统计，全球每年因版权纠纷造成的经济损失高达数百亿美元。Java技术栈凭借其企业级开发能力、区块链集成优势及完善的生态工具链，成为构建版权交易平台的核心选择。本文将从区块链存证、智能合约交易、法律合规模块三大维度，通过代码级深度解析
NumPy-随机数生成详解 GG不是gg numpy numpy
NumPy-随机数生成详解一、随机数生成的基础：伪随机数与种子1.伪随机数的本质2.种子的设置：确保结果可复现二、常用随机数生成函数1.均匀分布随机数2.正态分布随机数3.整数随机数4.其他常用分布三、随机数生成的进阶操作1.随机排列与洗牌2.控制随机数的维度与形状四、随机数生成的应用场景1.数据增强2.蒙特卡洛模拟3.随机初始化参数五、注意事项NumPy作为Python数值计算的核心库，提供了功
CMD win+r 管理员运行cmd
win+rcmdctrl+shift+enter在Windows操作系统中，可以通过几种方式使用快捷键Win+R来以管理员权限运行命令提示符（cmd）。以下是一些常见的方法：搜索命令提示符：按下Win+S打开搜索面板。输入cmd或者命令提示符，然后右击搜索结果中的命令提示符，选择“以管理员身份运行”。使用Win+X菜单：按下Win+X打开快速访问菜单。选择“命令提示符（管理员）”或“Windows
封装阶段的软件供应链安全威胁
随着软件开发沿着软件供应链生命周期进行，软件包阶段成为一个关键节点，将源代码转换为准备分发的可执行工件。然而，这个关键阶段也无法避免漏洞，使其成为恶意行为者寻求破坏软件完整性和安全性的主要目标。这篇博文深入研究了此阶段可能出现的普遍威胁，并概述了缓解这些威胁的有效策略。软件开发生命周期中的软件包阶段软件供应链生命周期的打包阶段包括打包和准备软件以分发给用户的过程。此阶段涉及创建安装包、管理依赖项以
集群Redis
文章目录前言一、Redis主从复制配置1.1.配置文件redis_master.conf,redis_slave.conf1.2.启动服务1.3.检查成果二、Redis集群配置2.1.服务器40.240.34.91集群配置2.2.其它服务器xxx.92,xxx.93集群配置2.3.启动服务2.3.启动集群服务2.4.检查成果三、优劣四、结束前言提示：本文主讲两种redis数据同步形式，1.主从复制
光子-eBPF协同架构设计与硅光哈希加速实现路径（2025技术全景）百态老人哈希算法算法
一、技术架构核心设计1.硅光-电子混合计算架构基于Nature2025年论文中"集成超16,000光子组件的大型加速器"设计理念，构建分层处理体系：元数据提取协议卸载
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户