great-wind

RaSa2.5.x训练数据之一：训练数据格式(Training Data Format)

概述(Overview)
- 高级结构(High-Level Structure)
- 例子(Example)
NLU训练数据(NLU Training Data)
- 训练实例(`Training Examples`)
- 实体(Entities)
- 同义词(Synonyms)
- 正则表达式(Regular Expressions)
- 查找表(Lookup Tables)
会话训练数据(Conversation Training Data)
- 故事(Stories)
- - 用户消息(User Messages)
  - 行为(Actions)
  - 表单(Forms)
  - 槽(Slots)
  - (Checkpoints)
  - OR语句(OR statement)
- 规则(Rules)
故事测试集(Test Stories)
端到端训练(End-to-end Training)
参考

本文介绍进入Rasa助手的不同类型的训练数据，以及训练数据的结构。

概述(Overview)

Rasa开源使用YAML作为一种统一的、可扩展的方式来管理所有训练数据，包括NLU数据、故事和规则。
您可以将训练数据拆分到任意数量的YAML文件上，每个文件都可以包含NLU数据、故事和规则的任意组合。训练数据解析器使用top level keys确定培训数据类型。
domain使用与培训数据相同的YAML格式，也可以跨多个文件拆分或合并在一个文件中。domain包括响应(responses)和表单(forms)的定义。有关如何格式化domain文件的信息，请参阅域文档。

传统格式
开源Rasa1.x数据格式？它们现在已被弃用，但您仍然可以找到有关markdown格式的NLU数据和markdown格式的故事数据的文档。

高级结构(High-Level Structure)

每个文件可以包含一个或多个具有相应训练数据的键(keys)。一个文件可以包含多个键(keys)，但每个键在一个文件中只能出现一次。可用键(keys)包括：

version
nlu
stories
rules

您应该在所有YAML训练数据文件中指定版本键(keys)。如果未在训练数据文件中指定版本键(keys)，Rasa将假定您使用的是已安装的Rasa开源版本支持的最新训练数据格式规范。将跳过Rasa开源版本高于您在计算机上安装的版本的训练数据文件。目前，RASA2.x最新的训练数据格式规范是2.0。

例子(Example)

下面是一个简短的示例，它将所有训练数据保存在一个文件中：

version: "2.0"

nlu:
- intent: greet
  examples: |
    - Hey
    - Hi
    - hey there [Sara](name)

- intent: faq/language
  examples: |
    - What language do you speak?
    - Do you only handle english?

stories:
- story: greet and faq
  steps:
  - intent: greet
  - action: utter_greet
  - intent: faq
  - action: utter_faq

rules:
- rule: Greet user
  steps:
  - intent: greet
  - action: utter_greet

要指定测试故事，需要将它们放入一个单独的文件tests/test_stories.yml中：

stories:
- story: greet and ask language
- steps:
  - user: |
      hey
    intent: greet
  - action: utter_greet
  - user: |
      what language do you speak
    intent: faq/language
  - action: utter_faq

测试故事(Test stories)使用与故事训练数据相同的格式，并且应该放在一个前缀为test_的单独文件中。

| 符号
如以上示例所示，user和examples键后跟|（pipe）符号。在YAML中|表示保留缩进的多行字符串。这有助于在训练示例中保留诸如“，”等特殊符号。

NLU训练数据(NLU Training Data)

NLU训练数据由按意图(intent)分类的示例用户话语组成。训练示例还可以包括实体(entities)。实体(entities)是可以从用户消息中提取的结构化信息片段。您还可以向训练数据中添加额外的信息，如正则表达式和查找表，以帮助模型正确地识别意图(intent)和实体(entities)。
NLU训练数据在NLU键下定义。可在此项下添加的项包括：

按用户意图(intent)分组的训练示例，例如可选的带注释的实体(entities)

nlu:
- intent: check_balance
  examples: |
    - What's my [credit](account) balance?
    - What's the balance on my [credit card account]{
     "entity":"account","value":"credit"}

同义词(Synonyms)

nlu:
- synonym: credit
  examples: |
    - credit card account
    - credit account

正则表达式(Regular expressions)

nlu:
- regex: account_number
  examples: |
    - \d{
     10,12}

查阅表格(Lookup tables)

nlu:
- lookup: banks
  examples: |
    - JPMC
    - Comerica
    - Bank of America

训练实例(`Training Examples`)

训练示例按意图(intent)分组，并在examples键下列出。通常，每行列出一个示例，如下所示：

nlu:
- intent: greet
  examples: |
    - hey
    - hi
    - whats up

但是，如果您有自定义NLU组件并且示例需要元数据(metadata)，也可以使用扩展格式：

nlu:
- intent: greet
  examples:
  - text: |
      hi
    metadata:
      sentiment: neutral
  - text: |
      hey there!

元数据(metadata)键可以包含任意key-value 数据，这些数据绑定到一个示例并可由NLU管道中的组件访问。在上面的示例中，情绪元数据可以由管道中的自定义组件用于情绪分析。
您还可以在意图(intent)级别指定此元数据(metadata)：

nlu:
- intent: greet
  metadata:
    sentiment: neutral
  examples:
  - text: |
      hi
  - text: |
      hey there!

在这种情况下，元数据(metadata)键(key)的内容被传递给每个意图示例。
如果要指定检索意图(retrieval intents)，则NLU示例如下所示：

nlu:
- intent: chitchat/ask_name
  examples: |
    - What is your name?
    - May I know your name?
    - What do people call you?
    - Do you have a name for yourself?

- intent: chitchat/ask_weather
  examples: |
    - What's the weather like today?
    - Does it look sunny outside today?
    - Oh, do you mind checking the weather for me please?
    - I like sunny days in Berlin.

所有检索意图都添加了后缀，该后缀标识助手的特定响应键。在上面的示例中，ask_name和ask_weather是后缀。由/分隔符将后缀与检索意图名称分隔。

/的特殊含义
如以上示例所示，/符号被保留为分隔符，用于将检索意图与其关联的响应键分开。确保不要以你的意图的名义使用它。

实体(Entities)

实体(entities)是可以从用户消息中提取的结构化信息片段。
实体(entities)在训练示例中用实体的名称进行注释。除了实体名称之外，还可以使用同义词(synonyms)、角色(roles)或组(groups)来注释实体。
在训练示例中，实体注释如下所示：

nlu:
- intent: check_balance
  examples: |
    - how much do I have on my [savings]("account") account
    - how much money is in my [checking]{
     "entity": "account"} account
    - What's the balance on my [credit card account]{
     "entity":"account","value":"credit"}

注释实体的完整可能语法为：

[<entity-text>]{
     "entity": "", "role": "", "group": "", "value": ""}

在此表示法中，关键字role、group和value是可选的。value字段引用同义词。要了解标签角色(role)和组(group)的用途，请参阅实体角色和组部分。

同义词(Synonyms)

同义词通过将提取的实体映射到提取的文本以外的值来规范化训练数据。可以使用以下格式定义同义词：

nlu:
- synonym: credit
  examples: |
    - credit card account
    - credit account

还可以通过指定实体的值在训练示例中在线定义同义词：

nlu:
- intent: check_balance
  examples: |
    - how much do I have on my [credit card account]{
     "entity": "account", "value": "credit"}
    - how much do I owe on my [credit account]{
     "entity": "account", "value": "credit"}

有关同义词的更多信息，请阅读NLU训练数据。

正则表达式(Regular Expressions)

您可以使用正则表达式来改进使用regexfeaturer和RegexEntityExtractor组件的意图分类和实体提取。
定义正则表达式的格式如下：

nlu:
- regex: account_number
  examples: |
    - \d{
     10,12}

这里的帐号(account_number)是正则表达式的名称。当用作regexfeatureizer的功能时，正则表达式的名称并不重要。使用RegexEntityExtractor时，正则表达式的名称应与要提取的实体的名称匹配。

阅读NLU训练数据，了解更多关于何时以及如何对每个组件使用正则表达式的信息。

查找表(Lookup Tables)

查找表是用于生成不区分大小写的正则表达式模式的单词列表。格式如下：

nlu:
- lookup: banks
  examples: |
    - JPMC
    - Bank of America

在训练数据中提供查找表时，该表的内容将合并到一个大型正则表达式中。这个正则表达式用于检查每个训练示例，以查看它是否包含查找表中条目的匹配项。
查找表regexes的处理方式与训练数据中直接指定的正则表达式相同，并且可以与RegexFeaturer或RegexEntityExtractor一起使用。查找表的名称应与正则表达式功能名称相同。
阅读NLU训练数据，了解有关使用查找表的更多信息。

会话训练数据(Conversation Training Data)

故事(Stories)和规则(rules)都是用户和会话助手之间对话的表示。它们被用来训练对话管理模式。故事(Stories)被用来训练机器学习模型来识别会话中的模式，并推广到看不见的会话路径。规则(rules)描述了应该始终遵循相同路径并用于训练规则策略(RulePolicy)的小对话片段。

故事(Stories)

故事(Stories)包括：

story：故事的名字。名称任意，不用于训练；你可以把它作为故事的可读参考。
metadata：元数据。任意和可选的，不用于训练，你可以用它来存储有关的信息，如故事的作者。
steps：步骤列表。组成故事的用户消息和操作。

例如：

stories:
- story: Greet the user
  metadata:
    author: Somebody
    key: value
  steps:
  # list of steps
  - intent: greet
  - action: utter_greet

每个步骤可以是以下步骤之一：

用户消息，由意图(intent)和实体(entities)表示。
OR语句，其下包含两个或多个用户消息。
机器人的行为(action)。
表单(form)。
为事件设置了一个插槽。
checkpoint，把故事和另一个故事联系起来。

用户消息(User Messages)

所有用户消息都是以intent键和可选entities键指定的。
在编写故事时，您不必处理用户发送的消息的特定内容。相反，您可以利用NLU管道的输出，该管道使用意图和实体的组合来引用用户可以发送的具有相同含义的所有可能消息。
用户消息的格式如下：

stories:
- story: user message structure
  steps:
    - intent: intent_name  # Required
      entities:  # Optional
      - entity_name: entity_value
    - action: action_name

例如，要表示句子I want to check my credit balance，其中credit是一个实体：

stories:
- story: story with entities
  steps:
  - intent: account_balance
    entities:
    - account_type: credit
  - action: action_credit_account_balance

在这里包含实体也很重要，因为策略学习基于意图和实体的组合来预测下一个操作（但是，您可以使用use_entities属性更改此行为）。

行为(Actions)

机器人(bot)执行的所有操作行为都用action键指定，后跟操作的名称。在写故事时，你会遇到两种类型的行为：

响应(Responses)：由utter_开头，向用户发送特定消息。例如

stories:
- story: story with a response
  steps:
  - intent: greet
  - action: utter_greet

自定义操作(Custom actions)：由action_开头，运行任意代码并发送任意数量的消息（或不发送任何消息）。

stories:
- story: story with a custom action
  steps:
  - intent: feedback
  - action: action_store_feedback

表单(Forms)

表单(Forms)是一种特定类型的自定义操作，它包含在一组所需插槽上循环并向用户请求此信息的逻辑。您可以在域(domain)的forms部分中定义表单(forms)。定义之后，您应该为forms指定happy path作为规则。你应该在故事中加入forms的中断或其他unhappy paths，这样模型就可以推广到看不见的对话序列。作为故事中的一个步骤，表单采用以下格式：

stories:
- story: story with a form
  steps:
  - intent: find_restaurant
  - action: restaurant_form                # Activate the form
  - active_loop: restaurant_form           # This form is currently active
  - active_loop: null                      # Form complete, no form is active
  - action: utter_restaurant_found

action步骤激活forms并开始在所需的槽(slots)上循环。active_loop: restaurant_form步骤表示当前有一个活动forms。与slot_was_set步骤非常类似，form步骤不会将表单设置为活动状态，而是指示它应该已经被激活。active_loop: null步骤表示在执行后续步骤之前，不应激活任何form。
form可以中断并保持活动状态；在这种情况下，中断应该在action:

步骤之后，然后是active_loop:步骤。form的中断(interruption)可能如下所示：

stories:
- story: interrupted food
  steps:
    - intent: request_restaurant
    - action: restaurant_form
    - intent: chitchat
    - action: utter_chitchat
    - active_loop: restaurant_form
    - active_loop: null
    - action: utter_slots_values

槽(Slots)

插槽事件(slot event)在键slot_was_set下指定：具有插槽名称和可选的插槽值。
插槽充当机器人的内存。插槽由实体或自定义操作(custom actions)设置，并由slot_was_set步骤中的故事引用。例如：

stories:
- story: story with a slot
  steps:
  - intent: celebrate_bot
  - slot_was_set:
    - feedback_value: positive
  - action: utter_yay

这意味着故事要求feedback_value槽的当前值为positive，会话才能按指定继续。
是否需要包含slot的值取决于 slot类型 以及该值是否可以或应该影响对话。如果值无关紧要，请仅列出插槽的名称：

stories:
- story: story with a slot
  steps:
  - intent: greet
  - slot_was_set:
    - name
  - action: utter_greet_user_by_name

槽的工作原理
故事(Stories)不会给你设置槽(slot)。槽必须在slot_was_set步骤之前由实体(entity)或自定义操作(custom action)设置。

(Checkpoints)

在故事的开头或结尾使用checkpoint键指定Checkpoints。
Checkpoints是连接故事的方法。它们可以是故事的第一步，也可以是最后一步。如果它们是一个故事中的最后一步，那么在训练模型时，该故事将连接到以同名checkpoint开始的另一个故事。下面是一个以一个checkpoint结束的故事和一个以同一个checkpoint开始的故事的示例：

stories:
- story: story_with_a_checkpoint_1
  steps:
  - intent: greet
  - action: utter_greet
  - checkpoint: greet_checkpoint    #结束

- story: story_with_a_checkpoint_2
  steps:
  - checkpoint: greet_checkpoint    #开始
  - intent: book_flight
  - action: action_book_flight

故事开头的checkpoint也可以以设置的插槽为条件，例如：

stories:
- story: story_with_a_conditional_checkpoint
  steps:
  - checkpoint: greet_checkpoint    #开始
    # This checkpoint should only apply if slots are set to the specified value
    slot_was_set:
    - context_scenario: holiday
    - holiday_name: thanksgiving
  - intent: greet
  - action: utter_greet_thanksgiving

checkpoint可以帮助简化训练数据，减少其中的冗余，但不要过度使用(overuse)它们。使用大量checkpoint会很快让您的故事难以理解。如果在不同的故事中经常重复一系列步骤，那么使用它们是有意义的，但是没有checkpoint的故事更容易读写。

OR语句(OR statement)

or步骤是以相同的方式处理多个意图(intents)的方法，而不是为每个意图(intents)编写单独的故事。例如，如果您要求用户确认某事，您可能希望以相同的方式对待“确认(affirm)”和“感谢(thankyou)”意图。带有or步骤的故事将在训练时转换为多个单独的故事。例如，以下故事将在训练时转换为两个故事：

stories:
- story: story with OR
  steps:
  - intent: signup_newsletter
  - action: utter_ask_confirm
  - or:
    - intent: affirm
    - intent: thanks
  - action: action_signup_newsletter

就像checkpoints一样，or语句可能很有用。但是如果您使用了很多checkpoints和or语句，则最好重新构造域(domain)和意图(intents)。

不要过度使用
过度使用这些特性（checkpoints和or语句）会减慢训练速度。

规则(Rules)

规则(Rules)列在规则(rules)键下，看起来与故事类似。规则还有一个steps键，其中包含与故事相同的步骤列表。规则还可以包含conversation_started(会话)和conditions(条件)键。这些用于指定规则应适用的条件。
有条件的规则如下所示：

rules:
- rule: Only say `hey` when the user provided a name
  condition:
  - slot_was_set:
    - user_provided_name: true
  steps:
  - intent: greet
  - action: utter_greet

有关编写规则的详细信息，请参阅规则。

故事测试集(Test Stories)

测试故事(Test Stories)检查消息的分类是否正确以及行为预测(action predictions)。
测试故事(Test Stories)使用与故事(stories)相同的格式，只是用户消息步骤可以包括user键来指定用户消息的实际文本和实体注释。下面是一个测试故事的示例：

stories:
- story: A basic end-to-end test
  steps:
  - user: |
     hey
    intent: greet
  - action: utter_ask_howcanhelp
  - user: |
     show me [chinese]{
     "entity": "cuisine"} restaurants
    intent: inform
  - action: utter_ask_location
  - user: |
     in [Paris]{
     "entity": "location"}
    intent: inform
  - action: utter_ask_price

可以使用以下命令运行测试：

rasa test

端到端训练(End-to-end Training)

实验特性
端到端训练是一个实验性的特征。我们引入实验功能是为了从我们的社区获得反馈，因此我们鼓励您尝试！但是，将来可能会更改或删除该功能。如果您有反馈（正面或负面），请在Rasa论坛上与我们分享。

通过端到端训练，您不必处理由NLU管道提取的消息的特定意图。相反，您可以通过使用user键将用户消息的文本直接放到故事中。
这些端到端用户消息的格式如下：

stories:
- story: user message structure
  steps:
    - user: the actual text of the user message
    - action: action_name

此外，还可以添加可由TED策略(TED Policy)提取的实体(entity)标记。实体(entity)标记的语法与NLU训练数据中的相同。例如，下面的故事包含用户的话语I can always go for sushi(我可以一直吃寿司)。通过使用NLU训练数据中的语法[sushi]（cuisine），可以将sushi标记为cuisine类型的实体(entity)。

stories:
- story: story with entities
  steps:
  - user: I can always go for [sushi](cuisine)
  - action: utter_suggest_cuisine

类似地，您可以将bot语句直接放在故事中，方法是使用bot键，后跟希望bot说出的文本。
一个只有bot语句的故事可能是这样的：

stories:
- story: story with an end-to-end response
  steps:
  - intent: greet
    entities:
    - name: Ivan
  - bot: Hello, a person with a name!

你也可以有一个混合的端到端的故事：

stories:
- story: full end-to-end story
  steps:
  - intent: greet
    entities:
    - name: Ivan
  - bot: Hello, a person with a name!
  - intent: search_restaurant
  - action: utter_suggest_cuisine
  - user: I can always go for [sushi](cuisine)
  - bot: Personally, I prefer pizza, but sure let's search sushi restaurants
  - action: utter_suggest_cuisine
  - user: Have a beautiful day!
  - action: utter_goodbye

Rasa端到端训练完全由标准Rasa方法集成。这意味着您可以将故事与一些由操作(actions)或意图(intents)定义的步骤混合，以及由用户消息或bot响应直接定义的其他步骤。

参考

官方文档

你可能感兴趣的:(Rasa)

硅谷硬核Rasa课程、Rasa培训、Rasa面试系列之： Rasa 3.x Config StarSpaceNLP 面试职场和发展
ModelConfiguration配置文件定义了模型根据用户输入进行预测的组件和策略。recipe键允许不同类型的配置和模型架构。目前，只支持“default.v1”。语言键和管道键指定模型用于进行NLU预测的组件。Policys键定义了模型用于预测下一个操作的策略。如果您不知道要选择哪些组件或策略，可以使用建议的配置功能，这将推荐合理的默认设置。SuggestedConfig您可以将管道或策略
Rasa：开源的机器学习框架 Indra_ran 开源机器学习人工智能 linux centos 运维
一、Rasa简介Rasa是一套用来构建基于上下文的AI小助手和聊天机器人框架。分为两个主要的模块：NLU：自然语言理解模块，实现意图识别以及槽值的提取，将用户的输入转化为结构性数据，在训练过程中，为了提高从用户信息的实体识别能力，采用了预先训练的实体提取器Pre-trainedEntityExtractors，正则表达式Regexes，同义词Synonyms等RasaCore：对话管理模块，也是一
基于医疗知识图谱的问答系统基于知识图谱的多轮问答附完整代码数据详细教程计算机毕设论文深度学习-自然语言处理nlp 医疗知识知识图谱 Neo4j 多轮问答
这个项目已实现的功能：1.闲聊类的单论对话2.基于知识图谱的多轮问答数据链接：链接：https://pan.baidu.com/s/1oPr1m8aaIeoMu53OIEULPg提取码：fh39一、项目来源由于之前用Rasa构建过对话系统，因此一直想脱离Rasa这个开源框架，从底层开始构建一个可以实现相似功能的对话系统，毕竟框架用的再溜，都不如自己做一遍。恰巧在Rasa群里看到了前辈分享的一个项目
OpenEuler学习笔记（二十一）：搭建企业AI客户服务例子向上的车轮 openEuler 笔记学习笔记人工智能
在OpenEuler上搭建企业AI客服可以按照以下步骤进行，以下将以使用开源的Rasa框架作为AI客服核心，搭配前端界面展示为例：1.系统准备1.1安装OpenEuler确保你已经安装好了OpenEuler操作系统，可以从官方网站下载镜像进行安装，安装过程中根据提示完成磁盘分区、用户设置等操作。1.2更新系统使用以下命令更新系统软件包到最新版本：sudodnfupdate-y2.安装必要的依赖2.
rasa填表单激活和结束逻辑代码书写问题 active_loop关键字、写在rules中还是stories中、实际应用 Silber 甜
官方给的填表单样例是这样婶儿的https://rasa.com/docs/rasa/playground具体逻辑：1.forms文件中或domain文件中定义表单，以及表单中要填的槽位（可以定义多个槽位，rasa会按照需要的槽值顺序执行一遍。eg.nameemail）forms:newsletter_form:required_slots:name:-type:from_textemail:-ty
Rasa框架的优点和缺点不会编程的程序猿ᅟ rasa
优点1.开源和免费Rasa是开源的，无需支付许可费用，可自由下载和修改源码，适合预算有限或需要定制化解决方案的团队。企业可以完全掌控自己的对话系统，无需依赖外部服务。2.数据隐私和安全Rasa支持完全本地部署，无需将数据上传到第三方服务器，数据隐私保护性高，非常适合医疗、金融和其他注重数据安全的行业。3.高度可定制化可以根据需求修改NLU管道、策略和模型。支持自定义动作（CustomActions
Rasa的工作流程不会编程的程序猿ᅟ rasa
Rasa的工作流程分为两个主要部分：NLU（自然语言理解）和Core（对话管理）。整个流程包括从用户输入到最终响应的多个步骤，下面是详细的工作流程解析：1.用户输入用户通过聊天界面（如微信、Telegram、Slack或Web前端）发送自然语言消息，例如："我想预订一张明天去北京的火车票"2.自然语言理解（NLU）Rasa的NLU模块解析用户输入，提取意图和实体。2.1意图识别NLU模块会识别用户
执行rasa shell 遇到asyncio.exceptions.TimeoutError报错天飓 RASA学习树莓派聊天机器人 rasa python
在《树莓派3B运行rasainit和rasashell遇到的tensorflow报错总结》一文中，我遇到的第7个报错是首次运行rasashell时候碰到的。按照我在文中记录的解决方案，处理成功。结果，今天我又一次遇到了asyncio-Taskexceptionwasneverretrieved的报错（如图），我先是吃了一惊，然后第一反应是按照上次的处理方法又操作了一遍，然后……然并卵！怎么会无效？
树莓派3B运行rasa init和rasa shell遇到的tensorflow报错总结天飓树莓派实验室 tensorflow python 树莓派 rasa
终于在我的树莓派上安装rasa-1.4.0版本成功（见《树莓派智能语音助手之聊天机器人-RASA》）。不过，在初始化rasa的时候还是遇到了很多报错，在此总结，供朋友们参考。1.ModuleNotFoundError:Nomodulenamed‘tensorflow.contrib‘根源：这个报错通常出现在tensorflow-2.0版本，是因为在这个版本里已经去掉了contrib这个模块，改成了
PyTorch-线性回归一个高效工作的家伙 python pytorch 线性回归 python
已经进入大模微调的时代，但是学习pytorch，对后续学习rasa框架有一定帮助吧。x_train=np.array([[3.3],[4.4],[5.5],[6.71],[6.93],[4.168],[9.779],[6.182],[7.59],[2.167],[7.042],[10.791],[5.313],[7.997],[3.1]],dtype=np.float32)y_train=np.a
遇见最美的你|动态静心魔力Jenny
很多事情发生好像没有预兆一样，但又好像冥冥中有牵引。最近思绪比较混乱，尝试瑜伽，冥想各种方法静心，让自己慢下来，与自己待在一起。最爱的却是动态的方式~静心Partone:动态冥想开始前静心，坐住冥想片刻，找到感觉~音乐响起，站立起身，Rasa声音指引，闭上双眼，慢慢放松全身各个部位、关节，放下焦虑与戒备，开始挪动身体。随着音乐节奏和频率越来越强，Rasa带领扭动身体，睁开眼，让潜意识带着身体移动。
对话机器人（二）——RASA概述与安装就要辣谢谢。对话机器人人工智能自然语言处理深度学习
注：RASA版本为3.11.RASA简介RASA是构建对话机器人的开源机器学习框架。NLU：确定意图，捕获关键上下文信息。CORE：提供多轮对话管理机制，自动学习上下文与当前意图的关联性。2.RASA系统架构RASA开源体系结构NLU：意图分类、实体提取、响应检索。以管道的方式处理用户对话。对话管理：根据上下文决定对话中的下一个动作。代理：接收用户输入消息，返回RASA系统的回答。连接NLU和DM
自然语言处理（NLP）——使用Rasa创建聊天机器人思诺学长 NLP自然语言处理机器人 nlp 自然语言处理
1基本概念1.1自然语言处理的分类IR-BOT：检索型问答系统Task-bot：任务型对话系统Chitchat-bot:闲聊系统1.2任务型对话Task-Bot:task-orientedbot这张图展示了一个语音对话系统（或聊天机器人）的基本组成部分和它们之间的工作流程。这个系统可以接受语音信号作为输入，输出文本响应，并且它包括以下几个主要部分：1.2.1自动语音识别（ASR）这个部分的任务是将
关于MicrosoftVisualStudio如何加载不是在自己环境下安装的PIP库的问题 lckj2009 工具使用 python anaconda
因为项目需要，我把PYTHON的最新环境和PIP库建在了Anaconda3下了。Anaconda3是从网上下载的独立的安装包，不是MicrosoftVisualStudio自带的Anaconda3。RASA等框架也都装在了网上这个Anaconda3环境下的PIP库里了。结果在MicrosoftVisualStudio运行RASA库是报错，说找不到RASA库。这该怎么解决呢？其实解决方法很简单，在V
RASA3.X(二)--常见命令详解 hanscalZheng RASA RASA 命令模式
目录创建新项目训练模型交互式学习与助手交谈启动服务启动操作服务可视化故事评估模型训练和测试数据拆分创建新项目以下命令使用示例训练数据为你建立一个完整的项目。rasainit这将创建以下文件：.├──__init__.py├──actions.py├──config.yml├──credentials.yml├──data│├──nlu.md│└──stories.md├──domain.yml├─
rasa3.X 自定义action的注册问题 Guido_PSG rasa python
rasa3.X自定义action的注册问题文章目录rasa3.X自定义action的注册问题前言一、问题重述二、问题解决前言幸好在这之前抽时间稍微看了一点django源码，让我对于python的导入机制有了一个概念。虽然还不是很确切的知道pythonimport机制，不过在看到类似_import_submodules，importlib.import_module等方法的时候，也能大概知道要干什么
Rasa课程系列之：业务对话机器人Rasa核心算法DIET及TED论文详解及源码实现 StarSpaceNLP667 StarSpace NLP Transformer 算法人工智能 Rasa课程培训面试深度学习自然语言处理
对一个智能业务对话系统而言，语言理解NLU及Policies是其系统内核的两大基石。Rasa团队发布的最重磅级的两篇论文DIET:LightweightLanguageUnderstandingforDialogueSystems及DialogueTransformers是其基于在业界落地场景的多年探索而总结出来的解决NLU和Policies最核心的成果结晶：其中DIET是Intent识别和Ent
NLP 高手之路101课（模型、算法、论文、源码、案例 + 1年答疑） Eric_1694
课程名称：NLP高手之路101课（模型、算法、论文、源码、案例+1年答疑）课程关键词：NLP、Transformer、BERT、GPT、Bayesian、Rasa、Transferlearning、ConversationalAI、Classifiers、Policies、DialogueManagement、NER、Pre-training、Fine-tuning、DIET、TED、Simple
Rasa NLU-About 魏鹏飞
RasaNLU：Chatbots和AI助手的语言理解RasaNLU是一个开源自然语言处理工具，用于聊天机器人中的意图分类，响应检索和实体提取。例如，如下面这个句子："IamlookingforaMexicanrestaurantinthecenteroftown"并返回结构化数据{"intent":"search_restaurant","entities":{"cuisine":"Mexican
构建对话机器人：Rasa3安装和基础入门写bug的程旭源对话机器人 chatbot ChatGPT 自然语言处理
在开源对话机器人中，Rasa社区很活跃，在国内很多企业也在使用Rasa做对话机器人，有rasa开发经验的往往是加分项。当年实习的时候接触到了Rasa，现在工作中也使用Rasa，因此，写写一些经验文档，有助后来人的入门和研究。本文是Rasa的第一篇，偏基础入门内容，主要是本地和使用docker镜像如何安装rasa，后续会持续更新关于rasa的使用拆解每个文件功能和内部细节、如何修改配置、如何使用中文
对话机器人RASA结构和相关知识点 AI强仔 NLP 算法人工智能 python
本文主要是读了一遍rasa文档https://rasa.com/docs/rasa/installation/，总结的。目录1Rasa结构12NLUData22.1TrainingExamples22.2Entities实体22.2.1Pre-trainedEntityExtractors22.3Synonyms同义词32.4Stories32.4.1Step32.4.2Action42.4.3S
rasa算法_（十八）基于RASA开始中文机器人实现机制我读过书不要骗我 rasa算法
前文介绍了基于RASA的总体架构，本文着重介绍一下实现细节。机器人管理概述框架是多租户SAAS系统，每个用户可以创建多个机器人，每个机器人关联独立的语料库，机器人能力，话术流程，在RASA中对应一个RASA运行实例。机器人管理应用系统需要给用户提供最精简的配置UI，且可以完成Rasa需要的相关配置。然后将这些数据转成Rasa可以识别的yaml格式，保存在HDFS中。RASA到HDFS中获取配置数据
以报时机器人为例详细介绍tracker_store和event_broker NLP工程化 Rasa3源码剖析 Rasa 对话系统 tracker_store event_broker 自然语言处理
报时机器人源码参考[1][2]，本文重点介绍当tracker_store类型为SQL时，events表的表结构以及数据是如何生成的。以及当event_broker类型为SQL时，events表的表结构以及数据是如何生成的。一.报时机器人启动[3] Rasa对话系统启动方式详见参考文献[3]中执行程序部分，这里不再赘述。如下所示：1.加载模型：rasarun--cors"*"2.运行actio
Rasa中的tracker_store和event_broker NLP工程化 Rasa实战 Rasa 对话系统 tracker_store event_store
Rasa中的tracker_store相对主流为Redis，event_broker相对主流为RabbitMQ。后续为了研究学习直接将tracker_store和event_broker的type都设置为SQL，使用MySQL统一管理。一.Rasa中的tracker_store 要使用MySQL作为Rasa的tracker_store，需要在endpoints.yml文件中进行一些配置。以下
rasa框架意图分类embedding算法 233彭于晏
算法模型intent_classifier_tensorflow_embedding点击此处获取算法代码算法框架算法框架算法思想把训练样本和意图编码到同一个向量空间，设计损失函数，使得样本与真实意图更相近，样本与其他意图更相反，意图之间编码更相反，达到意图分类的目的。举个例子说明，假设有两条训练样本“我要充话费”和“我要订机票”，有四个意图“订机票”、“查天气”，“充话费”，“查运势”，意图分类算
ChatGPT和Rasa AI可以共同实现一样的效果，只需要将ChatGPT的输出作为Rasa AI的输入，然后Rasa AI可以根据输入的内容进行分析，并返回相应的回复。这样，ChatGPT和Ras... 爆燃·火星人工智能 chatgpt
是的，你说得对。ChatGPT和RasaAI是可以共同实现相同效果的，通过将ChatGPT的输出作为RasaAI的输入，RasaAI可以进行内容分析，然后根据分析结果返回相应的回复，实现两者的结合。
rasa课程第7周小结 weixin_41710583 pytorch 自然语言处理
收获01学习了GPT2的一些基本概念，重新回顾了bert中attention的基本概念和原理，了解了gpt2中mask的attention的基本原理。02看了生成模型中interact.py的内容，每次根据对话，根据设定的迭代值，预测出下一个字的内容，迭代完成后，下一句话也完成。其中彩用了topk和topp的方法，来对下个单词进行预测。03复习了关于rnn部分的相关知识点，更清楚的知道rnn在每个
对话机器人（五）——RASA：Config 就要辣谢谢。对话机器人人工智能自然语言处理 nlp
定义了模型将用于根据用户输入进行预测的组件和策略。recipe:当前配置文件所用的格式，rasa仅支持default.v1格式。recipe:default.v1language:enpipeline:#将由SuggestedConfig功能选择policies:-name:MemoizationPolicy-name:TEDPolicymax_history:5epochs:101.piplin
RASA智能聊天机器人，理论与技术 Taizhuang_ RASA 智能聊天机器人多轮对话机器人 python
一，智能聊天机器人一种通过自然语言模拟人类进行对话的程序可以代替企业中相对固话、重复的人力密集型任务或流程-问题咨询:基于业务知识库进行业务问题解答-数据检索:纵跨各业务系统或数据库，检索数据或文档-业务处理:对接相关业务系统转达指令，完成相应业务操作典型业务场景∶-业务咨询问答机器人、智能客服机器人、行政助理机器人、产品推荐机器人….对外提供客户服务，对内进行业务辅助智能化的机器人可以带来全方位
RasaGPT对话系统的工作原理 NLP工程化自然语言处理 Rasa Langchain 对话系统
RasaGPT结合了Rasa和Langchain这2个开源项目，当超出Rasa现有意图(out_of_scope)的时候，就会执行ActionGPTFallback，本质上就是利用Langchain做了一个RAG，调用LLMAPI。RasaGPT涉及的技术栈比较多而复杂，包括Rasa、Langchain、LlamaIndex、Telegram、PostgresSQL、PGVector、Ngrok、
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST