JasonLiu1919

Rasa教程系列-NLU-4-组件

注意：
为了清晰起见，官方重新命名了预定义的管道，以反映它们做了什么，而不是在Rasa NLU 0.15中使用了哪些库。tensorflow_embed_embeddings管道现在称为supervised_embeddings, spacy_sklearn现在称为pretrained_embeddings_spacy。如果你正在使用这些，请更新代码吧。

本文是Rasa NLU中每个内置组件配置选项的参考。如果希望构建自定义组件，请查看自定义NLU组件。

文章目录

1. 词向量

1.1 MitieNLP
1.2 SpacyNLP

2. 文本特征化

2.1 MitieFeaturizer
2.2 SpacyFeaturizer
2.3 ConveRTFeaturizer
2.4 RegexFeaturizer
2.5 CountVectorsFeaturizer

3. 意图分类器

3.1 MitieIntentClassifier
3.2 SklearnIntentClassifier
3.3 EmbeddingIntentClassifier
3.4 KeywordIntentClassifier

4. 选择器Selectors
5. 分词器Tokenizers

5.1 WhitespaceTokenizer
5.2 JiebaTokenizer
5.3 MitieTokenizer
5.4 SpacyTokenizer

6. 实体抽取器Entity Extractors

6.1 MitieEntityExtractor
6.2 SpacyEntityExtractor
6.3 EntitySynonymMapper
6.4 CRFEntityExtractor
6.5 DucklingHTTPExtractor

1. 词向量

1.1 MitieNLP

MitieNLP	说明
Short：	MITIE initializer，即`MitieNLP`是`MITIE initializer`的简称。
Outputs：	无
Requires：	无
描述：	初始化mitie结构。每个mitie组件都依赖于此，因此应该将其放在任何使用mitie组件的每个管道的开头。
Configuration：	MITIE库需要一个语言模型文件，必须在配置中指定如下:

pipeline:
- name: "MitieNLP"
  # language model to load
  model: "data/total_word_feature_extractor.dat"

更多关于MITIE的可以进一步查阅链接标题

1.2 SpacyNLP

SpacyNLP	说明
Short：	spacy language initializer
Outputs：	无
Requires：	无
描述：	初始化spacy的结构。每个spacy组件都依赖于此，因此应该将其放在使用spacy组件的每个管道的开头。
Configuration：	语言模型，默认将使用配置的语言。如果要使用的spacy模型的名称不同于language标记(“en”、“de”等)，则可以使用配置变量指定模型名称，将名称将传递给模型：`space.load(name)`。

pipeline:
- name: "SpacyNLP"
  # language model to load
  model: "en_core_web_md"

  # when retrieving word vectors, this will decide if the casing
  # of the word is relevant. E.g. `hello` and `Hello` will
  # retrieve the same vector, if set to `false`. For some
  # applications and models it makes sense to differentiate
  # between these two words, therefore setting this to `true`.
  case_sensitive: false

2. 文本特征化

文本 featurizers 分为两类：稀疏 featurizers 和稠密 featurizers 。稀疏 featurizers 返回的特征向量中有很多缺失值，比如值为0。由于这些特征向量通常会占用大量内存，所以将它们存储为稀疏特征。稀疏特征只存储非零值及其在向量中的位置。因此，可以节省了大量内存，能够在更大的数据集上训练。

默认情况下所有featurizers将返回一个长矩阵(大小为1x特征维度)。所有featurizer(除了ConveRTFeaturizer)可以选择返回一个序列。如果标志“return_sequence”设置为True,featurizer返回大小为token-length x特征维度的矩阵。所以,返回矩阵中每一个token都有一个对应的entry。否则，矩阵对整个句子将只有一个entry。如果想使用自定义特性CRFEntityExtractor，应该设置“return_sequence”真。更多细节,看看传递自定义特性到CRFEntityExtractor。

2.1 MitieFeaturizer

MitieFeaturizer	说明
Short：	MITIE intent featurizer
Outputs：	无，作为意图分类器的输入(例如`SklearnIntentClassifier`)
Requires：	MitieNLP
Type：	稠密featurizer
描述：	使用MITIE featurizer为意图分类创建特性。需要注意的是：`MitieIntentClassifier`组件中并没有使用。目前，只有`SklearnIntentClassifier`能够使用预先计算的特性。
Configuration：	配置方法如下：

pipeline:
- name: "MitieFeaturizer"

2.2 SpacyFeaturizer

SpacyFeaturizer	说明
Short：	spacy intent featurizer
Outputs：	无，作为意图分类器的输入(例如`SklearnIntentClassifier`)
Requires：	SpacyNLP
Type：	稠密featurizer
描述：	使用spacy featurizer为意图分类创建特性
Configuration：	配置方法如下：

pipeline:
- name: "SpacyFeaturizer"

2.3 ConveRTFeaturizer

ConveRTFeaturizer	说明
Short：	使用ConveRT模型创建用户消息和响应(如果指定的话)的向量表示
Outputs：	无，作为意图分类器和response selectors的输入，分别对应意图特征和响应特征。比如`EmbeddingIntentClassifier`和`ResponseSelector`
Requires：	无
Type：	稠密featurizer
描述：	为意图分类和response selection创建特性，使用默认签名来计算输入文本的向量表示。需要注意：(1)由于`ConveRT`模型仅在英语语料上训练，因此只有当训练数据是英语语言时才能使用这个featurizer。 (2)使用之前需要安装`tensorflow_text`和`tensorflow_hub`)，可以通过`pip install rasa[convert]`来安装。(3)当把`return_sequence`设置为True，Rasa将抛出一个错误，表示该选项目前不受支持。不要将此featurizer与任何其他featurizer的选项`“return_sequence”`设置为true时进行联合使用，否则训练将失败。但是，可以将这个featurizer与其他任何featurizer一起使用，只要将`“return_sequence”`设置为False即可。
Configuration：	配置方法如下：

pipeline:
- name: "ConveRTFeaturizer"

2.4 RegexFeaturizer

RegexFeaturizer	说明
Short：	创建正则特征以支持意图和实体分类
Outputs：	`text_features` and `tokens.pattern`
Requires：	无
Type：	稀疏 featurizer
描述：	为实体提取和意图分类创建特性。在训练期间，regex intent featurizer 以训练数据的格式创建一系列正则表达式列表。对于每个正则，都将设置一个特征，标记是否在输入中找到该表达式，然后将其输入到intent classifier / entity extractor 中以简化分类(假设分类器在训练阶段已经学习了该特征集合，该特征集合表示一定的意图)。将Regex特征用于实体提取目前仅`CRFEntityExtractor`组件支持!

注意：
在 featurizer 之前需要先进行 tokenizer ！

2.5 CountVectorsFeaturizer

CountVectorsFeaturizer	说明
Short：	创建用户信息和标签(意图和响应)的词袋表征
Outputs：	无，用作意图分类器的输入，输入的意图特性以词袋表征(如`EmbeddingIntentClassifier`)
Requires：	无
Type：	稀疏 featurizer
描述：	为意图分类和 response selection创建特征。使用`sklearn`的`CountVectorizer`创建用户消息和标签特征的词袋表征。所有token仅由数字组成(如123和99，但不会存在a123d)将被分配到相同的功能。
Configuration：	通过`analyzer`参数能将featurizer配置为 word 或 character n-grams。默认下，`analyzer`是设置为 `word`，所以 word token计数作为特征。如果想要设置为`character n-grams`可以将`analyzer`设置为`char` 或 `char_wb`。`char_wb`仅从单词边界内的文本创建character n-grams;单词边缘的n-gram用空格填充。此选项可用于创建Subword Semantic Hashing。对于character n-grams，不要忘记增加`min_ngram`和`max_ngram`参数。否则，词汇表将只包含单个字母。另外，在处理OOV上，由于训练是在有限的词汇数据上进行的，因此不能保证在预测过程中算法不会遇到未知的单词(在训练过程中没有看到的单词，即OOV)。为了教算法如何处理未知的单词，训练数据中的一些单词可以用通用单词`OOV_token`代替。在这种情况下，在预测期间，所有未知单词将被视为通用单词`OOV_token`。

例如，可以在训练数据中创建单独的intent outofscope，其中包含不同数量的OOV_token消息，可能还包含一些附加的通用单词。然后，算法可能会将含有未知单词的消息的意图分类为outofscope。

pipeline:
- name: "CountVectorsFeaturizer"
  # whether to use a shared vocab
  "use_shared_vocab": False,
  # whether to use word or character n-grams
  # 'char_wb' creates character n-grams only inside word boundaries
  # n-grams at the edges of words are padded with space.
  analyzer: 'word'  # use 'char' or 'char_wb' for character
  # the parameters are taken from
  # sklearn's CountVectorizer
  # regular expression for tokens
  token_pattern: r'(?u)\b\w\w+\b'
  # remove accents during the preprocessing step
  strip_accents: None  # {'ascii', 'unicode', None}
  # list of stop words
  stop_words: None  # string {'english'}, list, or None (default)
  # min document frequency of a word to add to vocabulary
  # float - the parameter represents a proportion of documents
  # integer - absolute counts
  min_df: 1  # float in range [0.0, 1.0] or int
  # max document frequency of a word to add to vocabulary
  # float - the parameter represents a proportion of documents
  # integer - absolute counts
  max_df: 1.0  # float in range [0.0, 1.0] or int
  # set ngram range
  min_ngram: 1  # int
  max_ngram: 1  # int
  # limit vocabulary size
  max_features: None  # int or None
  # if convert all characters to lowercase
  lowercase: true  # bool
  # handling Out-Of-Vacabulary (OOV) words
  # will be converted to lowercase if lowercase is true
  OOV_token: None  # string or None
  OOV_words: []  # list of strings

注意：
如果模型语言中的单词不能用空格分隔，则在此组件之前的管道中需要一个特定语言的tokenizer (例如，对于中文使用JiebaTokenizer)。

3. 意图分类器

3.1 MitieIntentClassifier

MitieIntentClassifier	说明
Short：	MITIE intent classifier (使用text categorizer)
Outputs：	意图
Requires：	tokenizer 和 featurizer
Output-Example：	`{"intent": {"name": "greet", "confidence": 0.98343}}`
描述：	该分类器使用MITIE进行意图分类。底层分类器使用的是具有稀疏线性核的多类线性支持向量机(可以查看MITIE trainer code)
Configuration：	具体配置如下：

pipeline:
- name: "MitieIntentClassifier"

3.2 SklearnIntentClassifier

SklearnIntentClassifier	说明
Short：	sklearn intent classifier
Outputs：	意图和意图排名
Requires：	一个featurizer
Output-Example：	`{"intent": {"name": "greet", "confidence": 0.78343},"intent_ranking": [{"confidence": 0.1485910906220309,"name": "goodbye"},{"confidence": 0.08161531595656784,"name":"restaurant_search"}]}`
描述：	该sklearn意图分类器训练一个线性支持向量机，该支持向量机通过网格搜索得到优化。除了其他分类器，它还提供没有“获胜”的标签的排名。spacy意图分类器需要在管道中的先加入一个featurizer。该featurizer创建用于分类的特征。
Configuration：	在SVM的训练过程中，会运行超参数搜索，以找到最佳的参数集。在配置中，可以指定将要尝试的参数，具体配置如下：

pipeline:
- name: "SklearnIntentClassifier"
  # Specifies the list of regularization values to
  # cross-validate over for C-SVM.
  # This is used with the ``kernel`` hyperparameter in GridSearchCV.
  C: [1, 2, 5, 10, 20, 100]
  # Specifies the kernel to use with C-SVM.
  # This is used with the ``C`` hyperparameter in GridSearchCV.
  kernels: ["linear"]

3.3 EmbeddingIntentClassifier

EmbeddingIntentClassifier	说明
Short：	Embedding intent classifier
Outputs：	意图和意图排名
Requires：	一个featurizer
描述：	嵌入式意图分类器将用户输入和意图标签嵌入到同一空间中。Supervised embeddings通过最大化它们之间的相似性来训练。该算法基于StarSpace的。但是，在这个实现中，损失函数略有不同，添加了额外的隐藏层和dropout。该算法还提供了未“获胜”标签的相似度排序。在embedding intent classifier之前，需要在管道中加入一个featurizer。该featurizer创建用以embeddings的特征。建议使用`CountVectorsFeaturizer`，它可选的预处理有`SpacyNLP`和`SpacyTokenizer`。
Configuration：	算法涉及大超参数，较多这里就不一一列出。

在配置中，可以指定这些参数。在embeddingintentclassifier.default中定义了默认值：

defaults = {
    # nn architecture
    # sizes of hidden layers before the embedding layer for input words
    # the number of hidden layers is thus equal to the length of this list
    "hidden_layers_sizes_a": [256, 128],
    # sizes of hidden layers before the embedding layer for intent labels
    # the number of hidden layers is thus equal to the length of this list
    "hidden_layers_sizes_b": [],
    # Whether to share the hidden layer weights between input words and labels
    "share_hidden_layers": False,
    # training parameters
    # initial and final batch sizes - batch size will be
    # linearly increased for each epoch
    "batch_size": [64, 256],
    # how to create batches
    "batch_strategy": "balanced",  # string 'sequence' or 'balanced'
    # number of epochs
    "epochs": 300,
    # set random seed to any int to get reproducible results
    "random_seed": None,
    # embedding parameters
    # default dense dimension used if no dense features are present
    "dense_dim": {"text": 512, "label": 20},
    # dimension size of embedding vectors
    "embed_dim": 20,
    # the type of the similarity
    "num_neg": 20,
    # flag if minimize only maximum similarity over incorrect actions
    "similarity_type": "auto",  # string 'auto' or 'cosine' or 'inner'
    # the type of the loss function
    "loss_type": "softmax",  # string 'softmax' or 'margin'
    # how similar the algorithm should try
    # to make embedding vectors for correct labels
    "mu_pos": 0.8,  # should be 0.0 < ... < 1.0 for 'cosine'
    # maximum negative similarity for incorrect labels
    "mu_neg": -0.4,  # should be -1.0 < ... < 1.0 for 'cosine'
    # flag: if true, only minimize the maximum similarity for incorrect labels
    "use_max_sim_neg": True,
    # scale loss inverse proportionally to confidence of correct prediction
    "scale_loss": True,
    # regularization parameters
    # the scale of L2 regularization
    "C2": 0.002,
    # the scale of how critical the algorithm should be of minimizing the
    # maximum similarity between embeddings of different labels
    "C_emb": 0.8,
    # dropout rate for rnn
    "droprate": 0.2,
    # visualization of accuracy
    # how often to calculate training accuracy
    "evaluate_every_num_epochs": 20,  # small values may hurt performance
    # how many examples to use for calculation of training accuracy
    "evaluate_on_num_examples": 0,  # large values may hurt performance
}

Output-Example如下：

{
    "intent": {"name": "greet", "confidence": 0.8343},
    "intent_ranking": [
        {
            "confidence": 0.385910906220309,
            "name": "goodbye"
        },
        {
            "confidence": 0.28161531595656784,
            "name": "restaurant_search"
        }
    ]
}

注意：
如果在预测期间，一条消息只包含在训练期间没有看到的单词，并且没有使用out - of -vacary预处理器，则将以置信度0.0预测为空意图None。

3.4 KeywordIntentClassifier

KeywordIntentClassifier	说明
Short：	简单的关键字匹配意图分类器，适于小型、短期的项目
Outputs：	意图
Requires：	无
Output-Example：	`{"intent": {"name": "greet", "confidence": 1.0}}`
描述：	该分类器通过搜索关键字的消息来工作。默认情况下，匹配是大小写敏感的，只精确匹配地搜索用户消息中关键字。意图的关键字是NLU训练数据中意图的例子。这意味着整个示例是关键字，而不是示例中的单个单词。注意：此分类器仅用于小型项目或入门级项目。如果你有很少的NLU训练数据，则可以试试管道选择中一个管道。
Configuration：	配置如下：

pipeline:
- name: "KeywordIntentClassifier"
  case_sensitive: True

4. 选择器Selectors

Response Selector	说明
Short：	Response Selector
Outputs：	一个字典，关键字`direct_response_intent`，`value`属性包含`response`和`ranking`
Requires：	A featurizer
描述：	Response Selector组件可用以创建回复的召回模型，从而直接得到机器人的候选回复。模型的预测通过Retrieval Actions实现，将用户输入和回复标签嵌入到同一空间，所使用的神经网络架构和优化方法与`EmbeddingIntentClassifier`一样。在管道中的响应选择器 response selector 之前需要有一个featurizer。该featurizer创建用于embeddings的特征。建议使用`CountVectorsFeaturizer`，它可以选择由`SpacyNLP`先处理。
Configuration：	包含了`EmbeddingIntentClassifier`使用的所有超参数。此外，还可以将组件配置为针对特定检索意图训练一个响应选择器。`ResponseSelector.defaults`中可以查看默认值：

defaults = {
    # nn architecture
    # sizes of hidden layers before the embedding layer for input words
    # the number of hidden layers is thus equal to the length of this list
    "hidden_layers_sizes_a": [256, 128],
    # sizes of hidden layers before the embedding layer for intent labels
    # the number of hidden layers is thus equal to the length of this list
    "hidden_layers_sizes_b": [256, 128],
    # Whether to share the hidden layer weights between input words and intent labels
    "share_hidden_layers": False,
    # training parameters
    # initial and final batch sizes - batch size will be
    # linearly increased for each epoch
    "batch_size": [64, 256],
    # how to create batches
    "batch_strategy": "balanced",  # string 'sequence' or 'balanced'
    # number of epochs
    "epochs": 300,
    # set random seed to any int to get reproducible results
    "random_seed": None,
    # embedding parameters
    # default dense dimension used if no dense features are present
    "dense_dim": {"text": 512, "label": 20},
    # dimension size of embedding vectors
    "embed_dim": 20,
    # the type of the similarity
    "num_neg": 20,
    # flag if minimize only maximum similarity over incorrect actions
    "similarity_type": "auto",  # string 'auto' or 'cosine' or 'inner'
    # the type of the loss function
    "loss_type": "softmax",  # string 'softmax' or 'margin'
    # how similar the algorithm should try
    # to make embedding vectors for correct intent labels
    "mu_pos": 0.8,  # should be 0.0 < ... < 1.0 for 'cosine'
    # maximum negative similarity for incorrect intent labels
    "mu_neg": -0.4,  # should be -1.0 < ... < 1.0 for 'cosine'
    # flag: if true, only minimize the maximum similarity for
    # incorrect intent labels
    "use_max_sim_neg": True,
    # scale loss inverse proportionally to confidence of correct prediction
    "scale_loss": True,
    # regularization parameters
    # the scale of L2 regularization
    "C2": 0.002,
    # the scale of how critical the algorithm should be of minimizing the
    # maximum similarity between embeddings of different intent labels
    "C_emb": 0.8,
    # dropout rate for rnn
    "droprate": 0.2,
    # visualization of accuracy
    # how often to calculate training accuracy
    "evaluate_every_num_epochs": 20,  # small values may hurt performance
    # how many examples to use for calculation of training accuracy
    "evaluate_on_num_examples": 0,  # large values may hurt performance,
    # selector config
    # name of the intent for which this response selector is to be trained
    "retrieval_intent": None,
}

其中retrieval_intent：设置训练此响应选择器模型的意图的名称。默认是None

Output-Example：

{
    "text": "What is the recommend python version to install?",
    "entities": [],
    "intent": {"confidence": 0.6485910906220309, "name": "faq"},
    "intent_ranking": [
        {"confidence": 0.6485910906220309, "name": "faq"},
        {"confidence": 0.1416153159565678, "name": "greet"}
    ],
    "response_selector": {
      "faq": {
        "response": {"confidence": 0.7356462617, "name": "Supports 3.5, 3.6 and 3.7, recommended version is 3.6"},
        "ranking": [
            {"confidence": 0.7356462617, "name": "Supports 3.5, 3.6 and 3.7, recommended version is 3.6"},
            {"confidence": 0.2134543431, "name": "You can ask me about how to get started"}
        ]
      }
    }
}

5. 分词器Tokenizers

5.1 WhitespaceTokenizer

WhitespaceTokenizer	说明
Short：	Tokenizer using whitespaces as a separator
Outputs：	无
Requires：	无
描述：	为每个以空格分隔的字符序列创建token。定义的token可用于MITIE实体提取器。
Configuration：	如果想把意图分成多个标签，例如，为了预测多个意图或为分层的意图结构建模，使用`intent_split_symbol`标志。可以通过`case_sensitive`设置是否大小写敏感。

5.2 JiebaTokenizer

JiebaTokenizer	说明
Short：	使用Jieba作为 Tokenizer
Outputs：	无
Requires：	无
描述：	用于中文的Tokenizer，对于其他语种Jieba会如`WhitespaceTokenizer`般工作。JiebaTokenizer可为MITIE实体抽取器定义token。
Configuration：	用户的自定义字典文件可以通过特定的文件目录路径`dictionary_path`自动加载。具体示例：

pipeline:
- name: "JiebaTokenizer"
  dictionary_path: "path/to/custom/dictionary/dir"

5.3 MitieTokenizer

MitieTokenizer	说明
Short：	Tokenizer using MITIE
Outputs：	无
Requires：	MitieNLP
描述：	用MITIE tokenizer创建tokens，从而服务于 MITIE 实体抽取
Configuration：	示例如下：

pipeline:
- name: "MitieTokenizer"

5.4 SpacyTokenizer

SpacyTokenizer	说明
Short：	Tokenizer using spacy
Outputs：	无
Requires：	SpacyNLP
描述：	用spacy tokenizer创建tokens，从而服务于 MITIE 实体抽取

6. 实体抽取器Entity Extractors

6.1 MitieEntityExtractor

MitieEntityExtractor	说明
Short：	MITIE entity extraction (使用MITIE NER trainer)
Outputs：	entities
Requires：	MitieNLP
描述：	用 MITIE entity extraction抽取语句中的实体。底层分类器使用具有稀疏线性核和自定义特征的多类线性支持向量机。该MITIE组件不提供实体置信值。
Configuration：	配置示例如下：

pipeline:
- name: "MitieEntityExtractor"

Output-Example：

{
    "entities": [{"value": "New York City",
                  "start": 20,
                  "end": 33,
                  "confidence": null,
                  "entity": "city",
                  "extractor": "MitieEntityExtractor"}]
}

6.2 SpacyEntityExtractor

SpacyEntityExtractor	说明
Short：	spaCy entity extraction
Outputs：	entities
Requires：	SpacyNLP
描述：	该组件使用spaCy来预测消息的实体。spacy使用统计BILOU转移模型。到目前为止，该组件只能使用spacy内置的实体提取模型，不能进行再训练。此提取器不提供任何置信评分。
Configuration：	配置spacy组件应该提取哪些维度，比如实体类型。可用维度的完整列表可以在spaCy文档中找到。不指定维度选项将提取所有可用维度。具体示例如下：

pipeline:
- name: "SpacyEntityExtractor"
  # dimensions to extract
  dimensions: ["PERSON", "LOC", "ORG", "PRODUCT"]

Output-Example：

{
    "entities": [{"value": "New York City",
                  "start": 20,
                  "end": 33,
                  "entity": "city",
                  "confidence": null,
                  "extractor": "SpacyEntityExtractor"}]
}

6.3 EntitySynonymMapper

EntitySynonymMapper	说明
Short：	将同义词映射到同一个值
Outputs：	修改以前的实体提取组件找到的现有实体
Requires：	无
描述：	如果训练数据包含已定义的同义词(通过对实体示例使用`value`属性)。此组件将确保检测到的实体值映射到相同的值。例如，如果训练数据包含以下例子:

[{
  "text": "I moved to New York City",
  "intent": "inform_relocation",
  "entities": [{"value": "nyc",
                "start": 11,
                "end": 24,
                "entity": "city",
               }]
},
{
  "text": "I got a new flat in NYC.",
  "intent": "inform_relocation",
  "entities": [{"value": "nyc",
                "start": 20,
                "end": 23,
                "entity": "city",
               }]
}]

该组件将实体New York City和NYC映射到nyc。即使消息包含NYC，实体提取将返回nyc。当该组件更改现有实体时，它将自己附加到该实体的处理器列表中。

6.4 CRFEntityExtractor

CRFEntityExtractor	说明
Short：	条件随机场实体抽取器
Outputs：	entities
Requires：	一个tokenizer
描述：	此组件使用条件随机场来进行命名实体识别。CRFs可以被认为是一个无向的马尔可夫链，其中时间步长是单词，状态是实体类别。单词的特征(大写，词性标注POS，等等)给出了特定实体类别的概率，就像相邻实体标记之间的转换一样：然后计算并返回最可能的标记结果。如果使用POS功能(pos或pos2)，则必须安装spaCy。如果想使用额外的功能，如预训练的词嵌入，稠密的featurizer，则可以使用`“text_dense_features”`。确保在相应的featurizer中将`“return_sequence”`设置为True。
Configuration：	配置示例如下：

pipeline:
- name: "CRFEntityExtractor"
  # The features are a ``[before, word, after]`` array with
  # before, word, after holding keys about which
  # features to use for each word, for example, ``"title"``
  # in array before will have the feature
  # "is the preceding word in title case?".
  # Available features are:
  # ``low``, ``title``, ``suffix5``, ``suffix3``, ``suffix2``,
  # ``suffix1``, ``pos``, ``pos2``, ``prefix5``, ``prefix2``,
  # ``bias``, ``upper``, ``digit``, ``pattern``, and ``text_dense_features``
  features: [["low", "title"], ["bias", "suffix3"], ["upper", "pos", "pos2"]]

  # The flag determines whether to use BILOU tagging or not. BILOU
  # tagging is more rigorous however
  # requires more examples per entity. Rule of thumb: use only
  # if more than 100 examples per entity.
  BILOU_flag: true

  # This is the value given to sklearn_crfcuite.CRF tagger before training.
  max_iterations: 50

  # This is the value given to sklearn_crfcuite.CRF tagger before training.
  # Specifies the L1 regularization coefficient.
  L1_c: 0.1

  # This is the value given to sklearn_crfcuite.CRF tagger before training.
  # Specifies the L2 regularization coefficient.
  L2_c: 0.1

Output-Example：

{
    "entities": [{"value":"New York City",
                  "start": 20,
                  "end": 33,
                  "entity": "city",
                  "confidence": 0.874,
                  "extractor": "CRFEntityExtractor"}]
}

6.5 DucklingHTTPExtractor

DucklingHTTPExtractor	说明
Short：	借助Duckling可以提取诸如日期、金额、距离等常见实体，且适用于多种语言。
Outputs：	entities
Requires：	无
描述：	为了使用该组件需要启动一个duckling server。最简单的选择是使用docker container：`docker run -p 8000:8000 rasa/duckling`。另外，也可以直接在机器上安装Duckling再启动服务。Duckling可以识别日期、数字、距离和其他结构化实体和规范。请注意,duckling 试图提取尽可能多的实体类型，但没有提供排名。例如，对于文本`I will be there in 10 minutes`。如果在duckling组件内同时指定`number`和`time`维度,则该组件将提取两个实体：`10`作为数字和`10 minutes`作为时间。在这种情况下,应用程序必须决定哪些实体类型是正确的。抽取器将始终返回1.0的置信度,因为这是一个基于规则的系统。
Configuration：	配置duckling组件应该提取哪些维度，即实体类型。在duckling文档中可以找到可用维度的完整列表。不指定维度选项将提取所有可用维度。具体的配置示例如下：

pipeline:
- name: "DucklingHTTPExtractor"
  # url of the running duckling server
  url: "http://localhost:8000"
  # dimensions to extract
  dimensions: ["time", "number", "amount-of-money", "distance"]
  # allows you to configure the locale, by default the language is
  # used
  locale: "de_DE"
  # if not set the default timezone of Duckling is going to be used
  # needed to calculate dates from relative expressions like "tomorrow"
  timezone: "Europe/Berlin"
  # Timeout for receiving response from http url of the running duckling server
  # if not set the default timeout of duckling http url is set to 3 seconds.
  timeout : 3

Output-Example：

{
    "entities": [{"end": 53,
                  "entity": "time",
                  "start": 48,
                  "value": "2017-04-10T00:00:00.000+02:00",
                  "confidence": 1.0,
                  "extractor": "DucklingHTTPExtractor"}]
}

你可能感兴趣的:(Rasa)

硅谷硬核Rasa课程、Rasa培训、Rasa面试系列之： Rasa 3.x Config StarSpaceNLP 面试职场和发展
ModelConfiguration配置文件定义了模型根据用户输入进行预测的组件和策略。recipe键允许不同类型的配置和模型架构。目前，只支持“default.v1”。语言键和管道键指定模型用于进行NLU预测的组件。Policys键定义了模型用于预测下一个操作的策略。如果您不知道要选择哪些组件或策略，可以使用建议的配置功能，这将推荐合理的默认设置。SuggestedConfig您可以将管道或策略
Rasa：开源的机器学习框架 Indra_ran 开源机器学习人工智能 linux centos 运维
一、Rasa简介Rasa是一套用来构建基于上下文的AI小助手和聊天机器人框架。分为两个主要的模块：NLU：自然语言理解模块，实现意图识别以及槽值的提取，将用户的输入转化为结构性数据，在训练过程中，为了提高从用户信息的实体识别能力，采用了预先训练的实体提取器Pre-trainedEntityExtractors，正则表达式Regexes，同义词Synonyms等RasaCore：对话管理模块，也是一
基于医疗知识图谱的问答系统基于知识图谱的多轮问答附完整代码数据详细教程计算机毕设论文深度学习-自然语言处理nlp 医疗知识知识图谱 Neo4j 多轮问答
这个项目已实现的功能：1.闲聊类的单论对话2.基于知识图谱的多轮问答数据链接：链接：https://pan.baidu.com/s/1oPr1m8aaIeoMu53OIEULPg提取码：fh39一、项目来源由于之前用Rasa构建过对话系统，因此一直想脱离Rasa这个开源框架，从底层开始构建一个可以实现相似功能的对话系统，毕竟框架用的再溜，都不如自己做一遍。恰巧在Rasa群里看到了前辈分享的一个项目
OpenEuler学习笔记（二十一）：搭建企业AI客户服务例子向上的车轮 openEuler 笔记学习笔记人工智能
在OpenEuler上搭建企业AI客服可以按照以下步骤进行，以下将以使用开源的Rasa框架作为AI客服核心，搭配前端界面展示为例：1.系统准备1.1安装OpenEuler确保你已经安装好了OpenEuler操作系统，可以从官方网站下载镜像进行安装，安装过程中根据提示完成磁盘分区、用户设置等操作。1.2更新系统使用以下命令更新系统软件包到最新版本：sudodnfupdate-y2.安装必要的依赖2.
rasa填表单激活和结束逻辑代码书写问题 active_loop关键字、写在rules中还是stories中、实际应用 Silber 甜
官方给的填表单样例是这样婶儿的https://rasa.com/docs/rasa/playground具体逻辑：1.forms文件中或domain文件中定义表单，以及表单中要填的槽位（可以定义多个槽位，rasa会按照需要的槽值顺序执行一遍。eg.nameemail）forms:newsletter_form:required_slots:name:-type:from_textemail:-ty
Rasa框架的优点和缺点不会编程的程序猿ᅟ rasa
优点1.开源和免费Rasa是开源的，无需支付许可费用，可自由下载和修改源码，适合预算有限或需要定制化解决方案的团队。企业可以完全掌控自己的对话系统，无需依赖外部服务。2.数据隐私和安全Rasa支持完全本地部署，无需将数据上传到第三方服务器，数据隐私保护性高，非常适合医疗、金融和其他注重数据安全的行业。3.高度可定制化可以根据需求修改NLU管道、策略和模型。支持自定义动作（CustomActions
Rasa的工作流程不会编程的程序猿ᅟ rasa
Rasa的工作流程分为两个主要部分：NLU（自然语言理解）和Core（对话管理）。整个流程包括从用户输入到最终响应的多个步骤，下面是详细的工作流程解析：1.用户输入用户通过聊天界面（如微信、Telegram、Slack或Web前端）发送自然语言消息，例如："我想预订一张明天去北京的火车票"2.自然语言理解（NLU）Rasa的NLU模块解析用户输入，提取意图和实体。2.1意图识别NLU模块会识别用户
执行rasa shell 遇到asyncio.exceptions.TimeoutError报错天飓 RASA学习树莓派聊天机器人 rasa python
在《树莓派3B运行rasainit和rasashell遇到的tensorflow报错总结》一文中，我遇到的第7个报错是首次运行rasashell时候碰到的。按照我在文中记录的解决方案，处理成功。结果，今天我又一次遇到了asyncio-Taskexceptionwasneverretrieved的报错（如图），我先是吃了一惊，然后第一反应是按照上次的处理方法又操作了一遍，然后……然并卵！怎么会无效？
树莓派3B运行rasa init和rasa shell遇到的tensorflow报错总结天飓树莓派实验室 tensorflow python 树莓派 rasa
终于在我的树莓派上安装rasa-1.4.0版本成功（见《树莓派智能语音助手之聊天机器人-RASA》）。不过，在初始化rasa的时候还是遇到了很多报错，在此总结，供朋友们参考。1.ModuleNotFoundError:Nomodulenamed‘tensorflow.contrib‘根源：这个报错通常出现在tensorflow-2.0版本，是因为在这个版本里已经去掉了contrib这个模块，改成了
PyTorch-线性回归一个高效工作的家伙 python pytorch 线性回归 python
已经进入大模微调的时代，但是学习pytorch，对后续学习rasa框架有一定帮助吧。x_train=np.array([[3.3],[4.4],[5.5],[6.71],[6.93],[4.168],[9.779],[6.182],[7.59],[2.167],[7.042],[10.791],[5.313],[7.997],[3.1]],dtype=np.float32)y_train=np.a
遇见最美的你|动态静心魔力Jenny
很多事情发生好像没有预兆一样，但又好像冥冥中有牵引。最近思绪比较混乱，尝试瑜伽，冥想各种方法静心，让自己慢下来，与自己待在一起。最爱的却是动态的方式~静心Partone:动态冥想开始前静心，坐住冥想片刻，找到感觉~音乐响起，站立起身，Rasa声音指引，闭上双眼，慢慢放松全身各个部位、关节，放下焦虑与戒备，开始挪动身体。随着音乐节奏和频率越来越强，Rasa带领扭动身体，睁开眼，让潜意识带着身体移动。
对话机器人（二）——RASA概述与安装就要辣谢谢。对话机器人人工智能自然语言处理深度学习
注：RASA版本为3.11.RASA简介RASA是构建对话机器人的开源机器学习框架。NLU：确定意图，捕获关键上下文信息。CORE：提供多轮对话管理机制，自动学习上下文与当前意图的关联性。2.RASA系统架构RASA开源体系结构NLU：意图分类、实体提取、响应检索。以管道的方式处理用户对话。对话管理：根据上下文决定对话中的下一个动作。代理：接收用户输入消息，返回RASA系统的回答。连接NLU和DM
自然语言处理（NLP）——使用Rasa创建聊天机器人思诺学长 NLP自然语言处理机器人 nlp 自然语言处理
1基本概念1.1自然语言处理的分类IR-BOT：检索型问答系统Task-bot：任务型对话系统Chitchat-bot:闲聊系统1.2任务型对话Task-Bot:task-orientedbot这张图展示了一个语音对话系统（或聊天机器人）的基本组成部分和它们之间的工作流程。这个系统可以接受语音信号作为输入，输出文本响应，并且它包括以下几个主要部分：1.2.1自动语音识别（ASR）这个部分的任务是将
关于MicrosoftVisualStudio如何加载不是在自己环境下安装的PIP库的问题 lckj2009 工具使用 python anaconda
因为项目需要，我把PYTHON的最新环境和PIP库建在了Anaconda3下了。Anaconda3是从网上下载的独立的安装包，不是MicrosoftVisualStudio自带的Anaconda3。RASA等框架也都装在了网上这个Anaconda3环境下的PIP库里了。结果在MicrosoftVisualStudio运行RASA库是报错，说找不到RASA库。这该怎么解决呢？其实解决方法很简单，在V
RASA3.X(二)--常见命令详解 hanscalZheng RASA RASA 命令模式
目录创建新项目训练模型交互式学习与助手交谈启动服务启动操作服务可视化故事评估模型训练和测试数据拆分创建新项目以下命令使用示例训练数据为你建立一个完整的项目。rasainit这将创建以下文件：.├──__init__.py├──actions.py├──config.yml├──credentials.yml├──data│├──nlu.md│└──stories.md├──domain.yml├─
rasa3.X 自定义action的注册问题 Guido_PSG rasa python
rasa3.X自定义action的注册问题文章目录rasa3.X自定义action的注册问题前言一、问题重述二、问题解决前言幸好在这之前抽时间稍微看了一点django源码，让我对于python的导入机制有了一个概念。虽然还不是很确切的知道pythonimport机制，不过在看到类似_import_submodules，importlib.import_module等方法的时候，也能大概知道要干什么
Rasa课程系列之：业务对话机器人Rasa核心算法DIET及TED论文详解及源码实现 StarSpaceNLP667 StarSpace NLP Transformer 算法人工智能 Rasa课程培训面试深度学习自然语言处理
对一个智能业务对话系统而言，语言理解NLU及Policies是其系统内核的两大基石。Rasa团队发布的最重磅级的两篇论文DIET:LightweightLanguageUnderstandingforDialogueSystems及DialogueTransformers是其基于在业界落地场景的多年探索而总结出来的解决NLU和Policies最核心的成果结晶：其中DIET是Intent识别和Ent
NLP 高手之路101课（模型、算法、论文、源码、案例 + 1年答疑） Eric_1694
课程名称：NLP高手之路101课（模型、算法、论文、源码、案例+1年答疑）课程关键词：NLP、Transformer、BERT、GPT、Bayesian、Rasa、Transferlearning、ConversationalAI、Classifiers、Policies、DialogueManagement、NER、Pre-training、Fine-tuning、DIET、TED、Simple
Rasa NLU-About 魏鹏飞
RasaNLU：Chatbots和AI助手的语言理解RasaNLU是一个开源自然语言处理工具，用于聊天机器人中的意图分类，响应检索和实体提取。例如，如下面这个句子："IamlookingforaMexicanrestaurantinthecenteroftown"并返回结构化数据{"intent":"search_restaurant","entities":{"cuisine":"Mexican
构建对话机器人：Rasa3安装和基础入门写bug的程旭源对话机器人 chatbot ChatGPT 自然语言处理
在开源对话机器人中，Rasa社区很活跃，在国内很多企业也在使用Rasa做对话机器人，有rasa开发经验的往往是加分项。当年实习的时候接触到了Rasa，现在工作中也使用Rasa，因此，写写一些经验文档，有助后来人的入门和研究。本文是Rasa的第一篇，偏基础入门内容，主要是本地和使用docker镜像如何安装rasa，后续会持续更新关于rasa的使用拆解每个文件功能和内部细节、如何修改配置、如何使用中文
对话机器人RASA结构和相关知识点 AI强仔 NLP 算法人工智能 python
本文主要是读了一遍rasa文档https://rasa.com/docs/rasa/installation/，总结的。目录1Rasa结构12NLUData22.1TrainingExamples22.2Entities实体22.2.1Pre-trainedEntityExtractors22.3Synonyms同义词32.4Stories32.4.1Step32.4.2Action42.4.3S
rasa算法_（十八）基于RASA开始中文机器人实现机制我读过书不要骗我 rasa算法
前文介绍了基于RASA的总体架构，本文着重介绍一下实现细节。机器人管理概述框架是多租户SAAS系统，每个用户可以创建多个机器人，每个机器人关联独立的语料库，机器人能力，话术流程，在RASA中对应一个RASA运行实例。机器人管理应用系统需要给用户提供最精简的配置UI，且可以完成Rasa需要的相关配置。然后将这些数据转成Rasa可以识别的yaml格式，保存在HDFS中。RASA到HDFS中获取配置数据
以报时机器人为例详细介绍tracker_store和event_broker NLP工程化 Rasa3源码剖析 Rasa 对话系统 tracker_store event_broker 自然语言处理
报时机器人源码参考[1][2]，本文重点介绍当tracker_store类型为SQL时，events表的表结构以及数据是如何生成的。以及当event_broker类型为SQL时，events表的表结构以及数据是如何生成的。一.报时机器人启动[3] Rasa对话系统启动方式详见参考文献[3]中执行程序部分，这里不再赘述。如下所示：1.加载模型：rasarun--cors"*"2.运行actio
Rasa中的tracker_store和event_broker NLP工程化 Rasa实战 Rasa 对话系统 tracker_store event_store
Rasa中的tracker_store相对主流为Redis，event_broker相对主流为RabbitMQ。后续为了研究学习直接将tracker_store和event_broker的type都设置为SQL，使用MySQL统一管理。一.Rasa中的tracker_store 要使用MySQL作为Rasa的tracker_store，需要在endpoints.yml文件中进行一些配置。以下
rasa框架意图分类embedding算法 233彭于晏
算法模型intent_classifier_tensorflow_embedding点击此处获取算法代码算法框架算法框架算法思想把训练样本和意图编码到同一个向量空间，设计损失函数，使得样本与真实意图更相近，样本与其他意图更相反，意图之间编码更相反，达到意图分类的目的。举个例子说明，假设有两条训练样本“我要充话费”和“我要订机票”，有四个意图“订机票”、“查天气”，“充话费”，“查运势”，意图分类算
ChatGPT和Rasa AI可以共同实现一样的效果，只需要将ChatGPT的输出作为Rasa AI的输入，然后Rasa AI可以根据输入的内容进行分析，并返回相应的回复。这样，ChatGPT和Ras... 爆燃·火星人工智能 chatgpt
是的，你说得对。ChatGPT和RasaAI是可以共同实现相同效果的，通过将ChatGPT的输出作为RasaAI的输入，RasaAI可以进行内容分析，然后根据分析结果返回相应的回复，实现两者的结合。
rasa课程第7周小结 weixin_41710583 pytorch 自然语言处理
收获01学习了GPT2的一些基本概念，重新回顾了bert中attention的基本概念和原理，了解了gpt2中mask的attention的基本原理。02看了生成模型中interact.py的内容，每次根据对话，根据设定的迭代值，预测出下一个字的内容，迭代完成后，下一句话也完成。其中彩用了topk和topp的方法，来对下个单词进行预测。03复习了关于rnn部分的相关知识点，更清楚的知道rnn在每个
对话机器人（五）——RASA：Config 就要辣谢谢。对话机器人人工智能自然语言处理 nlp
定义了模型将用于根据用户输入进行预测的组件和策略。recipe:当前配置文件所用的格式，rasa仅支持default.v1格式。recipe:default.v1language:enpipeline:#将由SuggestedConfig功能选择policies:-name:MemoizationPolicy-name:TEDPolicymax_history:5epochs:101.piplin
RASA智能聊天机器人，理论与技术 Taizhuang_ RASA 智能聊天机器人多轮对话机器人 python
一，智能聊天机器人一种通过自然语言模拟人类进行对话的程序可以代替企业中相对固话、重复的人力密集型任务或流程-问题咨询:基于业务知识库进行业务问题解答-数据检索:纵跨各业务系统或数据库，检索数据或文档-业务处理:对接相关业务系统转达指令，完成相应业务操作典型业务场景∶-业务咨询问答机器人、智能客服机器人、行政助理机器人、产品推荐机器人….对外提供客户服务，对内进行业务辅助智能化的机器人可以带来全方位
RasaGPT对话系统的工作原理 NLP工程化自然语言处理 Rasa Langchain 对话系统
RasaGPT结合了Rasa和Langchain这2个开源项目，当超出Rasa现有意图(out_of_scope)的时候，就会执行ActionGPTFallback，本质上就是利用Langchain做了一个RAG，调用LLMAPI。RasaGPT涉及的技术栈比较多而复杂，包括Rasa、Langchain、LlamaIndex、Telegram、PostgresSQL、PGVector、Ngrok、
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found