iceburg-blogs

论文Chinese Relation Extraction with Multi-Grained Information and External Linguistic Knowledge阅读笔记

文章目录

摘要
主要问题
MG Lattice模型

Input Representation 输入表示层

字向量
词向量

MG Lattice Encoder 编码层

Basic Lattice LSTM Encoder
MG Lattice LSTM Encoder

Relation Classifier 关系分类层

-----------------------
附:全文翻译

摘要
方法

Input Representation
Encoder

实验

本文为ACL19收录文章，GitHub地址：https://github.com/thunlp/Chinese_NRE，论文下载地址：http://nlp.csai.tsinghua.edu.cn/~lzy/publications/acl2019_nre4chinese.pdf

论文Chinese Relation Extraction with Multi-Grained Information and External Linguistic Knowledge阅读笔记_第1张图片

摘要

目前主流中文关系提取的模式是使用具有基于字符或基于单词的输入的神经网络，并且大多数现有方法通常会因为分段错误和多义词的影响而影响性能。针对以上问题，我们提出了一种用于中文关系提取的多粒度格框架（MG Lattice），利用多粒度语言信息和外部语言知识来提高关系抽取的准确率。（1）我们将词级信息合并到字符序列输入中，从而避免了分段错误。（2）我们还借助外部语言知识对多义词的多种意义进行建模，以减轻多义词产生的歧义问题。通过在不同领域的三个数据集上进行的实验表明，我们的模型具有显著的优越性和鲁棒性。

主要问题

本文提出的模型主要针对关系抽取中的两个比较棘手的问题：

使用词向量还是字向量作为输入，使用字向量的问题是无法使用词级别的信息，而使用词向量则会因为分词错误导致错误传递，影响关系抽取的性能。
多义词问题，中文语料中经常会出现多义词，多义词会影响分词和实体识别的结果，从而导致错误的出现影响之后的关系抽取的效果。

下面是论文中列举的一个和多义词相关的例子，它很好的说明了多义词的出现对实体识别和关系抽取的影响。

如上图所示，中文句子“达尔文研究所有杜鹃”具有两个实体，即“达尔文（Darwin）”和“ Dori（杜鹃）”，它们之间的关系在这种情况下，正确的切分是“达尔文（人物）/研究（动作）/所有（全部）/杜鹃（杜鹃）”。但是，随着切分的变化，句子的语义可能会完全不同。若分段为“达尔文（在达尔文）/研究所（研究所）/有（有）/杜鹃（杜鹃）”，句子的含义变成在一个名为达尔文的研究所里有杜鹃鸟，实体 “达尔文” 和实体 “杜鹃” 变成了所有权关系，这是错误的。因此，基于字符的方法和基于单词的方法都不能充分利用数据中的语义信息，多义词的出现可能会很大程度上影响分词的结果，从而影响最后实体识别和关系抽取的结果。

本文提出的MG Lattice模型就是为了解决上述问题，通过同时利用字级、词级和词义信息，使句子的切分更准确从而提高实体识别和关系抽取的效果。

MG Lattice模型

下图是MG Lattice模型的架构图。MG Lattice模型可以分为三层：Input Representation输入表示层，MG Lattice Encoder编码层和Relation Classifier关系分类层。下面将从这三层入手，详细讲解每一层所做的工作。

Input Representation 输入表示层

这一层主要是计算模型的输入向量，MG Lattice模型一共用到了两种输入向量，分别是字向量和词向量，他们的表示方式是不同的

字向量

我们的模型将字向量作为直接输入（词向量作为间接输入），即将每个输入句子视为一个字符序列。给定一个包含M个字符 s = { $c_{1}$ ，…， $c_{M}$ } 的句子s，我们首先将每个字符 $c_{i}$ 映射为一个 $d^{c}$ 维度的矢量，表示为 $x^{ce}_{i}$

此外，利用位置嵌入来确定实体在句子中的位置，位置嵌入是指从当前字符到实体的头部和尾部的相对距离。具体来说，第i个字符 $c_{i}$ 到两个标记实体（关系三元组中的两个实体）的相对距离分别表示为 $p^{1}_{i}$ 和 $p^{2}_{i}$ ，计算 $p^{1}_{i}$ 的方式如下：

将 $p^{1}_{i}$ 、 $p^{2}_{i}$ 这两个位置标记转换为位置向量 $x^{p1}_{i}$ 、 $x^{p2}_{i}$ ，然后与字向量 $x^{ce}_{i}$ 拼接，得到最终的输入字向量 $x^{c}_{i}$

$x^{c}_{i} =[x^{ce}_{i} ; x^{p1}_{i} ; x^{p2}_{i}]$

词向量

MG Lattice模型将字向量作为直接输入，但是为了完全捕获单词级特征，它也使用了句子中所有潜在词的信息，即词向量会被间接使用。这里的潜在词是与在分段大原始文本之上构建的词典D中的单词匹配的任何字符子序列，这个字符子序列就是一个词，通过word2vec将词转化为一个实值向量，用 $x^{w}_{b,e}$ 表示，b是字符字序列的开始位置，e是结束位置。

MG Lattice模型除了会用到字向量和词向量外，还会用到词义向量。使用HowNet作为外部知识库，给定词 $x_{b,e}$ ，通过检索HowNet可以获得词 $x_{b,e}$ 的所有词义信息。使用 $Sense（w_{b,e}）$ 表示词 $x_{be}$ 的所有k个词义信息的集合。然后通过SAT模型将每个词义 $sen^{w_{b,e}}_{k}$ 转换为实值向量 $x^{sen}_{b,e,k}$ ，其中 $sen^{w_{b,e}}_{k}$ ∈ $Sense（w_{b,e}）$ 。

上述涉及到的编码和词表示非常多，其实只用搞清楚词向量 $x^{w}_{b,e}$ 和词义向量 $x^{sen}_{b,e}$ 最终的表示形式就行了，其他的符号和编码都是为了得到这两个向量的中间过程。

MG Lattice Encoder 编码层

经过上一层的输入表示层的计算，一共得到了三个输入向量，分别是字向量 $x^{c}_{i}$ 、词向量 $x^{w}_{b,e}$ 和词义向量 $x^{sen}_{b,e}$ 。这一层的编码层主要是对LSTM模型进行了一些改进，以同时使用到字向量、词向量和词义向量，这部分是整篇论文的重点，即如何同时使用多种形式的语言信息。

MG Lattice Encoder 编码层可以再细分一下，再分为两层，一层是基础的Basic Lattice LSTM Encoder层，这一层使用的是18年ACL论文 Chinese NER Using Lattice LSTM 中提出的Lattice LSTM模型，直接拿过来用，没有作修改，该层使用的输入是字向量和词向量。另一层是MG Lattice LSTM Encoder层，该层使用的输入是词义向量。

Basic Lattice LSTM Encoder

这里的结构就是Lattice LSTM模型的结构。比较复杂，建议看看论文Chinese NER Using Lattice LSTM，然后画个图来理解，下面是我在看论文时画的图，可以看出Lattice LSTM对LSTM做了不少改进，同时使用到了字级和词级的信息。

MG Lattice LSTM Encoder

这一层加入了词义向量 $x^{sen}_{b,e}$ ，将词义向量加入进模型的方法和Lattice LSTM加入词向量的方法差不多，由于多义词经常有多个词义，所以计算过程中还要求出每个词义的权重，将词义向量乘以权重α并累加然后加入进模型。

Relation Classifier 关系分类层

最后，模型还要经过一个关系分类层，将编码层得出的隐藏层状态作为输入，经过注意力计算，进行关系分类。
这里使用的关系分类的方法，借鉴了16年的ACL论文中提出的Att-BiLSTM模型的关系分类方法，只不过是将BiLSTM换成了MGLatticeLSTM。Att-BiLSTM中提出的了基于自注意力机制的关系分类方法，有效提升了关系分类的性能：

分类层的自注意力机制：
h是MGLatticeLSTM得到的每个字的隐藏层，通过tanh和softmax求出自注意力权重 $a$ ，再用权重 $a$ 乘以隐藏层字向量，得到注意力向量 $h^*$

$H = t a n h (h)$

$a = softmax(w^TH)$

$h^* = ha^T$

以注意力向量 $h^*$ 作为输入，通过一个全连接层得到对每种关系的概率值 $p (y ∣ S)$ ：

$o = Wh^* + b$

$p (y ∣ S) = s o f t m a x (o)$

-----------------------

附:全文翻译

一下是论文部分内容的翻译，使用的Google译出来的，很多地方不准确，可以作为参考

摘要

Chinese relation extraction is conducted using neural networks with either character-based or word-based inputs, and most existing methods typically suffer from segmentation errors and ambiguity of polysemy. To address the issues, we propose a multi-grained lattice framework (MG lattice) for Chinese relation extraction to take advantage of multi-grained language information and external linguistic knowledge. In this framework, (1) we incorporate word-level information into character sequence inputs so that segmentation errors can be avoided. (2) We also model multiple senses of polysemous words with the help of external linguistic knowledge, so as to alleviate polysemy ambiguity. Experiments on three realworld datasets in distinct domains show consistent and significant superiority and robustness of our model, as compared with other baselines. The source code of this paper can be obtained from https://github.com/thunlp/Chinese_NRE.
中文关系提取是使用具有基于字符或基于单词的输入的神经网络进行的，大多数现有方法通常会遭受分段错误和多义性的歧义。为了解决这些问题，我们提出了一种用于中文关系提取的多粒度格框架（MG格），以利用多粒度语言信息和外部语言知识的优势。（1）我们将词级信息合并到字符序列输入中，从而可以避免分割错误。（2）我们还借助外部语言知识对多义词的多种意义进行建模，以减轻多义性的歧义。在不同领域中的三个真实世界数据集上的实验表明，与其他基准相比，我们的模型具有一致且显着的优越性和鲁棒性。本文的源代码可以从https://github.com/thunlp/Chinese_NRE获得。

关系提取（RE）在信息提取（IE）中具有举足轻重的作用，旨在提取自然语言句子中实体对之间的语义关系。在下游应用中，该技术是构建大规模语言的关键模块。深度学习的最新发展引起了人们对神经关系提取（NRE）的兴趣，这种尝试试图使用神经网络自动学习语义特征（Liu等人，2013; Zeng等人，2014; 2015; Lin et al。，2016; Zhou et al。，2016; Jiang et al。，2016）。

Although it is not necessary for NRE to perform feature engineering, they ignore the fact that different language granularity of input will have a significant impact on the model, especially for Chinese RE. Conventionally, according to the difference in granularity, most existing methods for Chinese RE can be divided into two types: character-based RE and word-based RE.
For the character-based RE, it regards each in-put sentence as a character sequence. The short-coming of this kind of method is that it can-not fully exploit word-level information, capturing fewer features than the word-based methods. For the word-based RE, word segmentation should be first performed. Then, a word sequence is derived and fed into the neural network model. However, the performance of the word-based models could be significantly impacted by the quality of seg-mentation.
尽管NRE不必进行特征工程，但他们忽略了这样一个事实，即输入语言的粒度不同会对模型产生重大影响，特别是对于中文RE。传统上，根据粒度的不同，大多数现有方法中文RE可以分为两种类型：基于字符的RE和基于单词的RE。
对于基于字符的RE，它将每个输入句子视为一个字符序列。这种方法的缺点是它无法充分利用单词级信息，比基于单词的方法捕获更少的特征。对于基于单词的RE，首先应该进行单词分割，然后将单词序列导出并输入到神经网络模型中，但是，基于单词的模型的性能可能会受到分割质量的显着影响。

For example, as shown in Fig 1, the Chinese sentence “达尔文研究所有杜鹃 (Darwin studies all the cuckoos)” has two entities, which are “达尔文 (Darwin)” and “杜鹃 (cuckoos)”, and the relation between them is Study. In this case, the correct segmentation is “达尔文 (Darwin) / 研究(studies) / 所有 (all the) / 杜鹃 (cuckoos)” . Nevertheless, semantics of the sentence could become entirely different as the segmentation changes. If the segmentation is “达尔文 (In Darwin) / 研究所(institute) / 有 (there are) / 杜鹃 (cuckoos)”, the meaning of the sentence becomes ’there are cuckoos in Darwin institute’ and the relation between “达尔文 (Darwin)” and “杜鹃 (cuckoos)” turns into Ownership, which is wrong. Hence, neither character-based methods nor word-based methods can sufficiently exploit the semantic information in data. Worse still, this problem becomes severer when datasets is finely annotated, which are scarce in number. Obviously, to discover highlevel entity relationships from plain texts, we need the assistance of comprehensive information with various granularity.
例如，如图1所示，中文句子“达尔文研究所有杜鹃”具有两个实体，即“达尔文（Darwin）”和“ Dori（杜鹃）”，它们之间的关系在这种情况下，正确的切分是“达尔文（达尔文）/研究（研究）/拥有（全部）/森（杜鹃）”。但是，随着切分的变化，句子的语义可能会完全不同。分段为“达尔文（在达尔文）/研究所（研究所）/是（有）/森（杜鹃）”，句子的含义变成“达尔文研究所有杜鹃”，以及“达尔文（达尔文））“而“森（杜鹃）”变成了所有权，这是错误的。因此，基于字符的方法和基于单词的方法都不能充分利用数据中的语义信息。更糟糕的是，当对数据集进行精细注释时，此问题变得更加严重。数量稀少。显然，要从纯文本中发现高级实体关系，我们需要各种粒度的综合信息的协助。

Furthermore, the fact that there are many polysemous words in datasets is another point neglected by existing RE models, which limits the ability of the model to explore deep semantic features. For instance, the word “杜鹃” has two different senses, which are ’cuckoos’ and ’azaleas’. But it’s difficult to learn both senses information from plain texts without the help of external knowledge. Therefore, the introduction of external linguistic knowledge will be of great help to NRE models.
In this paper, we proposed the multi-granularity lattice framework (MG lattice), a unified model comprehensively utilizes both internal information and external knowledge, to conduct the Chinese RE task. (1) The model uses a lattice-based structure to dynamically integrate word-level features into the character-based method. Thus, it can leverage multi-granularity information of inputs without suffering from segmentation errors.(2) Moreover, to alleviate the issue of polysemy ambiguity, the model utilizes HowNet (Dong and Dong, 2003), which is an external knowledge base manually annotates polysemous Chinese words. Then, the senses of words are automatically selected during the training stage and consequently, the model can fully exploit the semantic information in data for better RE performance.
此外，数据集中存在多义词的事实是现有RE模型忽略的另一点，这限制了模型探索深层语义特征的能力。例如，“ Mori”一词具有两种不同的含义，即“杜鹃和杜鹃花。但是，在没有外部知识帮助的情况下，很难从纯文本中学习两种感官信息。因此，引入外部语言知识将对NRE模型有很大帮助。
本文提出了一种多粒度格构框架（MG格），它是一个综合模型，综合利用内部信息和外部知识来完成中文RE任务：（1）该模型使用基于格的结构动态集成因此，它可以利用输入的多粒度信息而不会遇到分割错误。（2）此外，为了减轻多义性歧义的问题，该模型利用HowNet（Dong和Dong，（2003）是一个外部知识库，它手动注释多义汉字，然后在训练阶段自动选择单词的词义，因此该模型可以充分利用数据中的语义信息以提高RE性能。

Sets of experiments has been conducted on three manually labeled RE datasets. The results indicate that our model significantly outperforms multiple existing methods, achieving state-of-the-art results on various datasets across different domains.
在三个手动标记的RE数据集上进行了一系列实验，结果表明我们的模型明显优于多种现有方法，在不同领域的各种数据集上均达到了最新水平。

方法

Given a Chinese sentence and two marked entities in it, the task of Chinese relation extraction is to extract semantic relations between the two entities. In this section, we present our MG lattice model for Chinese relation extraction in detail. As shown in Fig 2, the model could be introduced from three aspects:
给定一个中文句子和其中两个标记的实体，中文关系提取的任务是提取两个实体之间的语义关系。在本节中，我们详细介绍了用于中文关系提取的MG格模型，如图2所示该模型可以从三个方面介绍：

Input Representation
Given a Chinese sentence with two target entities as input, this part represents each word and character in the sentence. Then the model can utilize both word-level and character-level information.
MG Lattice Encoder.
Incorporating external knowledge into word sense disambiguation, this part uses a lattice-structure LSTM network to construct a distributed representation for each input instance.
Relation Classifier.
After the hidden states are learned, a character-level mechanism is adapted to merge features. Then the final sentence representations are fed into a softmax classifier to predict relations.
输入表示层
给定一个以两个目标实体为输入的中文句子，该部分表示句子中的每个单词和字符，然后该模型可以利用单词级和字符级信息。
MG Lattice编码器层
该部分将外部知识整合到词义歧义消除中，使用晶格结构LSTM网络为每个输入实例构建分布式表示。
关系分类器层
在学习了隐藏状态之后，将采用字符级机制来合并特征，然后将最终的句子表示形式馈入softmax分类器中以预测关系。

We will introduce all the three parts in the following subsections in detail.
我们将在以下小节中详细介绍所有三个部分。

Input Representation

The input of our model is a Chinese sentence s with two marked entities. In order to utilize multi-granularity information, we represent both charac-ters and words in the sentence.
输入表示
模型的输入是带有两个标记实体的中文句子s，为了利用多粒度信息，我们在句子中同时表示字符和单词。

Character-level Representation
Our model takes character-based sentences as direct inputs, that is, regarding each input sentence as a character sequence. Given a sentence s consisting of M characters s = {c1, …, cM}, we first map each character ci to a vector of dc dimensions, denoted as xce。
In addition, we leverage position embeddings to specify entity pairs, which are defined as the relative distances from the current character to head and tail entities (Zeng et al., 2014). Specifically, the relative distances from the i-th character ci to the two marked entities are denoted as pi1 and pi2 respectively. We calculate pi1 as below:
我们的模型将基于字符的句子作为直接输入，即将每个输入句子视为一个字符序列。给定一个包含M个字符s = {c1，…，cM}的句子s，我们首先将每个字符ci映射为一个dc维度的矢量，表示为xce。
此外，我们利用位置嵌入来指定实体对，实体对定义为从当前字符到头部和尾部实体的相对距离（Zeng等，2014）。具体来说，第i个字符ci到两个标记实体的相对距离分别表示为pi1和pi2，我们计算pi1如下：

Word-level Representation
Although our model takes character sequences as direct inputs, in order to fully capture word-level features, it also needs the information of all potential words in the input sentences. Here, a potential word is any character subsequence that matches a word in a lexicon D built over segmented large raw text. Let wb,e be such a subsequence starting from the b-th character to the e-th character. To represent wb,e, we use the word2vec (Mikolov et al., 2013) to convert it into a real-valued vector x
尽管我们的模型将字符序列作为直接输入，但是为了完全捕获单词级特征，它也需要输入句子中所有潜在单词的信息。在此，潜在单词是与在分段大原始文本之上构建的词典D中的单词匹配的任何字符子序列。令wb，e是从第b个字符到第e个字符开始的子序列。为了表示wb，e，我们使用word2vec（Mikolov et al。，2013）将其转换为实值向量x

However, the word2vec method maps each word to only one single embedding, ignoring the fact that many words have multiple senses. To tackle this problem, we incorporate HowNet as an external knowledge base into our model to represent word senses rather than words.
Hence, given a word wb,e, we first obtain all K senses of it by retrieving the HowNet. Using Sense(wb,e) to denote the senses set of wb,e, we then convert each sense sen(wb,e) into a real-valued vector xsen through the SAT model. The SAT model is on the basis of the Skip-gram, which can jointly learn word and sense representations. Finally, the representation of wb,e is a vector set denoted as x.
In the next section, we will introduce how our model utilizes sense embeddings.
但是，word2vec方法将每个单词仅映射到一个嵌入中，而忽略了许多单词具有多种含义的事实。为解决此问题，我们将HowNet作为外部知识库纳入模型中，以表示单词而非单词。因此，给定单词wb，e，我们首先通过检索HowNet获得所有的K感。使用Sense（wb，e）表示wb，e的感知集，然后通过SAT模型将每个词义sen（wb，e）转换为实值向量xsen。SAT模型是基于Skip-gram的，可以共同学习单词和有义的表示形式。最后，wb的表示形式e是表示为x的向量集。
在下一节中，我们将介绍我们的模型如何利用意义嵌入。

Encoder

The direct input of the encoder is a character se-quence, together with all potential words in lexi-con D. After training, the output of the encoder is the hidden state vectors h of an input sentence. We introduce the encoder with two strategies, includ-ing the basic lattice LSTM and the multi-graind lattice (MG lattice) LSTM.
3.2.1 Basic Lattice LSTM Encoder
Generally, a classical LSTM (Hochreiter and Schmidhuber, 1997) unit is composed of four ba-sic gates structure: one input gate ij controls which information enters into the unit; one output gate oj controls which information would be out-putted from the unit; one forget gate fj controls which information would be removed in the unit. All three gates are accompanied by weight matrix W . Current cell state cj records all historical in-formation flow up to the current time. Therefore, the character-based LSTM functions are:

where σ() means the sigmoid function. Hence, the current cell state cj will be generated by calcu-lating the weighted sum using both previous cell state and current information generated by the cell (Graves, 2013).
Given a word wb,e in the input sentence which matches the external lexicon D, the representation can be obtained as follows:

实验

In this section, we conduct a series of experiments on three manually labeled datasets. Our models show superiority and effectiveness compared with other models. Furthermore, generalization is another advantage of our models, because there are five corpora used to construct the three datasets, which are entirely different in topics and manners of writing. The experiments will be organized as follows:
(1) First, we study the ability of our model to combine character-level and word-level information by comparing it with char-based and word-based models;
(2) Then we focus on the impact of sense representation, carrying out experiments among three different kinds of lattice-based models;
(3) Finally, we make comparisons with other proposed models in relation extraction task.
在本节中，我们对三个手动标记的数据集进行了一系列实验，与其他模型相比，我们的模型显示出优越性和有效性。泛指是我们模型的另一个优势，因为使用了五个语料库来构建这三个数据集，因此在主题和写作方式上完全不同。实验将组织如下：
（1）首先，通过与基于字符的模型和基于单词的模型进行比较，研究模型结合字符级和词级信息的能力；
（2）然后，我们重点关注感官表示的影响，在三种不同的基于格的模型之间进行实验；
（3）最后，在关系提取任务中与其他提出的模型进行了比较。

4.1 Datasets and Experimental Settings
Datasets. We carry out our experiments on three different datasets, including Chinese SanWen (Xu et al., 2017), ACE 2005 Chinese corpus (LDC2006T06) and FinRE.
The Chinese SanWen dataset contains 9 types of relations among 837 Chinese literature articles, in which 695 articles for training, 84 for testing and the rest 58 for validating. The ACE 2005 dataset is collected from newswires, broadcasts, and weblogs, containing 8023 relation facts with 18 relation subtypes. We randomly select 75% of it to train the models and the remaining is used for evaluation.
For more diversity in test domains, we manually annotate the FinRE dataset from 2647 financial news in Sina Finance 2, with 13486, 3727 and 1489 relation instances for training, testing and validation respectively. The FinRE contains 44 distinguished relationships including a special relation NA, which indicates that there is no relation between the marked entity pair.
数据集。我们在三个不同的数据集上进行了实验，包括中文SanWen（Xu等人，2017），ACE 2005中文语料库（LDC2006T06）和FinRE。
中国的SanWen数据集包含837篇中国文学文章中的9种关系，其中695篇用于培训的文章，84篇用于测试的文章，其余58篇用于验证的文章.ACE 2005数据集是从新闻专线，广播和网络日志中收集的，包含8023个相关事实有18个关联亚型，我们随机选择其中的75％来训练模型，其余的用于评估。
为了使测试域更加多样化，我们手动注释了新浪财经2中2647个金融新闻的FinRE数据集，分别提供了13486、3727和1489个关系实例进行培训，测试和验证.FinRE包含44个不同的关系，包括特殊关系NA，表示已标记实体对之间没有关系。

Evaluation Metrics. Multiple standard evalu-ation metrics are applied in the experiments, including the precision-recall curve, F1-score, Precision at top N predictions (P@N) and area under the curve (AUC). With comprehensive evaluations, models can be estimated from multiple angles.
Parameter Settings. We tune the parameters of our models by grid searching on the validation dataset. Grid search is utilized to select optimal learning rate λ for Adam optimizer (Kingma and Ba, 2014) among {0.0001, 0.0005, 0.001, 0.005, } and position embedding dp in {5, 10, 15, 20}. Table 1 shows the values of the best hyperparameters in our experiments. The best models were selected by early stopping using the evaluation results on the validation dataset. For other parameters, we follow empirical settings because they make little influence on the whole performance of our models.
评估指标：在实验中使用了多个标准评估指标，包括精确召回曲线，F1得分，最高N个预测的精确度（P @ N）和曲线下面积（AUC）。可以从多个角度进行估计。
参数设置。我们通过在验证数据集上进行网格搜索来调整模型的参数。网格搜索用于在{0.0001、0.0005、0.001、0.005，}和将位置dp嵌入{5，10，15，20}中。表1显示了我们实验中最佳超参数的值。使用验证数据集上的评估结果通过尽早停止选择最佳模型。对于其他参数，我们遵循经验设置，因为它们对模型的整体性能影响很小。

4.2 Effect of Lattice Encoder.
In this part, we mainly focus on the effect of the encoder layer. As shown in Table 2, we conducted experiments on char-based, word-based and lattice-based models on all datasets. The word-based and character-based baselines are implemented by replacing the lattice encoder with a bidirectional LSTM. In addition, character and word features are added to these two baselines respectively, so that they can use both character and word information. For word baseline, we utilize an extra CNN/LSTM to learn hidden states for characters of each word (char CNN/LSTM). For char baseline, bichar and softword (word in which the current character is located) are used as word-level features to improve character representation.
The lattice-based approaches include two lattice-based models, and both of them can explicitly leverage both character and word information. The basic lattice uses the encoder mentioned in 3.2.1, which can dynamically incorporate word-level information into character sequences. For MG lattice, each sense embedding will be used to construct an independent sense path. Hence, there is not only word information, but also sense information flowing into cell states.
在这一部分中，我们主要关注编码器层的效果，如表2所示，我们在所有数据集上分别对基于char，基于单词和基于格的模型进行了实验。通过使用双向LSTM替换晶格编码器来实现。此外，将字符和单词特征分别添加到这两个基线中，以便它们可以同时使用字符和单词信息。对于单词基线，我们利用额外的CNN / LSTM来了解每个单词的字符的隐藏状态（char CNN / LSTM）。对于char基线，bichar和softword（当前字符所在的单词）用作单词级功能，以改善字符表示。
基本格使用3.2.1中提到的编码器，该编码器可以将单词级信息动态合并到字符序列中。基于格的方法包括两个基于格的模型，并且两者都可以显式地利用字符和单词信息。在MG格中，每个感觉嵌入都将被用来构建一个独立的感应路径，因此，不仅有单词信息，而且还有流入单元状态的感觉信息。

Results of word-based model. With automatic word segmentation, the baseline of the word-based model yields 41.23%, 54.26% and 64.43% F1-score on three datasets. The F1-scores are increased to 41.6%, 56.62 and 68.86% by adding character CNN to the baseline model. Compared with the character CNN, character LSTM representation gives slightly higher F1-scores, which are 42.2%, 57.92%, and 69.81% respectively. The results indicate that character information will promote the performance of the word-based model, but the increase in F1-score is not significant.
基于单词的模型的结果：通过自动单词分割，基于单词的模型的基线在三个数据集上的F1-得分分别为41.23％，54.26％和64.43％，F1-得分分别提高至41.6％，56.62和68.86％通过将字符CNN添加到基线模型中，与字符CNN相比，字符LSTM表示的F1得分略高，分别为42.2％，57.92％和69.81％。结果表明，字符信息将促进CNN的性能。基于单词的模型，但F1分数的增加并不明显。

Results of character-based model. For the character baseline, it gives higher F1-scores compared with the word-based methods. By adding soft word feature, the F1-scores slightly increase on FinRE and SanWen dataset. Similar results are achieved by adding character-bigram. Additionally, a combination of both word features yields best F1-scores among character-based models, which are 42.03%, 61.75%, and 72.63%.
Results of lattice-based model. Although we take multiple strategies to combine character and word information in baselines, the lattice-based models still significantly outperform them. The basic lattice model improves the F1-scores of three datasets from 42.2% to 47.35%, 61.75% to 63.88% and 72.63% to 77.12% respectively. The results demonstrate the ability to exploit character and word sequence information of the lattice-based model. Comparisons and analysis of the lattice-based models will be introduced in the next subsection.
基于字符的模型的结果
对于字符基线，与基于单词的方法相比，它具有更高的F1分数。通过添加软词功能，FinRE和SanWen数据集的F1分数略有增加。通过添加字符图会获得相似的结果。此外，在基于字符的模型中，两个单词特征的组合产生了最佳的F1分数，分别为42.03％，61.75％和72.63％。
基于格的模型的结果
尽管我们采取了多种策略在基线中组合字符和单词信息，但基于格的模型仍然明显优于它们。基本格模型将三个数据集的F1得分从42.2％提高到47.35％，结果显示了利用基于格模型的字符和单词序列信息的能力，下一节将介绍基于格模型的比较和分析。

4.3 Effect of Word Sense Representations
In this section, we will study the effect of word sense representations by utilizing sense-level information with different strategies. Hence, three types of lattice-based models are used in our experiments. First, the basic lattice model uses word2vec (Mikolov et al., 2013) to train the word embeddings, which considers no word sense information. Then, we introduce the basic lattice (SAT) model as a comparison, for which the pretrained word embeddings are improved by sense information (Niu et al., 2017). Moreover, the MG lattice model uses sense embeddings to build independent paths and dynamically selects the appropriate sense.
The results of P@N shown in Table 3 demonstrate the effectiveness of word sense representations. The basic lattice (SAT) gives better performance than the original basic lattice model thanks to considering sense information into word embeddings.Although the basic lattice (SAT) model reaches better overall results, the precision of the top 100 instances is still lower than the lattice-basic model.Compared with the other two models，MG lattice shows superiority in all indexes of P@N，achieving the best results in the mean scores。
在本节中，我们将通过使用不同策略的感官级别信息来研究词义表示的效果，因此，我们在实验中使用了三种类型的基于格的模型。首先，基本格模型使用word2vec（Mikolov等人（2013）训练没有考虑词义信息的词嵌入，然后引入基本格（SAT）模型作为比较，通过感知信息对预训练词嵌入进行改进（Niu et al。，2017）。）此外，MG格模型使用意义嵌入来构建独立的路径并动态选择合适的意义。
表3中显示的P @ N的结果证明了词义表示的有效性。由于考虑到词嵌入中的意义信息，基本格点（SAT）的性能要优于原始基本格点模型。达到更好的整体效果，前100个实例的精度仍低于基于格的模型。与其他两个模型相比，MG格在P @ N的所有指标上均表现出优势，在均值得分方面取得最佳结果。

To compare and analyze the effectiveness of all lattice-based models more intuitively, we report the precision-recall curve of the ACE-2005 dataset in Figure 3 as an example. Although the basic lattice (SAT) model obtains better overall performance than the original basic lattice model, the precision is still lower when the recall is low, which corresponds to the results in Table 3. This situation indicates that considering multiple senses only in the pretrained stage would add noise to the word representations. In other words, the word representation tends to favor the commonly used senses in the corpora, which will disturb the model when the correct sense of the current word is not the common one. Nevertheless, the MG lattice model successfully avoids this problem, giving the best performance in all parts of the curve. This result indicates that the MG lattice model is not significantly impacted by the noisy information because it can dynamically select the sense paths in different contexts. Although MG lattice model shows effectiveness and robustness on the over-all results, it is worth noting that the improvement is limited. The situation indicates that the utilization of multi-grained information could still be improved. A more detailed discussion is in Section 5.
为了更直观地比较和分析所有基于格的模型的有效性，我们以图3中的ACE-2005数据集的精确召回曲线为例进行报告。尽管基本格（SAT）模型获得了比原始模型更好的整体性能在基本格模型中，当召回率较低时，精度仍然较低，这与表3中的结果相对应。这种情况表明，仅在预训练阶段考虑多种感觉会增加单词表示的噪音。表示倾向于倾向于语料库中常用的词义，当当前单词的正确词义不是常见词法时，这会打乱模型。尽管如此，MG格模型成功地避免了这个问题，使词法的所有部分都表现出最佳性能该结果表明MG晶格模型不会受到噪声信息的显着影响，因为它可以动态选择不同c中的感测路径尽管MG格模型在总体结果上显示出有效性和鲁棒性，但值得注意的是，改进是有限的。这种情况表明，仍可以改善多粒度信息的利用。第5节中有更详细的讨论。

In this paper, we propose the MG lattice model for Chinese relation extraction. The model incorporates word-level information into character sequences to explore deep semantic features and avoids the issue of polysemy ambiguity by introducing external linguistic knowledge, which is regarded as sense-level information. We comprehensively evaluate our model on various datasets. The results show that our model significantly outperforms other proposed methods, reaching the state-of-the-art results on all datasets.
In the future, we will attempt to improve the ability of the MG Lattice to utilize multi-grained information. Although we have used word, sense and character information in our work, more level of information can be incorporated into the MG Lattice. From coarse to fine , sememe-level information can be intuitively valuable. Here, sememe is the minimum semantic unit of word sense, whose information may potentially assist the model to explore deeper semantic features. From fine to coarse, sentences and paragraphs should be taken into account so that a border range of contextual information can be captured.
本文提出了一种MG格模型用于中文关系提取，该模型将单词级信息整合到字符序列中以探索深层的语义特征，并通过引入被视为意义级的外部语言知识来避免多义性歧义问题。信息。我们对各种数据集进行了综合评估，结果表明我们的模型明显优于其他提议的方法，在所有数据集上均达到了最新的结果。
将来，我们将尝试提高MG Lattice利用多粒度信息的能力。尽管我们在工作中使用了单词，感官和字符信息，但可以将更多层次的信息纳入MG Lattice。到头说，sememe''级别的信息在直觉上是有价值的。在这里，sememe’'是单词意义的最小语义单位，其信息可能会帮助模型探索更深层次的语义特征。从精细到粗糙，应该考虑句子和段落以便可以捕获上下文信息的边界范围。

你可能感兴趣的:(自然语言处理)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
Humanize 项目教程尤嫒冰
Humanize项目教程humanizeAJSlibraryforaddinga“humantouch”todata.项目地址:https://gitcode.com/gh_mirrors/humani/humanize项目介绍Humanize是一个开源项目，旨在将机器生成的文本转换为更加自然、人性化的文本。该项目通过先进的算法和自然语言处理技术，使得AI生成的内容更加贴近人类的表达方式，从而提高
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式 m0_57781768 语言模型 json 人工智能
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式在现代自然语言处理（NLP）的应用中，大型语言模型（LLM）已经成为了重要的工具。这些模型能够生成丰富的自然语言文本，适用于各种应用场景。然而，在某些应用中，开发者不仅仅需要生成文本，还需要将这些生成的文本转换为结构化的数据格式，例如JSON。这种结构化的数据格式在数据传输、存储以及进一步处理时具有显著优势。本文将深
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
使用LangChain和OpenAI实现高效文本标注 aehrutktrjk langchain python
使用LangChain和OpenAI实现高效文本标注引言在自然语言处理(NLP)领域，文本标注是一项重要且常见的任务。它涉及为文本分配标签，如情感、语言、风格等。本文将介绍如何使用LangChain和OpenAI的API来实现高效的文本标注系统。我们将探讨如何设置环境、定义标注模式，以及如何使用OpenAI的模型来执行标注任务。环境准备首先，我们需要安装必要的库并设置API密钥：%pipinsta
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
多模态Transformer之文本与图像联合建模 - Transformer教程 shandianfk_com ChatGPT Transformer transformer 深度学习人工智能
大家好，今天我们来聊聊一个既前沿又有趣的话题——多模态Transformer，特别是文本与图像的联合建模。对于很多小伙伴来说，Transformer这个词已经不陌生了，但它不仅仅应用于自然语言处理，还能在图像处理、甚至是多模态数据的处理上大显身手。接下来，我会带大家深入了解什么是多模态Transformer，以及它是如何实现文本与图像的联合建模的。Transformer简介首先，我们简单回顾一下T
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
英伟达（NVIDIA）B200架构解读 weixin_41205263 芯际争霸 GPGPU架构 gpu算力人工智能硬件架构
H100芯片是一款高性能AI芯片，其中的TransformerEngine是专门用于加速Transformer模型计算的核心部件。Transformer模型是一种自然语言处理（NLP）模型，广泛应用于机器翻译、文本生成等任务。TransformerEngine的电路设计原理主要包括以下几个方面：
使用LangChain与Together AI模型交互：深入探讨和实践指南 llzwxh888 langchain 人工智能交互 python
使用LangChain与TogetherAI模型交互：深入探讨和实践指南1.引言在人工智能和自然语言处理领域，TogetherAI已经成为一个强大的平台，提供了对50多个领先开源模型的访问。本文将深入探讨如何使用LangChain与TogetherAI模型进行交互，为开发者提供实用的知识和见解，同时解决可能遇到的常见问题。2.TogetherAI简介TogetherAI是一个强大的API平台，允许
OpenLM: 一个灵活的开源大语言模型接口工具 llzwxh888 语言模型人工智能自然语言处理 python
OpenLM:一个灵活的开源大语言模型接口工具引言在人工智能和自然语言处理快速发展的今天，大语言模型(LLM)已经成为许多应用的核心。然而，不同的LLM提供商往往有着各自的API和使用方式，这给开发者带来了一定的挑战。本文将介绍OpenLM，这是一个零依赖、兼容OpenAIAPI的LLM提供者接口，它可以直接通过HTTP调用不同的推理端点。我们将深入探讨OpenLM的特性、使用方法，以及如何将其与
使用中专API实现AI模型调用与部署 llzwxh888 人工智能 easyui 前端 python
在AI技术领域，如何调用和部署大语言模型（LLM）是一个常见的需求。本文将详细介绍如何通过中专API地址http://api.wlai.vip，实现对OpenAI大模型的调用与部署，并提供一个详细的demo代码示例。引言随着人工智能技术的飞速发展，大语言模型在自然语言处理任务中的表现尤为突出。然而，由于国内访问海外API存在一定限制，本文将使用中专API地址来解决这一问题，并展示如何在本地环境中配
深度学习入门篇：PyTorch实现手写数字识别 AI_Guru人工智能深度学习 pytorch 人工智能
深度学习作为机器学习的一个分支，近年来在图像识别、自然语言处理等领域取得了显著的成就。在众多的深度学习框架中，PyTorch以其动态计算图、易用性强和灵活度高等特点，受到了广泛的喜爱。本篇文章将带领大家使用PyTorch框架，实现一个手写数字识别的基础模型。手写数字识别简介手写数字识别是计算机视觉领域的一个经典问题，目的是让计算机能够识别并理解手写数字图像。这个问题通常作为深度学习入门的练习，因为
基于人工智能的智能语音助手人工智能发烧友人工智能
语音助手的自然语言处理模块是语音助手系统的关键组成部分。通过这个模块，系统能够识别用户的意图并做出相应的回应。我们可以使用NLP技术来解析文本输入，并将其转换为系统可以理解的命令或指令。在本项目中，我们将结合语音识别、自然语言处理和语音合成技术，构建一个功能简化的语音助手。一、项目背景与需求分析1.1项目目标本项目旨在创建一个语音助手系统，它可以：1.语音识别：从用户的语音输入中提取文本信息。2.
深入掌握大模型精髓：《实战AI大模型》带你全面理解大模型开发！努力的光头强人工智能 langchain prompt transformer 深度学习
今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的表征能力和卓越的性能，在自然语言处理、计算机视觉、推荐系统等领域均取得了突破性的进展。尤其随着AI大模型的广泛应用，无数领域因此受益。AI大模型
安装jina，并使用jina的向量化和重排序的功能 MonkeyKing.sun milvus numpy
为了在Python的FastAPI项目中使用Jina进行向量化和重排序，您需要按照以下步骤安装和使用Jina。1.安装Jina首先，确保您已经安装了Jina。可以使用pip来安装。pipinstalljina如果需要特定的功能模块，例如自然语言处理相关的向量化模型，可以通过JinaHub获取。pipinstalljina[hub]2.在FastAPI项目中集成Jina接下来，我们将Jina集成到F
Matlab,Python,Java,C++的比较 Codefengfeng python java c++
Matlabmatlab是一个大型计算机，擅长矩阵计算与科学计算，适合构建模型；然而，编译软件的运行效率低，不适合大型软件开发。Pythonpython的优势是简单，入门快。适合做数据挖掘、数据分析、机器学习、人工智能、自然语言处理、爬虫、批量文件处理等，此外，Python开源免费，有很多的库，开发环境开发社区都比较友好；不过，Python是动态型的语言，需要更多的测试，并且错误仅仅是在运行的时候
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h