TKG菜鸟

实体关系抽取综述

实体关系抽取 Relation Extraction : A Survey

update:2019.12.5

update:2019.12.6

update:2019.12.9

update:2019.12.11

update:2019.12.13

update:2019.12.15

简介

信息抽取（information extraction，IE）是从给定的文本库中以结构化的形式（如XML）输出特定的信息。

一般而言，信息抽取的对象有三类

（1）命名实体（named entities）

（2）关系（relations）

（3）事件（events）

一个关系通常就是指一个两个或更多NE间良定的（有意义的）关系。

RE面临着很多挑战

（1）域和域（domain-to-domain）之间有非常多的可能存在的关系，而且有很多非二元关系

（2）有监督的机器学习技术缺乏充分的训练数据

（3）关系本身的定义就是模糊不清的

（4）关系的表示是依赖于语言的，所以RE也是依赖于语言的

Global level 和 mention level

Global RE system期望产生一组存在特定语义关系的实体对，输入是有大量文本的语料库，输出是一组实体对。

Metion RE system是将实体对和包含这一实体对的句子作为输入，然后辨别这一实体对中是否有特定的关系。（也成为关系探测和描述（Relation Detection and Characterization，RDC））

示例

Obama is visiting India today.可以识别出，Obama和India之间是PHYS关系

Obama likes India’s culture.无法识别出Obama和India中的关系

RE技术分类

（1）有监督的方法，包括features-based和kernel based

（2）将实体抽取和关系抽取组合的方法

（3）半监督的方法

（4）无监督的方法

（5）开放信息抽取（Open Information Extraction）

（6）远程监督技术（distant supervision based techniques）

（7）其他先进技术

有监督方法

有监督方法需要关系被打上标签的二元实体对。其中用NONE标签来标注预定义中没有的标签，简单来说，有监督方法就是一个分类问题。

基于特征方法 Feature-based Methods

基于特征的方法，对于每个被标注的实体关系会产生一组特征和一个分类器（或一组分类器），然后经过训练去对新的关系进行分类。

有一些附加的特征被加入进来用来改善RE结果。

Word based features（基于词法特征）

Base phrase chunking based features（基于句法特征）

Features based on semantic resourses（基于语义资源）

用core tree去代表任意的关系，core tree不止包含两个实体在依存树中的最短路径并且包含额外的链接节点和句中关键词的最短路径，core tree的子树被用来挖掘其中的特征。

有一种方法将所有的关系类型表示成几种有限制的句法语义结构。

Premodifier：用来修饰其他名词的形容词或专有名词（Indian minister）

Possessive：第一个实体是所有格的（Italy’s government）

Preposition：两个实体是通过介词连接的（governor of RBI）

Formulaic：两个实体被写成某些特殊形式（Mumbai，India）

有监督方法的一个主要问题是类别不平衡Class Imbalance，因为反面的实例（无意义的实体对）的数量远远大于正面的实体对，这就导致了分类器的高正确率但是低召回率。

一旦特征被设计好了，基于特征的方法就可以简单的通过机器学习方法来训练分类器。但是特征的设计需要大量的分析语言现象中潜在知识。

核方法 Kernel Methods

核方法的主要优势就是不需要非常清晰的特征工程，在核方法中，核函数被设计来计算两个关系实例中所用的表示形式间的相似性并且使用SVM来做分类。不同的核采用了不同的关系实例的表示方法（序列化，句法分析树等），按照这些表示方法的子表示方法中相同的部分来衡量相似性。

序列化核 Sequence Kernel

用序列来表示关系实例并且核计算两组序列中共享的子序列。受到字符串序列的启发，有一种最简单的转换为序列的方法，就是考虑句子中的第一个到第二个词。不把每个句子成分当成单独的单词，将每个词推广为一个特征向量。每个关系实例就变成了一组特征向量的序列。这些特征以下几个方面生成

∑1∑1:Set of all words

∑2∑2:Set of all POS tags = {NNP, NN, VBD, IN, ……}

∑3∑3:Set of all generalized POS tags = {NOUN, VERB, ADJ, ADV, ……}

∑4∑4:Set of entity types = {PER, ORG, LOC, GPE, ……}

序列化示例

每组序列化的特征向量是∑X=∑1×∑2×∑3×∑4.∑X=∑1×∑2×∑3×∑4.目的是要设计一种核函数可以找到这些被共享的子序列uu（属于空间∑∗U=∑1∪∑2∪∑3∪∑4.∑U∗=∑1∪∑2∪∑3∪∑4.）给出两个序列，s,ts,t，定义推广子序列核（Generalized Subsequence kernel），Kn(s,t,λ)Kn(s,t,λ)来计算长度为n的赋权特征稀疏子序列uu，具体过程如下：

u≺s[ii]and u≺t[jj]（对于某些长度为n的序列中标号为ii，jj子序列）u≺s[ii]and u≺t[jj]（对于某些长度为n的序列中标号为ii，jj子序列）u的权重为λl(ii)+l(jj)(0<λ<1,并且l(ii)是子序列的长度，它是ii中最大序号和最小序号的差，解析这些子序列，低的是它的权重)u的权重为λl(ii)+l(jj)(0<λ<1,并且l(ii)是子序列的长度，它是ii中最大序号和最小序号的差，解析这些子序列，低的是它的权重)

在这里，≺≺表示属于某关系，例如，如果ii=(i1,i2,…,i∥u∥)ii=(i1,i2,…,i‖u‖)并且u≺s[ii]u≺s[ii]，于是有u[1]∈s[i1],u[2]∈s[i2],…,u[∥u∥]∈s[i∥u∥]u[1]∈s[i1],u[2]∈s[i2],…,u[‖u‖]∈s[i‖u‖]。

假设ii=(1,2,4)ii=(1,2,4)有(NNP,′s,NN)≺s[ii](NNP,′s,NN)≺s[ii]，考虑上图中的s和t，可以看到有某些长度为3的稀疏子序列：

(NNP, ‘s, NN);(NOUN, ‘s, NN);(NNP, POS, NN);(NOUN, ‘s, NOUN)

通过下面的递归式子可以高效的计算s和t生成的子序列核

$K_0^\prime(s,t)=1,for all s,t$

$K_i^{\prime\prime}(sx,ty)=\lambda K_i^{\prime\prime}(sx,t)+\lambda^2K_{i-1}^\prime(s,t)\cdot c(x,y)$
K′i(sx,t)=λK′i(s,t)+K′′i(sx,t)Ki′(sx,t)=λKi′(s,t)+Ki′′(sx,t)Kn(sx,t)=Kn(s,t)+∑jλ2K′n−1(s,t[1:j−1])⋅c(x,t[j])Kn(sx,t)=Kn(s,t)+∑jλ2Kn−1′(s,t[1:j−1])⋅c(x,t[j])

Relation Kernel（rK）

定义为4个子核的和，每个子核有有一个基于子序列生成的特殊的模式类型。

Fore-Between subkernel（fbK）

计算前缘（Fore-Between）模式之间的相同点（sfs′bsfsb′和tft′btftb′的共享子序列）(president––––––––––– PER of––– ORGpresident_ PER of_ ORG)

Between subkernel（bK）

计算模式之间的相同点（s′bsb′和t′btb′之间的共享子序列）(PER joined––––––– ORGPER joined_ ORG)

Between After subkernel（baK）

计算between-after模式之间的相似度（s′bsasb′sa和t′btatb′ta）（PER chairman of–––––––––––––– ORG announced––––––––––––PER chairman of_ ORG announced_）

Modifier subkernel（mK）

如果两个实体间没有其他词语，并且第一个词语是修饰另一个的，则可以使用修饰模式。这个子核计算了修饰模式间的相似度（x1x2x1x2和y1y2y1y2）（ex:Serbian general，第一个Serbian修饰general）

rK的总式子

rK(s,t)=fbK(s,t)+bK(s,t)+baK(s,t)+mK(s,t)rK(s,t)=fbK(s,t)+bK(s,t)+baK(s,t)+mK(s,t)

用SVM基于rK分类，有两种场景

只训练一个多分类的SVM去判断每个关系类型属于一个类并且NONE类表示不属于任何类型
训练一个二分类SVM去决定是否存在关系（将所有的关系认为属于同一个类），另外再训练一个多分类的SVM去决定pos实例中的具体类别（比前一种方法好）

语法树核 Syntactic Tree Kernel

将一个句子中的成分定义为一个语法树，内容包括名词短语（noun phrases，NP），动词短语（verb phrases，VP），介词短语（prepositional phrases，PP），标点符号（POS tags，ex:NN，VB，IN，etc）作为非终结符号并且实际单词作为叶子。

语法树例子

一般语法由上下文无关文法（CFG）产生。

卷积分析树核 Convolution Parse Tree Kernel（KTKT）

KT用来计算两个语法树之间的相似性。KT计算两个语法分析树之间共享的子树。在这里，子树被定义为符合以下两种情况的树中的子图

i）应当不止包含一个节点

ii）结果必须被包含在整个节点中

每个可能的子树视为投影空间中的一个维度。树T在变换空间（transformed space）中定义为h(T)=[h1(T),h2(T),…hn(T)]h(T)=[h1(T),h2(T),…hn(T)]，其中hi(T)hi(T)表示T中第i个子树并且n表示所有子树的数量。对任意两个子树T1和T2，核的值就是它们在变换空间的简单投影。KT(T1,T2)=h(T1)⋅(T2)KT(T1,T2)=h(T1)⋅(T2)

高效计算

因为所有的可能的子树数量是很多的，所以不存在可以直接计算图像向量的方法。因此，核必须被在不涉及对所有可能子树的遍历下进行。如果第i个子树根在节点n，则令Ii(n)=1Ii(n)=1，否则Ii(n)=0Ii(n)=0。令N1和N2分别是树T

和T2的节点集合。

hi(T1)=∑n1∈N1Ii(n1),hi(T2)=∑n2∈N2Ii(n2)h(T1)⋅h(T2)=∑ihi(T1)hi(T2)=∑n1∈N1∑n2∈N2∑iIi(n1)Ii(n2)=∑n1∈N1∑n2∈N2C(n1,n2)hi(T1)=∑n1∈N1Ii(n1),hi(T2)=∑n2∈N2Ii(n2)h(T1)⋅h(T2)=∑ihi(T1)hi(T2)=∑n1∈N1∑n2∈N2∑iIi(n1)Ii(n2)=∑n1∈N1∑n2∈N2C(n1,n2)

其中，C(n1,n2)计算每个根在n1和n2之间的子树的数量，可以通过以下的迭代步骤在多项式时间完成

1.如果n1&n2n1&n2处的乘积不同，C(n1,n2)=0C(n1,n2)=0

2.如果n1&n2n1&n2处的乘积相同，并且n1n1，n2n2都是预终端（pre-terminals），C(n1,n2)=1C(n1,n2)=1

3.如果n1&n2n1&n2处的乘积相同，并且n1n1，n2n2都不是预终端，C(n1,n2)=∏nc(n1)j=1(1+C(ch(n1,j),ch(n2,j)))C(n1,n2)=∏j=1nc(n1)(1+C(ch(n1,j),ch(n2,j)))，nc(n)代表n的节点数量，ch(n,j)代表n的第j个子节点。

关系实体表示

一个句子包含NeNe个实体，就有(Ne 2)(Ne 2)种关系实例。因此，在完整的语法树中找出一个特别的关系是很重要的。

1.最小完全树（Minimum Complete Tree，MCT）：是有两个实体通过最低共同祖先生成的完全子树。

2.路径封闭树（Paht-enclosed Tree，PT）：最小的一个包含两个实体的子树，也可以表示为连接两个实体间的最短路径对应的路径封闭树。

3.上下文有关路径树（Context-sensitive Path Tree，CPT）：是PT的拓展版本。额外包含了第一个实体的左边的第一个词语和第二个实体的右边第一个单词。

4.扁平路径封闭树（Flattened Path-enclosed Tree，FPT）：是PT的改良版本，忽视只有一条进出的弧的non-POS non-terminal的节点。

5.扁平上下文有关路径树（Flattened Context-sensitive Path Tree，FCPT），CPT的改良版本，忽视只有一条进出的弧的non-POS non-terminal的节点。

依存树核

句子中的词语间的语法关系被他们的语法依存树所编码。词语在句子中是树中的节点，并且依存关系是边。

依存树示例

关系表示

对句子中的每个实体对，考虑包含这个实体对的最小依存子树。依存树中的每个节点由附加信息加强，包括POS tag, generalized POS tag, chunk tag, entity type, entity level (name, nominal, pronoun), WordNet hypernyms and relation argument .

正式地，一个关系实例是由这样一个增强依存树T定义的，T有节点{t0,…,tn}{t0,…,tn}，其中对于每个节点titi有特征ϕ(ti)={v1…vd}ϕ(ti)={v1…vd}。定义ti[c]ti[c]表示titi的所有的孩子，ti⋅pti⋅p表示titi的父节点，ti[jj]ti[jj]表示titi的一组特殊的子节点，其中jj=j1,j2,…,jl(jj)(j1

在上图中，t0[c]=t0[0,1]=t1,t2,t1⋅p=t0t0[c]=t0[0,1]=t1,t2,t1⋅p=t0

为比较两个节点ti,tjti,tj，定义了两个方程。

Matching function（m(ti,tj)m(ti,tj)）

如果在titi和tjtj之间有重要的相同特征就返回1，否则返回0
Similarity function（s(ti,tj)s(ti,tj)）

返回一个正实数值来表示titi和tjtj之间的评分，
s(ti,tj)=∑vq∈ϕ(ti)∑vr∈ϕ(tj)C(vq,vr)s(ti,tj)=∑vq∈ϕ(ti)∑vr∈ϕ(tj)C(vq,vr)
其中，C(vq,vr)C(vq,vr)是两个特征的值vqvq，vrvr之间的比较函数，最简单一种形式是，如果vq=vrvq=vr返回1，否则返回0。

依存树核K(T1,T2)K(T1,T2)衡量了两棵依存树T1和T2（根分别为t0，t1），定义如下

如果m(t10,t20)=0,K(T1,T2)=0否则K(T1,T2)=s(t10,t20)+Kc(t10[c],t20[c])其中，Kc(t10[c],t20[c])是一个核函数,具体为∑ii,jj;l(ii)=l(jj)λd(ii)+d(jj)⎛⎝l(ii)∑s=1K(t[is],t[js)])⎞⎠l(ii)∏s=1m(ti[is],tj[js])如果m(t10,t20)=0,K(T1,T2)=0否则K(T1,T2)=s(t10,t20)+Kc(t10[c],t20[c])其中，Kc(t10[c],t20[c])是一个核函数,具体为∑ii,jj;l(ii)=l(jj)λd(ii)+d(jj)(∑s=1l(ii)K(t[is],t[js)]))∏s=1l(ii)m(ti[is],tj[js])

直观的可以知道，任何时候一对匹配的节点找到后，所有它们可能的匹配的子节点也找到了。两个子序列被认为匹配的前提是他们所有的节点都是成对匹配的，将它们所有的相似度评分相加得到一个总的子节点的相似度，0<λ<10<λ<1作为一个衰退因子来惩罚稀疏的序列。

一个特殊的临近核（contiguous kernel）也可以来限制子序列iiii，例如d(ii)=l(ii)d(ii)=l(ii)。除了稀疏树核(K0)，临近树核(K1)，还有词袋（bag-of-words）核(K2，将树视为一个向量，不考虑树的结构)，也可以组合使用K3=K0+K1K3=K0+K1，K4=K1+K2K4=K1+K2。

依存图路径核 Dependency Graph Path Kernel

找出最短依存路径中相似的地方。考虑这个例子，其中最短路径为：leaders→were←in←Veniceleaders→were←in←Venice完全的词汇化的路线可能导致数据稀疏。因此，将词语分类为POS tags，generalized POS tags，Named Entity types。因此，现在是这样的形式：

每个可能的路径被考虑为一个特征，因此，可能就有各种情况的特征:

leaders→were←in←VeniceNNS→were←in←VeniceNNS→VBD←in←GPEetc.leaders→were←in←VeniceNNS→were←in←VeniceNNS→VBD←in←GPEetc.

一共有4×1×3×1×2×1×4=964×1×3×1×2×1×4=96种可能的特征。短路径依存路径核（Shorted Dependency Path Kernel）计算两种关系种共同的路径特征，假设有两个关系R1，R2，R1=x11x12…x1m，R2=x21x22…x2nR1=x11x12…x1m，R2=x21x22…x2n分别为其最短路径，那么核的计算方式如下：

K(R1,R2)=n∏i=1c(x1i,x2i),m=nK(R1,R2)=0,m≠nK(R1,R2)=∏i=1nc(x1i,x2i),m=nK(R1,R2)=0,m≠n

考虑另一个例子：

比较两个例子，计算它们的核为2×1×2×1×1×1×2=82×1×2×1×1×1×2=8，它们共同的特征值就是8。这种依存路径核通过一个强加的限制（两条路径的长度应该相等）来解释，而卷积依存路径通过寻找两个依存序列的子序列让这种做法更灵活。

混合核（Composite Kernels）

使用语义树核（KT）和实体核（KE），有

Linear Combination

KLC=α⋅NKE+(1−α)⋅NKTKLC=α⋅NKE+(1−α)⋅NKT

Polynomial Expansion

KPE=α⋅(1+NKE)2+(1−α)⋅NKTKPE=α⋅(1+NKE)2+(1−α)⋅NKT

NKE(NKT)NKE(NKT)是核的归一化后的表示。

NKE(R1,R2)=KE(R1,R2)√KE(R1,R1)KE(R2,R2)NKE(R1,R2)=KE(R1,R2)KE(R1,R1)KE(R2,R2)

评估

有监督方法比较

将实体抽取和关系抽取组合

先前提到的所有RE技术都是由实体的边界和类型的知识，如果预先没有实体的知识，为了运用这些RE技术，首先要运用一些实体抽取技术。一旦实体和它们所属的类型被确定了，就可以运用RE技术了。但是，这里存在一种错误的传播的可能，一旦实体和它们的类型判断错了，后面的关系抽取很大概率也是错误的，为了避免这种情况的发生，应当将实体抽取与关系抽取综合考虑。

基于整数线性规划的方法 Integer Linear Programming based Approach

给定一个句子，在推断的过程中，会产生一个符合特定域（domain-specific）和特定任务（task-specific）限制的全局决策。一个简单的关于限制的例子：关系PER-SOC两端的实体都应该是PER。考虑这个句子 John married Paris。实体抽取找出了两个实体John和Paris，对于第一个实体，假设其预测的概率：Pr(PER)=0.99;Pr(ORG)=0.01Pr(PER)=0.99;Pr(ORG)=0.01，对第二个实体，假设其预测概率为：Pr(GPE)=0.75;Pr(PER)=0.25Pr(GPE)=0.75;Pr(PER)=0.25。同时，RE判断这两个实体之间的关系为PER-SOC，我们可以判断出John（PER）和Paris（GPE）之间是PER-SOC关系，但是这违背了上述的限制。因此，满足所有特定限制的全局决策应该把两个实体都识别为PER并且认为它们是PER-SOC关系，通过基于整数线性规划的方法可以解决限定域的问题.

基于整数的线性规划最小化任务成本函数（assignment cost function）和限制成本函数（constraint cost function）的和。任务成本函数是寻找局部分类器在有最大的可能性的同时有最小的成本；限制成本函数是施加对于打破实体与关系的成本。

基于图模型的方法 Graphical Models based Approach

一种通过局部独立分类器（local independent classifiers）学习实体和关系分类的框架。实体与关系之间的依赖关系通过一种二分（二分图）的，无回路有向的贝叶斯信念网络（bayesian belief network）。

实体用二分图中某一层中的节点表示，关系用另一层的节点表示。每个关系节点RijRij有两个来自其相关的实体Ei,EjEi,Ej的入边，给定一个表示句子的特征向量X，局部实体和关系分类器被用来分别计算$$P_r(E_i

X),P_r(R_{ij}

X)，编码通过条件概率，编码通过条件概率P_r(R_{ij}

E_i,E_j)$$来限制，这个概率可以通过人为的通过已标注的语料库来确定。最大化贝叶斯网络这些节点的联合概率去得到实体和关系最有可能的标签分布，例如：

(e1,e2,…,en,r12,r21,…,rn(n−1))→ argmaxei,rjkPr(E1,E2,…,En,R12,R21,…,Rnn(n−1))(e1,e2,…,en,r12,r21,…,rn(n−1))→ argmaxei,rjkPr(E1,E2,…,En,R12,R21,…,Rnn(n−1))

卡片金字塔解析 Card-Pyramid Parsing

这种方法将实体与关系中的共同依赖用一种类似于打牌时的金字塔型结构的图结构。这种类树（tree-like）的图在最高层有一个根，内部节点在中间层，叶子节点在最底层。句子中的每个实体对应一个叶子节点，并且如果有n片叶子，那么这个树就有n层。每层ll包含的节点比前一层l−1l−1少一个。在ll层的第i个节点是l−1l−1层第i个和第i+1个节点的父节点，每个更高层的节点（除了最底层），对应一个它低一层最左边和最右边的节点之间可能的关系。

卡片金字塔示例

这种结构的目的是联合标记卡片金字塔中的节点。一种上下文无关语法的自底向上的解析算法可以分析卡片金字塔。这种算法用到的语法被称为卡片金字塔语法（Card-pyramid grammar），它包含如下映射类型：

实体映射 Entity Productions
EntityType→Entity,e.g.PER→leadersEntityType→Entity,e.g.PER→leaders
一个局部实体分类器被训练了用来计算每个在式子右边的实体被式子左边的类型映射的概率。
关系映射 Relation Productions
RelationType→EntityType1 EntityType2,e.g.PHYS→PER GPERelationType→EntityType1 EntityType2,e.g.PHYS→PER GPE
一个局部关系分类器被训练了来预测左边关系映射到右边实体对的概率。

给定句子中的实体，卡片金子塔语法和局部实体与关系分类器，卡片金字塔算法尝试去找出最有可能根据实体与关系类型的节点标签。

结构化预测 Structured Prediction

在大部分的联合实体抽取与关系抽取中，假设实体边界（boundaries）总是知道的。有一种同时提取实体和关系的增量联合框架，包含了实体提及的边界问题。早期的方法独立的对实体与关系的局部分类器建模。即使后面做出了最佳的全局决策，实体抽取和关系抽取在训练过程中也不允许交互，因此提出一种将这类问题作为一个结构化预测的问题。这种算法尝试预测对于给定句子（x∈Xx∈X）的输出结构（y∈Yy∈Y），其中这种结构被认为是一种将实体作为节点，关系为带有标签的边的图模型。使用下述式子来预测最有可能的结构y′y′，其中f(x,y)f(x,y)是对整个结构的特征向量：

y′=argmaxy∈Y(x)f(x,y)⋅→wy′=argmaxy∈Y(x)f(x,y)⋅w→

每种候选分布被定义为特征向量f(x,y)f(x,y)和特征权重→ww→的内积。但对于一个句子可能的结构的数量可能非常巨大并且没有一个多项式时间的算法可以找到最优的结构，因此，应用束搜索（beam-search）对输入句子逐步的扩展局部的配置去寻找分数最高的接结构。为了解码，使用半马尔可夫链（每种状态对应输入句子中的一段）而不是将单独的词语当作状态。

Features

在对实体抽取和关系抽取使用不同的局部特征的同时，这种算法框架一个主要优点是任意的这两种任务的特征可以很好的被发现。某些实体抽取使用的全局特征被用来尝试找出实体间长距离依赖，如:

共指一致性 Co-reference consistency

同一个句子中的两个切片（segment）之间的共指连接由某些简单的启发式规则决定的。一个全局特征被编码来检查两个共指的切片是否共享同样的实体类型。
邻居一致性 Neighbour coherence

两个相邻的切片的实体类型作为一个全局特征连接起来。
部分-整体一致性 Part-of-whole consistency

如果一个实体是某个实体中的一部分（由依赖连接prep_ofprep_of连接），它们应该被认为是同一种实体类型.

in some of Italy’s leaders

some 和 leaders应该都属于同一实体类型PER。

某些RE的全局特征如下:

三角约束 Triangle constraint

多个实体不太可能与相同的关系类型完全连接。一个negative特征被用来惩罚任何包含这种形式的结构。
相互依赖的兼容性 Inter-dependent compatibility

如果两个实体通过一个依赖连接而连接起来，它们应该与其它的实体之间的关系有同样的兼容性。

Jhon and Mary visited Germany

Jhon 和 Mary之间是conj_andconj_and连接，因此它们应该与Germany有同样的关系。

另一种联合考虑的方法使用表结构（table structure）。这张表代表了句子中的实体和关系结构，对于有n个词语的句子，这张表是一个n×nn×n的下三角矩阵，其中第i个对角线单元代表了第i个词语的实体类型。任何（i，j）单元代表第i个词语开头的实体与第j个词语开头的实体之间关系（如果它们之间存在关系）。利用这张表，联合抽取问题被映射为一个表填充（table-filling）问题，其中标签被分配到表中的单元中去。

半监督方法 Semi-supervised Approaches

为RE产生标签数据是很费时费力的事情，设计半监督方法的主要动机有两个，

减少人工成本去标注数据
利用产出容易的大量的无标注数据

自举方法 Bootstrapping Approaches

大体上，自举算法需要大量未标记的语料库并且一部分令人感兴趣的种子（seed）关系实例，比如，想要学习抽取关系CaptialOfCaptialOf的模型/模式，种子实例可以是,,,,给定了这些种子，一个自举算法期望可以抽取一样的关系，例如。

双型迭代模型关系扩展 Dual Iterative Pattern Relaiton Expansion（DIPRE）

隐藏在这个算法背后的符合直觉的知识是模式关系的对偶性（Pattern Relaiton Duality）指：

给定一组有效的模式，一组有效的元组（遵循特定类型的一对实体）可以被找到
给定一组有效的元组，一组有效的模式可以被学习

考虑到这个对偶性，DIPRE的算法如下：

DIPRE算法

输入：一组种子元组S（包含已知的特定的关系的元组）

输出：经过多轮迭代的S

1.找到网络中所有S中出现的元组

2.从这些找到的元组中学习模式

3.用学习到的模式去网络上搜索新的元组并添加进S

4.返回1，不停迭代知道没有新的元组加入S

将实体E1,E2间的关系定义R为一个五元组(order,urlprefix,prefix,middle,suffix)(order,urlprefix,prefix,middle,suffix)。其中order是一个布尔值，其他值都是字符串。如果order=trueorder=true，一对实体（E1，E2）匹配定义的模式。一个符合这样的模式的例子如下：

(true,"en.wikipedia.org/wiki/",City of,is capital of,state)(true,"en.wikipedia.org/wiki/",City of,is capital of,state)
匹配句子：CIty of Mumbai is capital of Maharashtra state.

SnowBall

一种基于DIPRE的改进模型，主要在两个地方改进：

模式的表示和生成：使用词的向量来代表DIPRE中的字符串
模式和元组评估方法：丢弃了不够准确的模式，

主动学习 Active Learning

主动学习技术现在在机器学习领域广泛使用了来减少创造标签数据的注解工作。主动学习背后的关键思想是，允许请求获得某些未标注数据的真实标签。人们提出了各种不同的标准来选择这些实例，其共同目标是用很少的实例快速学习基本假设。与监督学习的方法相比，主动学习的重要的一个优势是只需要少量的标签数据。

主动学习系统LGGo-Tesing

LGGo-Testing建立在主动学习方法Co-testing（协同训练）之上，为了应用Co-testing，有两种看关系实力的视角：

一个基于获取联系着的实体特征和包含的句子中的其他特征的局部视角
一个基于使用大型语料库的，联系两个实体的短句的分布相似性的全局视角

假设对于一个类型为PHYS的实体，它紧接着的短语是travelled totravelled to，其他相似的表述有arrivedin,visited.etcarrivedin,visited.etc。如果在一个大型语料库中，两个短语在相似的上下文环境中，那么它们有相近的分布。一个最大熵分类器使用局部视角的特征来训练。在使用分类器时，全局视角下使用了分布相似性的最近邻分类器来寻找最近邻。

标签传播方法 Label Propagation Methond

标签传播方法是一种基于半监督方法的图，其中数据中标注的和为未标注的实例都被表示为图中的节点，并且图中的边用来反应节点的相似性。在这种方法中，任意节点的标签的信息被迭代的通过加权边传播到临近的节点，当传播过程是收敛的，那么最后原来的未标注标签节点的标签可以被推断出来。

使用前文提到的基于特征的方法，关系实例RiRi和RjRj之间的边有以下权重：

Wij=exp(sijσ2)Wij=exp⁡(sijσ2)

其中，sijsij是与RiRi和RjRj之间特征向量的相似性，σ2σ2用来规范权重（这里标签间的平均权重）

其它方法

多任务迁移学习（multi-task transfer learning）

用来解决一个弱监督RE问题，具体为关系类型中只有少量种子实例，但是有大量其他标注了的其他类型的实例。某些特定的关系类型可以用通用的结构。比如ACE关系中，EMP-ORG（employees of TCS）和GPE-AFF（residents of India），都是通过介词结构联系，因此可以用迁移学习来做（共享权重向量）。

无监督方法 Unsupervised Relation Extraction

无监督方法不需要任何已标注数据

聚类方法 Clustering based approaches

最早的无监督RE只需要一个NER标记（tagger）去区分已命名了的实体，这样系统就只要聚焦于已命名的实体。

这种方法通过以下的几步实现：

语料库中的命名实体被标记出来
成对发生的命名实体被创建并且它们的上下文被记录下来
计算step2中标出的实体对之间的上下文的相关性
使用step3中计算出的相似性值来将实体对聚类
每个被聚的类代表一个关系，一个标签自动的根据类中代表的关系来标注这个类

命名实体对和上下文 Named Entity（NE）pairs and context

如果两个实体之间之多有N个词，那么这两个实体就可以称作同时发生的。构建这些同时出现的实体对。观察所有特定的命名实体对，并且记录所有的这样的实体对间的中间词语作为上下文，并且第一个命名实体的左边和第二个命名实体的右边的词语不是上下文。这是这种方法的第一个限制，不是所有的关系都只通过中间词语来表述，比如CEO of ORG, PER announced the financial resultsCEO of ORG, PER announced the financial results，并且命名实体的顺序也是很重要的，同一实体对但顺序不同的也应该分别记录其上下文。

上下文相似度计算 Context similarity computation

对每个命名实体对，使用所有出现在其上下文中的词语构建一个词向量。每个词语的权重为TF×IDFTF×IDF，值得一提的是，对于TF的计算有个有趣的方法，如果一个词语w在上下文（NE1，NE2）中出现L次，在（NE2，NE1）中出现M次，那么w的TF值为L-M。两个实体对之间上下文相似度为计算它们所对应词向量的余弦相似度，值从-1到1之间，1表示两个实体对完全匹配，-1表示有共同上下文但是两个实体对中的实体位置相反的。

聚类和贴标 Clustering and Labelling

利用相似度值，使用全连接的层次聚类方法来聚类命名实体对。聚类结果的标签由类中所有的命名实体对上下文中的高频词自动生成。

对于基础的聚类方法，有一种利用无监督特征选择方法去移除相似度计算中的无意义噪声词语的改进方法。

概念对 Concept pairs

另一种利用维基百科数据的无监督RE方法中，没有使用命名实体对，而是使用了维基百科结构（Wikipedia）的概念对（Concept pairs）。对于一篇维基百科文章，它的题目是主要概念（principal concept）并且与其他连接当前文章的次级概念（secondary concept）配对。具体聚类方法分为两步：

使用连接两个概念的深度语言模式的相似度来对概念对聚类，这些语言模式由句子中的依存树中产生
对尚未聚类的概念对，使用聚类中的形心来聚类。

发现推导规则 DIscovery of Inference Rules

另一种方向的无监督方法是基于从生成的依赖路径中推导关系类型。DIRT算法基于分布相似度假设，不应用这个假设去寻找相近的词语，而是去发现联系同一组词的相近的路线。

半监督语义解析 Unsupervised Semantic Parsing

一种类似的方法，迭代的对依存树中传递同样意思的语法片段进行聚类。

另一种对关系实例聚类的方法使用生成概率模型（和LDA类似，基于标题模型（topic model））。这些模型表示代表实体类型间构建的关系类型和连接的依赖路径的不同的特征。

其它方法

无监督关系抽取系统 Unsupervised RE System（URES）

一种非聚类的无监督RE方法是URES，URES唯一的输入是对于关系类型的定义。一个关系类型被定义为很多指定这种关系类型和实体的参数的关键词，例如对于关系Acquisition，关键词可以是acquired，acquisition。URES是KnowItAll system的直接继承，KnowItAll system从网页中抽取事实，KnowItAll 主要是实体抽取，而URES主要是关系抽取。在URES的基础之上，加上一个基于NER的简单规则，可以更好的改善结果。

无监督释义获取 Unsupervised paraphrase acquisition

另一种方法是基于使用无监督释义获得RE，对于表示同样意义的文本表述，把它称作释义（paraphrases）。这个方法从一个文本表述开始（相应的语法结构类似依存结构）表示目标关系并且使用无监督方式找到它的释义。例如，开始时的表述X interact with YX interact with Y，释义获取算法会产生新的表述X bind to Y,X activate Y,X stimulate Y,interaction between X and Y,etcX bind to Y,X activate Y,X stimulate Y,interaction between X and Y,etc

开放信息抽取 Open Information Extraction

传统的RE关注准确、提前特化的关系，需要大量的人为参与设计抽取规则或者创建标注数据。因此，针对不同域的问题，这种系统很难行之有效。为了克服这些限制，开放信息抽取（Open IE）范式被以TextRunner系统提出来了。Open IE自动地发现语料库中的关系而不需要人为的参与。因此，当转移到不同域的问题时没有额外的工作要做。

TextRunner系统包含以下三个核心模组：

自我监督学习器 Self-supervised Learner

使用一些启发式的规则，它会自动的标注一组抽取的实体元组为postive或者negative。在这里，pos类表示关联的元组代表某些有效的关系。经过自动标注后，每个元组被映射为一个特征向量，并且训练一个朴素贝叶斯（Naive Bayes）分类器。
单次通过抽取器 Single Pass Extractor

对整个语料库应用单次通过，得到所有句子的POS和NP信息。对每个实例，每对NPs（E1和E2）作为候选元组并且通过测试它们之间的文本找到相应的关系R。对每个它们之间的词，启发式的决定是否在R中包含它们。每个候选元组被输入进朴素贝叶斯分类器，并且只有分类为postive的例子会被抽取并保存。
基于冗余的评估器 Redundancy-based Assessor

在对整个语料库进行抽取后，TextRunner自动的合并某些实体和关系都一样的元组。对每个元组，包含它的独特的句子的个数也被记录下来并且评估器使用这些数量去衡量每个元组正确的概率

使用基于状态随机场（Conditional Random Field）的自我监督序列分类器O-CRF来代替朴素贝叶斯分类器去改善TextRunner的结果。

另一种对TextRunner的改进为使用维基百科开放抽取系统（Wikipedia-based Open Extractor，WOE），通过维基百科的信息框生成更加准确的自我监督学习器中的训练数据。

自举的方法，像Snowball减少了初始训练的例子，但是这些方法并没有应用于Open IE系统，于是有一种改进的自举算法StatSnowball可以被应用与Open IE。

ReVerb

一种克服了TextRunner中下列限制的Open IE系统：

没有逻辑的抽取 Incoherent Extractions

从句子中抽取出来的关系可能是没有意义的。这样的抽取是一个字一个字的决定一个词是否包括在一个关系短语的结果。
没有有效信息的抽取 Uninformative Extractions

这些抽取忽视了重要的信息，通常是由对关系短语处理不当造成的，这些短语由轻动词结构（Light Verb Constructions，LVCs）表示。LVCs是一个多词语的表述方式，包括一个动词和一个名词，并且名词含有语义内容。比如，is the author of。在句子John made a promise to Alice中，TextRunner提取了一个没有有效信息的元组（John，made，a promise），正确的抽取应该是（John，made a promise to，Alice）。
过分具体的抽取 Overly-specific Extractions

TextRunner可能会抽取过度明确而无用的关系，比如（The Obama administration,is offering only modest greenhouses gas reduction targets at, the conference）

为了克服以上的限制，ReVerb算法使用下面两种约束来做抽取。

语义约束 Syntactic Constraint

通过约束关系短语去匹配下表的POS tag模式：

这个约束限制了关系短语只能是下面几种中的一种：动词（e.g. invented）；紧接着介词的动词（e.g. born at）；紧接着名词、形容词或副词并以介词结尾的（e.g. has atomic weight of）;多个相邻的匹配项合成一个单独的关系短语（e.g. wants to extend）。这样可以避免抽取出没有逻辑的短语，因为这样无需在孤立的词语级别的判别是否应该在某个关系短语中包含这个词，这样是判别一组词语是否符合POS模式。这样同样也可以避免无效信息的抽取，因为名词也允许是关系短语中的一部分并且符合LVCs模式的关系也可以被找到。
词汇约束 Lexical Constraint

为了避免过分具体的关系短语，使用词汇约束时只考虑那些采用至少k个不同的参数对的关系短语。例如短语took control over是有效的，因为其在多种参数时都生效，像（Germany，took control over，Austria）和（Modi，took control over，administration）

ReVerb与TextRunner在区分关系短语时的方法是不同的，ReVeb从整体的角度区分关系短语，而不是从单个词语的角度。

在ReVerb的基础上再加上一个模块ArgLearner来区分短语中的参数可以提高ReVerb中区分出的关系短语中的参数的准确率。

这些开放信息抽取系统中有一个主要的限制是具有同样语义的关系可能会被多个关系短语表示并且这些关系短语要通过后续处理来巩固。

远程监督 Distant Supervision

远程监督是一种不要求标注数据的替代的范式，它利用自动获取关系标签的大的语义数据库。这些标签可能是有噪声的，但是大量的训练数据可以抵消这些噪声。与之相近的还有个思路，创作“弱”标签的数据。

远程监督综合了两种模式（监督的和无监督的）的优势。在监督模式上，它使用概率性的分类器结合了成千的特征；在无监督模式上，它从任意域中的大量语料库中抽取了很多数量的关系。

方法提出者使用了Freebase作为语义数据库，Freebase中存有表示不同关系的实体对。

启发式标注 Labelling heuristic

如果两个实体出现在一个关系中，任何包含它们的句子都有可能表示这个关系。举个例子，一个实体对对应关系/film/director/film，因此下面这两个句子都有可能给这种关系提供正面的支持:

M. Night Shyamalan gained international recognition when he wrote and directed 1999’s The Sixth Sence.
The Sixth Sence is a 1999 American supernatural thriller drama film written and directed by M. Night Shyamalan.

负面实例 Negative Instances

上面提出的启发式方法只能找到正面实例。为了训练分类器，正面实例和负面实例都是需要的。在Freebase中未出现的实体对被任意的选出作为负面实例。但是因为Freebase的不完善性，某些实体对可能会被错误的打上负面的标签。

一个使用高斯正则化的多分类的逻辑斯蒂分类器（multi-class Logistic Classifier with Gaussian regularization）使用自动获取的标签来训练。不同的词汇，语义和命名实体类型特征都被用来训练。

多实例多标签方法 The Multi-instance Multi-label learning based approach（MIML-RE）

传统远程监督方法的一个主要缺点是没有能对互相重叠的关系建模。比如，某些相同的实体对，可能有不同的有效的实体关系，元组（Steve Jobs，Apple）可以是FoundedBy关系也可以是CEO关系。

MIML-RE为实体的多个的实例建模了潜在的标签，并且它还为单个实体对的标签之间的依赖关系建模。MIML-RE使用一种新的图形模型来表示一个实体对的多个实例以及多个标签。一个提及（mention）层面的分类器使用提及的上下文来对实体对中的每个提及的关系进行分类。还有另外一组分类器，在实体对级别上操作每个远程关系标签。这些都是二分类的分类器，表示实体对之间是否有特定的关系。

这些分类器可以认识到两种关系，比如Born In和Spouse Of不能由同一个实体对生成。如果提及层面的分类器在低一层对这两种关系的标签都分配到了同样的元组，那么实体对层面的分类器可以取消其中一个标签。这些分类器也可以学习什么时候两种标签趋向于同时出现，就像CapitalOf和ContainedIn。为了学习图模型的中的不同参数，需要采用EM算法。

近期，远程监督RE成为了非常活跃的领域并且有一些新的方法来改进特定的问题。因为语义词典库的不完整性，有些negative的实例实际上是正确的。为了克服这个问题，一种算法是只从positive例子和未标注数据中学习；一种算法是对伪negative例子采用伪反馈信息检索技术。

MIML-RE的数据可能的表述的一个问题是这是一个非凸公式。一种有识别能力的聚类可以使其变为凸公式。

本体论平滑 Ontological Smoothing

如果知识数据库不是明确非凸的，那么远程监督是不能应用的。当只要有某些关系的种子例子时，本体论平滑方法就可以用来解决上述问题。OS方法产生一个关系和知识库的映射。这样的映射关系被用来生成额外的训练样本，之后可以用远程监督学习RE。

联合使用远程监督和直接监督可以显著的提高RE的表现。

使用主动学习远程监督

使用主动学习去提供一个对MIML-RE有偏向性的监督。使用一个新的选择关系实例的标准，偏向于选择不确定的（在分类器中容易引起高度分歧）和有代表性的（与大量未标注实例类似）的实例。

近期RE的进展 Recent Advances in Relation Extraction

通用模式 Universal Schemas

将现存的结构化数据库（像Free Base，Yago等）联合起来并且将Open IE中可能的关系类型以表面（surface）形式形成通用模式。

US在通用关系类型（universal relation）中学习非对称含义。这种含义可以帮助从结构化数据库中的一组关系中推断出符合实体对的关系。如果一个城市和一个国家之间的关系是CapitalOf，那么也可以推断出关系LocatedIn也符合这个城市和国家。但是这种非对称关系反过来不一定能够成立。

n元关系抽取 n-ary Relation Extraction

关系间的元组超过2个，比如EMP-ORG-DESG，例子为句子Jhon Smith is the CEO of ABC Corp（Jhon Smith，CEO，ABC Corp.）。

早期对n元关系抽取实验的是做法是从二元关系中形成一个图，其中实体是节点，实体间之间的关系是边。从图中找出最大集群，每个集群对应着某种n元关系。

另一种角度看n元关系RE问题是语义角色标签（Semantic Roles Labelling，SRL）。SRL从给定的句子中自动的区分谓语和它的元素。

交叉句子关系抽取 Cross-sentence Relation Extraction

目前主要探讨的技术都是句子中的RE（intra-sentential RE），有些时候句子间也存在RE，如下图

句间RE

应用结构化特征（如分析树路径）和句内RE的技术来做句子间的RE。一般来说，可以通过共指关系来解决句子间RE的问题。

卷积深度神经网络 Convolutional Deep Neural Network

在不经过复杂NLP分析的前提下，使用卷积DNN去抽取词语级别与句子级别的特征。自动学习出来的特征可能比人为设计的特征更有效。另一种类似的做法是利用RNN。

交叉语言注释投影 Cross-lingual Annotation Projection

实体和标注数据只能从某些语料丰富的语言（英文，中文，阿拉伯语等）中获得。因此需要一种关系投影方案将预料丰富的语言投影到语料不丰富的语言。

域适应 Domain Adaptation

监督学习系统的基本假设是训练数据和测试数据是符合同样的分布的。但是当数据分布不匹配时，RE表现就会打折扣，这种情况往往发生在区分域外的数据时。通过将从单词聚类和潜在语义分析(LSA)中获得的语义相似信息嵌入到语法树内核中，可以提高基于核的系统的域外性能。

结论和展望

尽管目前最先进的RE技术已经在近十年来发展的很好，但仍有一下几个方向具有很大的潜力。

现在已经有一些技巧综合考虑实体和关系抽取了，但是当数据集不够好时，算法表现往往较差，因此可以设计出更精致的模型。
现在对n元关系抽取做的工作还很少，因此需要更多有效的方法。
大部分的RE研究都是在英语之上完成，剩下的很大部分是中文和阿拉伯语。分析现有的有效的和语言无关的方法是很有潜力的。对于语料贫瘠的语言（缺少使用的NLP预处理工具，如POS标签，parsers等），还有很多系统的工作去做。
大部分RE中的NLP处理步骤受到词语（lexical）和句法（syntax）的限制，只有少数技术用到浅层的语义处理。分析语义和语篇层次等更深层次的自然语言处理是否有助于提高再加工能力，将是很有意义的。

你可能感兴趣的:(自然语言处理,人工智能,深度学习)

英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
Java NLP炼金术：从词袋到深度学习，构建AI时代的语言魔方墨夶 Java学习资料人工智能 java 自然语言处理
一、JavaNLP的“三剑客”：框架与工具链1.1ApacheOpenNLP：传统NLP的“瑞士军刀”目标：用词袋模型实现文本分类与实体识别代码实战：文档分类器的“炼成术”//OpenNLP文档分类器（基于词袋模型）importopennlp.tools.doccat.*;importopennlp.tools.util.*;publicclassDocumentClassifier{//训练模型
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
Python爬虫实战：使用最新技术爬取新华网新闻数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 音视频
一、前言在当今信息爆炸的时代，网络爬虫技术已经成为获取互联网数据的重要手段。作为国内权威新闻媒体，新华网每天发布大量高质量的新闻内容，这些数据对于舆情分析、市场研究、自然语言处理等领域具有重要价值。本文将详细介绍如何使用Python最新技术构建一个高效、稳定的新华网新闻爬虫系统。二、爬虫技术选型2.1技术栈选择在构建新华网爬虫时，我们选择了以下技术栈：请求库：httpx（支持HTTP/2，异步请求
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多