知识图谱中传统关系抽取方法

目前主要采用统计机器学习的方法,将关系实例转换成高 维空间中的特征向量或直接用离散结构来表示,在标注语 料库上训练生成分类模型,然后再识别实体间关系 

基于特征向量方法

最大熵模型(Kambhatla 2004)和支持向量机 (Zhao et al., 2005;Zhou et al., 2005; Jiang et al., 2007)等

主要问题:

如何获取各种有效的词法、句法、语义等特征,并把 它们有效地集成起来,从而产生描述实体语义关系的各种局部特 征和简单的全局特征

特征选取:

从自由文本及其句法结构中抽取出各种表面特征以及结构化特征
实体词汇及其上下文特征
实体类型及其组合特征
实体参照方式
交叠特征
基本短语块特征
句法树特征

基于核函数的方法

浅层树核(Zelenko et al., 2003)、依存树核( Culotta et al., 2004)、最短依存树核(Bunescu et al., 2005)、卷积树 核(Zhang et al., 2006;Zhou et al., 2007)

主要问题

如何有效挖掘反映语义关系的结构化信息及如何有效计算结构化信息之间的相似度

卷积树核

用两个句法树之间的公共子树的数目来衡量它们之间的相似度

标准的卷积树核(CTK)

在计算两棵子树的相似度时,只考虑子树本身,不考虑子树的上下文信息

上下文相关卷积树核函数(CS-CTK)

在计算子树相似度量,同时考虑子树的祖先信息,如子树根结点的父结点 、祖父结点信息,并对不同祖先的子树相似度加权平均

基于神经网络的方法

递归神经网络( Socher et al., 2012)、基于矩 阵空间的递归神经网络( Socher et al., 2012)、卷积神经网络(Zeng et al., 2014)

主要问题

如何设计合理的网络结构,从而捕捉更多的信息,进而更准确的完成关系的抽取

网络结构

不同的网络结构捕捉文本中不同的信息

递归神经网络(RNN)

网络的构建过程更多的考虑到句子的句法结构,但是需要依赖复杂的句法分析工具

卷积神经网络(CNN)

通过卷积操作完成句子级信息的捕获,不需要复杂的NLP工具

知识图谱中传统关系抽取方法_第1张图片

你可能感兴趣的:(自然语言处理)