ox180x

关系抽取-学术界

关系抽取调研——学术界

1. 任务
- 1.1. 任务定义
- 1.2. 数据集
- 1.3. 评测标准
- 1.4. SOTA
2. 方法总结
- 2.1. 基于模式挖掘的方法
  - 2.1.1. 基于模板匹配的方法
  - 2.1.2. 基于依存句法的方法
- 2.2. 监督学习
  - 2.2.1. 机器学习
    - 2.2.1.1. 基于特征向量的方法
    - 2.2.1.2. 基于核函数的方法
  - 2.2.2. 深度学习
    - 2.2.2.1. Pipeline(管道式)
    - 2.2.2.2. Joint(联合抽取式)
    - 2.2.2.3. 远监督学习
- 2.3. 半监督/无监督方法
  - 2.3.1. Bootstrapping
  - 2.3.2. 联合训练
  - 2.3.3. 标签传播
  - 2.3.4. 关系实例聚类和关系类型词选择

4. Paper List
- 4.1. 论文列表
  - 4.1.1. 监督类方法
  - 4.1.2. 远监督方法
- 4.2. 论文解读
5.相关文献

1. 任务

1.1. 任务定义

自动识别句子中实体之间具有的某种语义关系。根据参与实体的多少可以分为二元关系抽取(两个实体)和多元关系抽取(三个及以上实体)。

通过关注两个实体间的语义关系，可以得到(subject, relation, object)三元组，其中subject和object表示两个实体，relation表示实体间的语义关系。

根据处理数据源的不同，关系抽取可以分为以下三种：

面向结构化文本的关系抽取：包括表格文档、XML文档、数据库数据等
面向非结构化文本的关系抽取：纯文本
面向半结构化文本的关系抽取：介于结构化和非结构化之间

根据抽取文本的范围不同，关系抽取可以分为以下两种：

句子级关系抽取：从一个句子中判别两个实体间是何种语义关系
语料(篇章)级关系抽取：不限定两个目标实体所出现的上下文

根据所抽取领域的划分，关系抽取又可以分为以下两种：

限定域关系抽取：在一个或者多个限定的领域内对实体间的语义关系进行抽取，限定关系的类别，可看成是一个文本分类任务
开放域关系抽取：不限定关系的类别

限定域关系抽取方法：

基于模板的关系抽取方法：通过人工编辑或者学习得到的模板对文本中的实体关系进行抽取和判别，受限于模板的质量和覆盖度，可扩张性不强
基于机器学习的关系抽取方法：将关系抽取看成是一个分类问题

1.2. 数据集

ACE 2005

数据集简介：ACE2005语料库是语言数据联盟(LDC)发布的由实体，关系和事件注释组成的各种类型的数据，包括英语，阿拉伯语和中文培训数据，目标是开发自动内容提取技术，支持以文本形式自动处理人类语言。ACE语料解决了五个子任务的识别：entities、values、temporal expressions、relations and events。这些任务要求系统处理文档中的语言数据，然后为每个文档输出有关其中提到或讨论的实体，值，时间表达式，关系和事件的信息。

获取方式：数据集收费，需在LDC联盟的官网上注册再购买，LDC账号注册地址 ACE 2005 下载地址
TACRED

数据集简介：TACRED(TAC Relation Extraction Dataset)是一个拥有106264条实例的大规模关系抽取数据集，这些数据来自于每年的TAC KBP(TAC Knowledge Base Population)比赛使用的语料库中的新闻专线和网络文本。包含了41关系类型，此外若句子无定义关系，被标注成no_relation类型。数据集的详细介绍可以访问TACRED文档

获取方式：数据集收费，需在LDC联盟官网注册会员再购买 LDC账号注册地址 TACRED 下载地址
SemEval2010_task8

数据集简介:对于给定了的句子和两个做了标注的名词，从给定的关系清单中选出最合适的关系。数据集一共9种关系类别数，此外包含一类Other关系，含有6674实例数量。

获取方式: 原始数据
FewRel

数据集简介:FewRel是目前最大规模的精标注关系抽取数据集，由孙茂松教授领导的清华大学自然语言处理实验室发布。一共100种关系类别数，含有70000实例数量。

获取方式：FewRel 网站地址论文地址
NYT10

NYT-10数据集文本来源于纽约时报，命名实体是通过 Stanford NER 工具并结合 Freebase 知识库进行标注的。实体对之间的关系是链接Freebase知识库中的关系，结合远监督方法所得到。该数据集共含有53种关系类型，包括特殊关系类型NA，即头尾实体无关系。

获取方式:原始数据

获取更多关系抽取数据集，可访问此处Annotated-Semantic-Relationships-Datasets

1.3. 评测标准

二分类：

Accuracy = (预测正确的样本数)/(总样本数)=(TP+TN)/(TP+TN+FP+FN)

Precision = (预测为正例且正确预测的样本数)/(所有预测为正例的样本数) = TP/(TP+FP)

Recall = (预测为正例且正确预测的样本数)/(所有真实情况为正例的样本数) = TP/(TP+FN)

F1 = 2 (Precision Recall) / (Precision + Recall )

多分类：

Macro Average

多类别(N类) F1/P/R的计算，即计算N个类别的F1/P/R，每次计算以当前类别为正例，其他所有类别为负例，最终将各类别结果求和并除以类别数取平均。

Micro Average

统计当前类别的TP、TN、FP、FN数量，再将该四类样本数各自求和作为新的TP、TN、FP、FN，计算F1/P/R公式同二分类。

P@N(最高置信度预测精度):

通常在远监督关系抽取中使用到，由于知识库所含关系实例的不完善，会出现高置信度包含关系实例的实体对被叛为负例，从而低估了系统正确率。此时可以采用人工评价，将预测结果中知识库已包含的三元组移除，然后人工判断抽取关系实例是否正确，按照top N的准确率对抽取效果进行评价。

1.4. SOTA

Relation Extraction on TACRED：

模型	average F1	论文题目	年份	论文链接	code
BERTEM+MTB	71.5	Matching the Blanks: Distributional Similarity for Relation Learning	2019	https://arxiv.org/pdf/1906.03158v1.pdf	https://github.com/plkmo/BERT-Relation-Extraction
KnowBert-W+W	71.5	Knowledge Enhanced Contextual Word Representations	2019	https://arxiv.org/pdf/1909.04164v2.pdf
DG-SpanBERT	71.5	Efficient long-distance relation extraction with DG-SpanBERT	2020	https://arxiv.org/pdf/2004.03636v1.pdf
SpanBERT	70.8	SpanBERT: Improving Pre-training by Representing and Predicting Spans	2019	https://arxiv.org/pdf/1907.10529v3.pdf	https://github.com/facebookresearch/SpanBERT
R-BERT	69.4	Enriching Pre-trained Language Model with Entity Information for Relation Classification	2020	https://arxiv.org/pdf/1905.08284v1.pdf	https://github.com/wang-h/bert-relation-classification
C-GCN + PA-LSTM	68.2	Graph Convolution over Pruned Dependency Trees Improves Relation Extraction	2018	https://arxiv.org/pdf/1809.10185v1.pdf	https://github.com/qipeng/gcn-over-pruned-trees

Relation Extraction on SemEval-2010 Task 8：

模型	average F1	论文题目	年份	论文链接	code
Skeleton-Aware BERT	90.36	Enhancing Relation Extraction Using Syntactic Indicators and Sentential Contexts	2019	https://arxiv.org/pdf/1912.01858v1.pdf	https://github.com/wang-h/bert-relation-classification
EPGNN	90.2	Improving Relation Classification by Entity Pair Graph	2019	http://proceedings.mlr.press/v101/zhao19a/zhao19a.pdf
BERTEM+MTB	89.5	Matching the Blanks: Distributional Similarity for Relation Learning	2019	https://arxiv.org/pdf/1906.03158v1.pdf	https://github.com/plkmo/BERT-Relation-Extraction
R-BERT	89.25	Enriching Pre-trained Language Model with Entity Information for Relation Classification	2020	https://arxiv.org/pdf/1905.08284v1.pdf	https://github.com/wang-h/bert-relation-classification
KnowBert-W+W	89.1	Knowledge Enhanced Contextual Word Representations	2019	https://arxiv.org/pdf/1909.04164v2.pdf
Entity-Aware BERT	89	Extracting Multiple-Relations in One-Pass with Pre-Trained Transformers	2019	https://arxiv.org/pdf/1902.01030v2.pdf	https://github.com/helloeve/mre-in-one-pass

Relation Extraction on ACE 2005：

模型	RELATION F1	ENTITY F1	SENTENCE ENCODER	论文题目	年份	论文链接	code
MRC4ERE++	62.1	85.5	BERT base	Asking Effective and Diverse Questions: A Machine Reading Comprehension based Framework for Joint Entity-Relation Extraction	2020	https://www.ijcai.org/Proceedings/2020/0546.pdf	https://github.com/TanyaZhao/MRC4ERE
Multi-turn QA	60.2	84.8	BERT base	Entity-Relation Extraction as Multi-Turn Question Answering	2019	https://arxiv.org/pdf/1905.05529v4.pdf
MRT	59.6	83.6	biLSTM	Extracting Entities and Relations with Joint Minimum Risk Training	2018	https://www.aclweb.org/anthology/D18-1249
GCN	59.1	84.2	biLSTM	Joint Type Inference on Entities and Relations via Graph Convolutional Networks	2019	https://www.aclweb.org/anthology/P19-1131
Global	57.5	83.6	biLSTM	End-to-End Neural Relation Extraction with Global Optimization	2017	https://www.aclweb.org/anthology/D17-1182
SPTree	55.6	83.4	biLSTM	End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures	2016	https://arxiv.org/pdf/1601.00770v3.pdf	https://github.com/tticoin/LSTM-ER

Relation Extraction on ACE 2004：

模型	RELATION F1	ENTITY F1	论文题目	年份	论文链接	code
DYGIE	59.7	87.4	A General Framework for Information Extraction using Dynamic Span Graphs	2019	https://arxiv.org/pdf/1904.03296v1.pdf	https://github.com/luanyi/DyGIE
Multi-turn QA	49.4	83.6	Entity-Relation Extraction as Multi-Turn Question Answering	2019	https://arxiv.org/pdf/1905.05529v4.pdf
SPTree	48.4	81.8	End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures	2016	https://arxiv.org/pdf/1601.00770v3.pdf	https://github.com/tticoin/LSTM-ER
multi-head + AT	47.45	81.64	Adversarial training for multi-context joint entity and relation extraction	2018	https://arxiv.org/pdf/1808.06876v3.pdf	https://github.com/bekou/multihead_joint_entity_relation_extraction
multi-head	47.14	81.16	Joint entity recognition and relation extraction as a multi-head selection problem	2018	https://arxiv.org/pdf/1804.07847v3.pdf	https://github.com/bekou/multihead_joint_entity_relation_extraction
Attention	45.7	79.6	Going out on a limb: Joint Extraction of Entity Mentions and Relations without Dependency Trees	2017	https://www.aclweb.org/anthology/P17-1085

Relation Extraction on NYT：

模型	average F1	论文题目	年份	论文链接	code
REDN	89.8	Downstream Model Design of Pre-trained Language Model for Relation Extraction Task	2020	https://arxiv.org/pdf/2004.03786v1.pdf	https://github.com/slczgwh/REDN
CASREL	89.6	A Novel Cascade Binary Tagging Framework	2019	https://arxiv.org/pdf/1909.03227v4.pdf	https://github.com/weizhepei/CasRel
HBT	89.5	A Novel Cascade Binary Tagging Framework for Relational Triple Extraction	2019	https://arxiv.org/pdf/1909.03227v4.pdf	https://github.com/weizhepei/CasRel
WDec	84.4	Effective Modeling of Encoder-Decoder Architecture for Joint Entity and Relation Extraction	2019	https://arxiv.org/pdf/1911.09886v1.pdf	https://github.com/nusnlp/PtrNetDecoding4JERE
ETL-Span	78.0	Joint Extraction of Entities and Relations Based on a Novel Decomposition Strategy	2019	https://arxiv.org/pdf/1909.04273v3.pdf	https://github.com/yubowen-ph/JointER
CopyRE’ OneDecoder	72.2	CopyMTL: Copy Mechanism for Joint Extraction of Entities and Relations with Multi-Task Learning	2019	https://arxiv.org/pdf/1911.10438v1.pdf	https://github.com/WindChimeRan/CopyMTL

Relation Extraction on CoNLL04：

模型	RELATION F1	ENTITY F1	论文题目	年份	论文链接	code
SpERT	71.47	88.94	Span-based Joint Entity and Relation Extraction with Transformer Pre-training	2019	https://arxiv.org/pdf/1909.07755v3.pdf	https://github.com/markus-eberts/spert
Multi-turn QA	68.9	87.8	Entity-Relation Extraction as Multi-Turn Question Answering	2019	https://arxiv.org/pdf/1905.05529v4.pdf
Global	67.8	85.6	End-to-End Neural Relation Extraction with Global Optimization	2017	https://www.aclweb.org/anthology/D17-1182
Biaffine attention	64.40	86.20	End-to-end neural relation extraction using deep biaffine attention	2018	https://arxiv.org/pdf/1812.11275v1.pdf	https://github.com/datquocnguyen/jointRE
Relation-Metric with AT	62.29	84.15	Neural Metric Learning for Fast End-to-End Relation Extraction	2019	https://arxiv.org/pdf/1905.07458v4.pdf
multi-head	62.04	83.9	Joint entity recognition and relation extraction as a multi-head selection problem	2018	https://arxiv.org/pdf/1804.07847v3.pdf	https://github.com/bekou/multihead_joint_entity_relation_extraction

Relation Extraction on FewRel：

模型	average F1	论文题目	年份	论文链接	code
ERNIE	88.32	ERNIE: Enhanced Language Representation with Informative Entities	2019	https://arxiv.org/pdf/1905.07129v3.pdf	https://github.com/thunlp/ERNIE

2. 方法总结

2.1. 基于模式挖掘的方法

2.1.1. 基于模板匹配的方法

模板匹配：在关系分类中应用广泛。对于给定实体对的一段文本，基于现有模板库进行上下文匹配。若结果满足模板对应关系类别，则将该关系类别作为实体对之间的关系。

常见的模板匹配方法主要包括：

人工模板：常见于判断实体间存在的上下位关系。基本出发点是统计和总结关系模式，通过专家定义寻找关系在上下文中表达的字符，语法及语义特征，将此作为模式与文本进行匹配，进行关系实例的获取。
统计生成：无须人工构建，主要基于搜索引擎进行统计模板抽取。具体地，将已知实体对作为查询语句，抓取搜索引擎返回的前n个结果文档并保留包含该实体对的句子集合，寻找包含实体对的最长字串作为统计模板，保留置信度较高的模板用于关系分类。

(Marti A. Hearst 1992) ^[1]在该文中提出一种从不受限制的文本中自动获得下位词法关系的方法，用于提取分类关系is-a的实例：

示例：

句子中上下位关系，比如hyponym(China; Asia countries)。从下面两个句子中都可以抽取出这种关系：

Asia countries, especially China, Japan, and India…
Asia countries, such as China, Japan, and India…

两个实体之间的especially和such as可以看做这种关系的特征。通过寻找更多表达这种关系的句子，构造规则模板，即可用于抽取构成上下位关系的实体，从而发现新的三元组。

总结：

优点：

该方法准确率较高。
从某种意义上说，这是一种假设的工作，Hearst文中没有给出实验结果，但它对追随者影响很大，是之后Bootstraping方法的开篇之作。

缺点：

召回率较低，且关系类别有限，仅仅包含is-a的关系。
适用性有限，难以移植

2.1.2. 基于依存句法

基于NLP工具(常见的有Stanford CoreNLP、spaCy、LTP、HanLP等)获取句子相关特征，对处理结果一般进行如下处理：

输入文本完成分词、词性标注、命名实体识别、依存分析等处理步骤。
基于语法规则抽取出相关语法信息，如 “主谓宾”、“定状补”等，从而得到句子中各成分之间的联系和关系。
利用各成分之间相互关联关系总结出诸如定中关系，定语后置关系等抽取规则。
设定规则模板，并根据规则对抽取结果进行严格测试与调优。

示例

下面介绍一组基于LTP(语言技术平台)工具进行规则抽取三元组的例子：

输入文本：杨燕萍，女，中国共产党党员，系江西省第十一届政协主席许爱民的妻子。
经LTP得出依存句法分析结果：

依存句法分析结果示例

依存句法关系类型说明

由图示可知，可以以谓语动词为出发点构建规则，对节点上词性以及边上的关系进行设定。当前句子核心谓词是“系”，从前向后遍历句子解析结果可以从“主席”开始分析，由于“主席”与左右两侧词汇均构成定中关系且两侧词汇均被识别为命名实体。由此，可以提取出一项(政协，主席，许爱民)定中关系三元组。

总结

手写规则的优点：

人工设定规则，准确率高(high-precision)
结合专家知识，进行特定领域定制
构建简单，适合小规模关系类别数据

缺点：

规则总结无法穷尽，导致低召回率(low-recall)
所有关系类别须定义相关规则pattern，耗时耗力
难以维护及跨领域移植

2.2. 监督学习

2.2.1. 机器学习

2.2.1.1. 基于特征向量的方法

基于特征向量的方法是一种简单且行之有效的关系抽取运用。其主要思想为：给定关系句子实例，从上下文中提取出具有类间区分度的特征(如词法信息，语法信息等)，构造形成多维度加权特征向量，选取合适的分类器进行关系抽取模型训练。

基于特征向量的方法需要解决的三个基本问题：特征项选取，特征权重计算和分类器选择。

特征项。作为向量模型的骨架，它需要包含足够的语义信息来表征自然文本，又需要在语义关系间具有良好的区分度。常见的特征项有：词法、实体、句法、语义及上下文结构化信息等。
特征权重计算。众多候选特征项，对最终关系分类的贡献度不可能完全一样，比如实体间语义关系往往比实体词汇、句子长度等特征更加重要。因此，需要进行特征重要性权重计算。这里提供两种权重方法计算思路：一、公式计算权值并排序，如布尔权重、特征频度^[5]。二、基于优化算法进行最优权向量搜索^[6]
分类器选取。特征向量构造完毕后，下一步便是选取合适的分类器。下面介绍两种具有代表性的分类器：
- 最大熵模型(Maximum Entropy Model)
  
  Kambhatla 2004^[2]基于文本中实体词，实体类型，实体引用类型、语法以及句法树在内的多种特征，采用最大熵分类器，对不同特征叠加后进行了实验对比，并在ACE RDC2003语料的子类关系中获得了52.8的F1值，表明多层面语言学特征能有效提升关系分类模型的效果。
- 支持向量机(SVM)
  
  Zhou et al.,2005^[3]在Kambhatla前期基础上，融入基本的词组块信息特征组合，基于SVM获得了55.5的F1性能，并得出实体类别特征对于关系抽取结果提升最大的结论。Zhao et al.，2005^[4]引用了文字特征，语句解析和深层语法依存特征等组合。Jiang et al.,2007^[5]选取文本词序列、句法、依存关系等特征组合，以不同类别特征对抽取结果贡献度进行了评估，他们总结出在这些类别特征中选取最基本的单位特征便可以有效的提升关系抽取的性能，而过于复杂的特征带来的性能提升效果则一般。

小结：

基于特征向量的方法是关系抽取中最常见的方法，特征工程是该方法核心。研究者启发式地以多层次语言特征为切入点，并构造特征向量，结合分类器训练，可以取得不错的效果。但该方法现如今难以寻找有效新特征，性能提升较为有限。

2.2.1.2. 基于核函数的方法

针对特征提取具有的局限性，便有研究者另辟蹊径，使用核函数的方法进行关系抽取。基于核函数的方法无需人为构造显性特征，而是以输入文本实例的字符串或者是句法分析树结构作为输入，通过计算任意两个输入对象间的核相似度函数来训练分类模型。基于核函数的方法通过核函数映射综合了更多方面的知识信息，使实体间关系表示更加灵活。核函数类型众多，有包含诸如多项式核函数，向量空间核函数，P-光谱核函数，全序列核函数等。基于核函数的方法灵活性较高，对于多个不同个体核函数可以进行复合，从而得到针对具体任务的核函数。

方法原理：在初始特征空间下，核函数将该空间里的数据点映射到一个新的特征空间下，在该空间中训练线性分类器。其本质是将句子潜在的隐式特征向量投影到新的特征空间，并通过计算投影的内积来表示输入空间特征向量的相似性，最终达到判定实体间关系类别相似性的效果。

基于核函数的方法抽取关系一般步骤：

针对句子中隐含的特征信息，选用合适的解析结构，如语法树等进行语句剖析；
在此基础上选择合适的基础核函数，计算解析结构中成分之间的相似性；
在基础核函数之上，将多个核函数复合，以充分利用各种隐式特征，提高分类精度。

浅层树核(Zelenko，2003)^[6]
依存树核(Culotta et al., 2004)^[7]
最短依存树核(Bunescu et al., 2005)^[8]
卷积树核(Zhang et al., 2006^[9]；Zhou et al., 2007^[10])
其他的还有诸如
- constituent parse trees [Collins & Duffy, 2001]
- string sequencies [Cancedda & al., 2003]
- directed acyclic graphs [Suzuki & al., 2003]
- dependency parse trees [Moschitti, 2006]
- feature-enriched/semantic tree kernel [Plank & Moschitti,2013; Sun & Han, 2014]

小结:

基于核函数的方法可以规避构造基于向量方法中显式特征集合，且更能够充分利用句子的长距离特征。然而核方法将多个不同核函数符合后，虽然可以表达高纬度或无穷维度特征空间，但也导致该方法学习和训练速度过程较为缓慢，对于大规模数据抽取场景耗费时空代价巨大。

二者比较

方法	特征项	特征表示方法	核心步骤
基于特征向量的方法	词、词性、上下文结构信息、依存分析、句法树等	显式	特征工程
基于核函数的方法	依存树核、卷积树核等	隐式高维	设计核函数计算

2.2.2. 深度学习

2.2.2.1. Pipeline(管道式)

Pipeline方法先在句子中抽取实体、而后再抽取关系。即实体识别，关系分类被视为两个独立的部分，互不干涉，但关系的识别依赖于实体识别的效果。

2.2.2.2. Joint(联合抽取式)

现有联合抽取模型总体上有两大类：

1、共享参数联合抽取模型

通过共享参数(共享输入特征或者内部隐层状态)实现联合，此种方法对子模型没有限制，但是由于使用独立的解码算法，导致实体模型和关系模型之间交互不强。

Miwa^[11]等人针对上游任务实体识别抽取出的实体对，对当前句子所对应的依存句法树上提取出能覆盖实体对的最小依存树，并基于TreeLSTM生成该子树相对应的表示向量。最终，基于子树根节点对应的TreeLSTM向量完成SoftMax关系分类。

Katiyar^[12] 等人采取指针网络解码，指针网络实际上有R层(R为关系总数)。对当前实体查询在其位置前的所有实体(向前查询)，并计算注意力得分。

2、联合解码抽取模型

为了增强实体模型和关系模型之间的交互性，由此提出了复杂的联合解码方案，但需要对子模型特征的丰富性以及联合解码的精确性之间做权衡：一方面如果设计精确的联合解码算法，往往需要对模型特征进行限制，例如用条件随机场建模，使用维特比解码算法可以得到全局最优解，但是往往需要限制特征的阶数。

另一方面如果使用近似解码算法，比如集束搜索，在特征方面可以抽取任意阶的特征，但是解码得到的结果是不精确的。因此，需要让算法可以在不影响子模型特征丰富性的条件下加强子模型之间的交互。

Zheng^[13]等人对实体和关系标注框架进行了统一，直接以关系标签进行实体的BIOES标注，但该方案未考虑关系重叠问题，比如一个实体存在多种关系的情况。 Dai^[14]等人针对一句话含有多种关系的场景，在含有n个token的句子中，准备n个不同标注框架。对于每个位置的token都进行一次可能的实体或关系类型标注，由此一个句子进行了n次重复编码，复杂度高。

2.2.2.3. 远监督学习

Distant Supervision提出主要基于假设：两个实体如果在知识库中存在某种关系，则包含该两个实体的非结构化句子均能表示出这种关系。常用的做法是通过将知识库与各非结构化文本对齐来自动构建大量训练数据，减少模型对人工标注数据的依赖，增强模型跨领域适应能力。但该假设过于肯定，导致引入大量噪声数据，且构造过程依赖于NER等工具，中间过程可能造成错误传播问题。

针对这些问题，目前主要有四类方法：

(1)将先验知识作为限制引入构造数据集的过程中。

(2)利用概率图模型对数据样例打分，将置信度较低的句子过滤。

(3)利用多示例学习进行包级别关系标注并融入句子级别的注意力机制对包内样例赋予权值。

(4)基于强化学习。

(5)基于预训练机制。

Zeng^[15]等人针对数据标注错误和传统统计模型特征抽取出现的错误提出解决方案。在数据标注错误问题上，作者采用多示例学习的方式从训练集中提取置信度高的训练样例训练模型。在模型改进方面，作者提出 piece-wise 的卷积神经网络(PCNN)。先通过 word2vec 的 Skip-gram 模型将词表示成向量形式，与位置特征向量(句子中词语与两个实体的相对位置)进行拼接作为输入，而后通过卷积层得到 feature map。在池化层中基于两个实体位置将 feature map 分为三段进行池化，其目的是为了更好的捕获两个实体间的结构化信息。最后，通过 softmax 层进行分类。

Lin^[16]等人在Zeng[15]的基础上，认为多示例学习虽然缓解了噪声数据过多的问题，但每次只采用包中置信度最高的样例作为该关系正例有可能损失其他句子重要信息。在模型上，作者提出基于 attention 机制的卷积神经网络模型，由原先选取置信度最高的样例改为对包中所有样例赋予句子级别权重，最终各个样例向量进行加权求和通过分类器得到关系分类结果。

Zhang^[17] 基于Lin^[8]的工作，对句子级别的注意力机制设计进行了改进，利用卷积神经网络捕获实体描述特征，用于提供更多的背景知识，最后通过计算实体间关系与句子间的相似度赋予句子不同的权重。

Feng^[18]基于强化学习的CNN+RL模型主要构成包括样例选择器和关系分类器。其中样例选择器负责从样例中获取高质量的句子，采取强化学习方式在考虑当前句子的选择状态下选择样例；接着经过关系分类器向样例选择器反馈来改进选择策略。该方法相较之前句子级别和Bag级别的关系分类模型取得更好效果。

Soares^[19]首次在预训练过程中引入关系分类目标，使用「BLANK」标识符来替换实体mention。该方法将样本中含有相同实体对的句子对视为正样本，反之为负样本。相较于传统的远程监督，该方法在训练中未引入关系标签，而是采用二元分类器对句子对之间进行相似度计算。结果显示在FewRel数据集上，在未进行tuning就已经超过了有监督的关系抽取结果。

4. Paper List

4.1. 论文列表

4.1.1. 监督类方法

4.1.1.1. 利用语法信息的方法

论文题目	抽取任务	关键词	论文链接	会议及年份	code
Attention Guided Graph Convolutional Networks for Relation Extraction	关系提取	注意力导向图卷积网络(AGGCN)；语义依赖树；软修剪；自动学习子结构；	https://www.aclweb.org/anthology/P19-1024.pdf	ACL2019
A Richer-but-Smarter Shortest Dependency Path with Attentive Augmentation for Relation Extraction	关系提取	最短依赖路径SDP；注意力模型；深度神经模型；LSTM网络；CNN	https://www.aclweb.org/anthology/N19-1298	NAACL 2019	https://github.com/catcd/RbSP

4.1.1.2. 不利用语法信息的方法

论文题目	抽取任务	关键词	论文链接	会议及年份
Joint Type Inference on Entities and Relations via Graph Convolutional Networks	抽取三元组的joint任务	实体关系联合推断；图卷积模型(GCN)；二元关系分类	https://pdfs.semanticscholar.org/7ce8/ce2768907421fb1a6cbfe13a8a36992721a7.pdf	ACL2019
GraphRel: Modeling Text as Relational Graphs for Joint Entity and Relation Extraction	抽取三元组的joint任务	端到端关系抽取；图卷积网络；	https://tsujuifu.github.io/pubs/acl19_graph-rel.pdf	ACL2019
Exploiting Entity BIO Tag Embeddings and Multi-task Learning for Relation Extraction with Imbalanced Data	关系抽取	BIO字符/词嵌入；多任务体系结构；关系分类	https://arxiv.org/pdf/1906.08931.pdf	ACL2019
Entity-Relation Extraction as Multi-turn Question Answering	关系抽取	多回合QA；上下文识别答案范围任务	https://arxiv.org/pdf/1905.05529.pdf	ACL2019
Graph Neural Networks with Generated Parameters for Relation	关系抽取	图神经网络(GNN)；多跳关系推理	https://arxiv.org/pdf/1902.00756.pdf	ACL2019
Kernelized Hashcode Representations for Biomedical Relation Extraction	关系分类	核化的局部敏感哈希(KLSH)；降低计算成本	https://arxiv.org/pdf/1711.04044.pdf	ACL2019
Connecting the Dots: Document-level Neural Relation Extraction with Edge-oriented Graphs	关系抽取	图神经网络模型；文档级关系提取	https://arxiv.org/pdf/1909.00228v1.pdf	EMNLP2019

4.1.2. 远监督方法

论文题目	抽取任务	关键词	论文链接	会议及年份	code
Hybrid Attention-based Prototypical Networks for Noisy Few-Shot Relation Classification	关系分类	远监督；噪声；混合注意力圆形网络	https://gaotianyu1350.github.io/assets/aaai2019_hatt_paper.pdf	AAAI2019	https://github.com/thunlp/HATT-Proto
A Hierarchical Framework for Relation Extraction with Reinforcement Learning	关系提取	增强关系类型系和实体交互；分层强化学习(HRL)框架；远监督数据集	https://arxiv.org/pdf/1811.03925.pdf	AAAI2019
Cross-relation Cross-bag Attention for Distantly-supervised Relation Extraction	关系提取	远监督抗噪；Cross-relation Cross-bag Selective Attention；多实例学习；句子级别；注意力机制；关注高质量实体对	https://arxiv.org/pdf/1812.10604.pdf	AAAI2019
Structured Minimally Supervised Learning for Neural Relation Extraction	关系提取	最小监督；学习的表示形式；结构化学习	https://arxiv.org/pdf/1904.00118.pdf	NAACL2019
Combining Distant and Direct Supervision for Neural Relation Extraction	关系提取	降噪；监督学习+远监督模型	https://arxiv.org/pdf/1810.12956.pdf	NAACL2019	https://github.com/allenai/comb_dist_direct_relex/
Distant Supervision Relation Extraction with Intra-Bag and Inter-Bag Attentions	关系提取	句子级别的Attention；	https://www.aclweb.org/anthology/N19-1288.pdf	NAACL2019
GAN Driven Semi-distant Supervision for Relation Extraction	关系提取	半远监督；生成对抗网络(GAN)	https://www.aclweb.org/anthology/N19-1307	NAACL 2019
Improving Distantly-Supervised Relation Extraction with Joint Label Embedding	关系提取	多层注意力模型；联合标签嵌入	https://www.aclweb.org/anthology/D19-1395.pdf	NAACL 2019
Self-Attention Enhanced CNNs and Collaborative Curriculum Learning for Distantly Supervised Relation Extraction	关系提取	协作式学习；卷积神经网(CNN)；卷积运算内部自注意机制	https://www.aclweb.org/anthology/D19-1037.pdf	NAACL 2019

5. 相关文献

收录文章

[1] Automatic Acquisition of Hyponyms From Large Text Corpora.
[2] Combining Lexical, Syntactic, and Semantic Features with Maximum Entropy Models for Information Extraction.
[3] Extracting Relations with Integrated Information Using Kernel Methods
[4] Exploring Various Knowledge in Relation Extraction
[5] A Systematic Exploration of the Feature Space for Relation Extraction
[6] Kernel Methods for Relation Extraction
[7] Dependency Tree Kernels for Relation Extraction
[8] A Shortest Path Dependency Kernel for Relation Extraction
[9] A Composite Kernel to Extract Relations between Entities with Both Flat and Structured Features
[10] Tree Kernel-Based Relation Extraction with Context-Sensitive Structured Parse Tree Information
[11] End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures. ACL 2016:1105–1116
[12] Katiyar, et al. Going out on a limb: Joint Extraction of Entity Mentions and Relations without Dependency Trees. ACL 2017: 917-928
[13] Zheng, et al. Joint extraction of entities and relations based on a novel tagging scheme. ACL 2017: 1227-1236
[14] Dai,et al. Joint Extraction of Entities and Overlapping Relations Using Position-Attentive Sequence Labeling. AAAI 2019: 6300-6308
[15] Zen, et al. Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks. EMNLP 2015: 1753-1762
[16] Lin ,et al. Neural Relation Extraction with Selective Attention over Instances. ACL 2016:2124–2133
[17] Distant Supervision for Relation Extraction with Sentence-level Attention and Entity Descriptions
[18] Feng ,et al. Reinforcement Learning for Relation Classification from Noisy Data. AAAI 2018: 5779-5786
[19] Soared ,et al. Matching the Blanks: Distributional Similarity for Relation Learning. ACL 2019: 2895-2905

你可能感兴趣的:(知识图谱,人工智能)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
架构评审的自动化与人工智能: 如何提高效率光剑书架上的书架构自动化人工智能运维
1.背景介绍架构评审是软件开发过程中的一个关键环节，它旨在确保软件架构的质量、可维护性和可扩展性。传统的架构评审通常是由人工进行，需要大量的时间和精力。随着大数据技术和人工智能的发展，自动化和人工智能技术已经开始应用于架构评审，从而提高评审的效率和准确性。在本文中，我们将讨论如何通过自动化和人工智能技术来提高架构评审的效率。我们将从以下几个方面进行讨论：背景介绍核心概念与联系核心算法原理和具体操作
解锁企业潜能，Vatee万腾平台引领智能新纪元自媒体经济说其他
在数字化转型的浪潮中，企业正站在一个前所未有的十字路口，面对着前所未有的机遇与挑战。解锁企业内在潜能，实现跨越式发展，已成为众多企业的共同追求。而Vatee万腾平台，作为智能科技的先锋，正以其强大的智能赋能能力，引领企业步入一个全新的智能纪元。Vatee万腾平台，是一个集成了人工智能、大数据、云计算等前沿技术的综合性智能服务平台。它不仅仅是一个技术工具，更是企业转型升级的加速器，能够深入企业运营的
LiteBee Wing测评：走进中小学课堂，合适的编程无人机非常重要！ song_bcbd
“国务院在《新一代人工智能发展规划》中明确，要广泛开展人工智能科普活动，实施全民智能教育项目，要在中小学阶段设置人工智能相关课程，逐步推广编程教育，鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广，而且要进行人工智能竞赛。”作为从事创客教育多年的老师，感谢在这个大环境，让学生能够了解人工智能，接触到前沿科技，同时也鼓励更多学生学习编程，因为没有学编程，可能就会像现在的我们后悔以前没有学习好
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring