程哥哥吖

知识图谱课程报告-关系抽取文献综述

关系抽取文献综述

引言：

随着大数据的不断发展，在海量的结构化数据或非结构化数据中更低成本的抽取出有价值的信息越来越重要，可以说信息抽取是自然语言处理领域的一项最基本任务，信息抽取进而可被分成三个子任务：实体抽取(entity extraction)、关系抽取(relation extraction)和事件抽取(event extraction)，而关系抽取搭建起知识图谱研究的基石。本文先介绍了关系抽取的定义和研究意义，而后指出了关系抽取目前存在的一些挑战，并介绍了关系抽取评测所使用到的几个主流测试数据集，之后将关系抽取从限定域和开放式两种抽取角度进行详细说明，将限定域关系抽取方法分类为四大类：关系分类、实体关系联合抽取、多关系抽取和远程监督关系抽取；将开放式关系抽取分为两类：传统方法和深度学习方法的关系抽取。再之后，根据每种抽取方法类别介绍了其几种经典的论文方法，文章最后对关系抽取领域作了简要的总结，并简要说明了关系抽取领域未来发展方向的看法。

关键字：知识图谱、关系抽取、机器学习、神经网络

1. 关系抽取的定义

通常我们将实体间的关系形式化的表达为一个三元组[1],其中E1和E2是指实体类型，R是指实体间的关系类型。关系抽取就是从海量非结构化或者半结构化数据中抽取出具有关联的结构化数据，并将其存储在知识库中，也可以理解为从海量数据中抽取出尽量多的三元组，将其结构化存储，关系抽取可大致上分为三部分：1. 命名实体识别 2. 关系类型识别 3. 实体间关系抽取，关系抽取系统框架如下图所示：

Fig.1 Relationship extraction system framework

图1 关系抽取系统框架

2. 关系抽取研究意义

关系抽取是信息抽取的基本任务，关系抽取从海量半结构化和非结构化数据中抽取出结构化的数据，这有利于数据的挖掘和探索，将抽取出来的结构化数据放入知识库存储，可以进一步研究和分析数据之间的关系，并充分开发数据智能。关系抽取是很多研究领域的基础研究之一，不但具有理论意义，还具有较好的应用前景，如知识图谱表示学习、知识推理、语言模型、问答系统和对话系统等[2]，可以说关系抽取的质量的好坏，一定程度上直接决定了该领域的后期建模预测的准确率，而且关系抽取在当今研究中仍然存在很多研究瓶颈，很多问题人需要解决，因此，关系抽取依旧是一项意义重大的研究领域。

3. 关系抽取分类

关系抽取从抽取的文本上分类大致可分为两类：非结构化文本的关系抽取和半结构化的文本关系抽取，因为结构化文本和半结构化文本的关系抽取已经相对成熟，本文主要讨论关于非结构化文本的关系抽取方法。对于非结构化文本的关系抽取方法，可主要分为两类：1. 限定域关系抽取 2. 开放域关系抽取。之前的大多研究主要都是针对限定域关系抽取的，对于限定域关系抽取的分类，主要可以分为以下几类：1. 关系分类 2. 实体关系联合抽取 3. 多关系抽取 4. 远程监督关系抽取；近些年来，随着深度学习的慢慢兴起，开放域关系抽取开始由传统抽取方法逐渐过渡到深度学习抽取方法去。整个关系抽取的大致分类图如下^[3]：

Fig 2. Relation extraction classification diagram

图2 关系抽取分类图

关系分类

给定一个句子以及句子中的两个实体，判断这两个实体之间是什么关系。因为关系集合已经预先定义好了，所以这个任务实质上是一个分类任务，因此叫做关系分类。
实体关系联合抽取

给定一个句子，需要识别句子中的实体以及实体之间的关系，实体和关系都一起识别出来。
多关系抽取

给定一个句子，需要识别句子中的实体以及实体之间的关系，句子中可能包含多个三元组时，它们之间可能会发生重叠，需要把所有的三元组都抽取出来，传统判别式模型，一个token只能输出一个标签。

远程监督关系抽取

利用知识库对文本自动进行回标得到远程监督数据集，无需人工参与，获取代价低，容易扩展到大规模的场景。

预定义关系抽取
	关系分类	实体关系联合抽取	多关系抽取	远程监督关系抽取
给定条件	句子、实体对	句子	句子	包、实体对
目标	实体间的关系	两个实体和实体间关系（三元组）	多个三元组	包的关系

表1 关系抽取类别对比

在语言种类上，中文的关系抽取难度要比英文的大一些，主要体现在中文的句子需要分词，且中文本身语言的复杂程度要比英语高，多一些歧义和噪声，不像英语的句子已经用空格分好了词。

4. 主要挑战

当前关系抽取的主要挑战^[4]主要有三点：1. 自然语言的多样性，同一个关系可以有多种不同的表述，如"国籍"关系，“姚明是中国人"和"姚明出生并生活在中国”、“姚明是中国籍运动员"这三句话对于"姚明"与"中国"之间的关系都是同一个表述，计算机算法却很容易把它辨别为三种关系；2. 自然语言的歧义性，相同的表述在不同的语境下可以表示不同的关系，如"乔布斯离开了苹果公司”，有可能有多重意思，有可能是被解雇了，也有可能是走出公司，下班回家了，人尚且会区分错，跟别说机器；3. 实体和关系类型的识别准确率仍旧有待提高，通过自然语言处理算法识别实体和关系类型虽然已经准确率挺高了，但仍然有进步空间，因为实体的识别准确率直接关系到关系抽取的准确率。

5. 数据集

5.1 ACE数据集

ACE数据集由ACE评测会议^[5]提出，是一个关系分类数据集，由宾夕法尼亚大学的语言数据组织标注，2008年之后，ACE评测并入了TAC评测。该数据集预先定义了位置、机构、成员、整体-部分、人-社会五大类关系，主要使用机器学习方法针对英语、阿拉伯语、西班牙语等语言完成关系抽取任务，并不适用于汉语，该数据集主要用于关系的检测和识别，多被用于分类任务。

5.2 TPC-KBP数据集

是美国国家标准技术研究所主办的文本分析会议（TAC）发布的一个任务[6]，主要研究从自然语言文本中抽取信息，并且链接到现有知识库的相关技术,可以视作是传统的关系抽取任务。该任务主要是抽取关于PER的25中属性和ORG的16中属性。主要是使用维基百科快照作为现有的知识库，从现有的新闻或者网络文本中获取关于实体的现有信息和更新信息，以构建知识库，此数据集关系种类较为丰富，数据量庞大。

5.3 SemEval数据集

SemEval 数据集完成基本任务是推特的情感分析^[7]。对于推特的文本情感分析基于SemEval 数据集始于2013年，之后任务和数据都在不断发展为更复杂。到2019年，该数据集的数据已经包括框架语义和语义解析、观点、情感和脏话检测、事实与虚构、信息抽取和问答、科学应用中的自然语言处理多个方面的数据。其中跟关系抽取相关的是SemEval-2010，SemEval2010年的信息抽取任务数据集应用最广泛信息抽取任务是当年的第八个任务，故称为SemEval-2010任务8，数据集包含了9种有序关系和一个"其它"关系，共10717个样本，训练集8000个样本，测试集2717个样本，涵盖了10余种关系类别，且每种关系都是有序关系,是个预定义关系类别数据集。

5.4 NYT数据集

NYT数据集也是一个关系分类数据集^[8]，其文本来源于纽约时报New York Times所标注的语料，用斯坦福命名实体识别工具识别句子中的实体提及，用Freebase三元组中的实体名称与实体提及进行字符串匹配，将三元组中两个实体同时出现的句子收集在一起构成包。其中，纽约时报语料中2005-2006年的语料回标为训练集，2007年的语料回标为测试集。

5.5 WebNLG数据集

WebNLG数据集出自在INLG 2018年论文^[9]，描述 WebNLG是自然语言生成(NLG)社区的宝贵资源和基准。但是,与其他NLG基准一样,它仅包含一组并行的原始表示形式及其对应的文本实现。该数据集为了自然语言生成任务而构建，使用了DBPedia中的三元组，包括六个类别（宇航员、建筑、纪念碑、大学、运动队、著作）。

5.6 关系抽取评价体系

为了评测关系抽取的好坏，业内一般使用准确率(Precision)、召回率(Recall)和F₁值来评价。其计算方法如下：

其中，在测试集和训练集两个数据集中，TP（True Positive）：正确的正例，一个实例是正类并且也被判定成正类；FN（False Negative）：错误的反例，漏报，本为正类但判定为假类；FP（False Positive）：错误的正例，误报，本为假类但判定为正类；TN（True Negative）：正确的反例，一个实例是假类并且也被判定成假类。

6. 经典方法

6.1 关系分类方法

给定一个句子以及句子中的两个实体，判断这两个实体之间是什么关系^[10]。因为关系集合已经预先定义好了，所以这个任务实质上是一个分类任务，因此叫做关系分类。采用统计机器学习的方法，将关系实例转换成高维空间中的特征向量，在标注语料库上训练生成分类模型，然后再识别实体间关系。有以下这几种典型方法：

基于特征向量的方法

主要任务：如何获取各种有效的词法、句法、语义等特征，并把它们有效地集成起来，从而产生描述实体语义关系的各种局部特征和简单的全局特征。

Kambhatla^[11]等人综合上下文信息，通过分析语法树、依存关系，结合词汇、句法和语义提出了一种最大熵模型来进行关系分类，该方法为了达到扩展关系表达得到规模和质量，利用到了上下文丰富的语言特征，为关系抽取奠定了基础；之后Zhao^[12]等人借鉴最大熵模型的关系抽取方法，将支持向量机模型代替最大熵模型，一定程度上提高了关系抽取的准确率，在上文所说的ACE数据集上进行评测，F₁值可达55.5%；Jiang等人^[13]为了进一步提高关系抽取的准确率，提出了一种考虑技术复杂程度以及不同维度的特征的特征子空间方法，，该方法结合了条件随机场，在ACE数据集上测评，F₁值可达54.0%。
基于核函数的方法

主要任务：如何有效挖掘反映语义关系的结构化信息及如何有效计算结构化信息之间的相似度。核函数k(x,y)用于计算x,y之间的相似度，x,y可以是字符串、句子、树等，比如说：x⁺表示一个句子具有某个关系，x^-表示一个句子不具有某个关系，需要判断句子y是否有该关系，如果k(x⁺,y)>k(x^-,y)，表示y具有该关系，如果k(x⁺,y)-,y)，表示y不具有该关系。

近年来，各种核函数被广泛的应用在关系抽取任务中。Zelenco等人^[14]在解析树结构中首次应用核函数，该方法使用支持向量机和核函数投票机制来对实体之间关系进行分类，从而达到关系抽取的目的；Culotta等人^[15]在Zelenco等人基础之上，引入外部知识库和依存核函数，使得关系抽取的准确率得到了进一步的提升；Zhang等人^[16]首次将多个单一核函数融合，利用多个核函数复合计算用于关系抽取任务，并实验得到了一个比较好的结果，实验的准确率、召回率、F₁分别是76.6%，67.0%，71.5%。
基于深度学习的方法

传统的方法需要的特征提取量大，如实体和关系类型的具体数量不确定，且人工抽取关系类型成本大且不准确，传统的关系抽取方法仍存在如下问题：1. 对于缺少NLP处理工具和资源的语言，无法提取文本特征2. NLP工具引入的"错误累积"3. 人工设计的特征不一定适合当前任务。

因为传统的关系抽取方法或多或少存在一些问题，随着近些年深度学习的热潮掀起，基于深度学习的关系抽取方法吸引了大量学者进行研究，基于深度学习的关系抽取方法主要任务：如何设计合理的网络结构，从而捕捉更多的信息，进而更准确地完成关系的分类。

Zeng等人^[17]利用数据的局部特征建模，提出了一种基于卷积神经网络的关系抽取方法，该方法利用卷积深度神经网络(DNN)提取词汇和句子级特征，该方法接受所有的单词标记作为输入，没有进行复杂的预处理。首先，通过查找word embeddings将单词标记转换为向量。然后，根据给定的名词提取词汇级特征。同时，使用卷积方法学习句子级别特征。将这两个层次特征串联起来，形成最终提取的特征向量。最后，将特征输入softmax分类器，预测两个有标记名词之间的关系。该方法用于关系分类的神经网络结构如图3所示，该方法用于提取句子级特征的框架如图4所示。

图3 关系分类的神经网络结构 图4 提取句子级特征的框架

该方法实验使用的数据集是SemEval-2010任务8，在8000个训练实体和2700个测试实体、19类关系类型的数据规模中，F₁值可达到82.7%，实验结果表明(图5)，该方法优于当时的最好方法SVM。

图5 CNN关系抽取实验结果

CNN的方法虽然一定程度上弥补了传统关系抽取方法的缺陷，但仍然存在一些缺点，如句子中的不同位置的词有不同程度的重要性，而CNN的方法难以建模句子中长距离的依赖关系，当遇到一些远距离文本语义的情况会变得不好解决。

Peng等人^[18]提出使用一种使用长短期记忆神经网络(LSTM)并融合注意力关注机制的关系抽取方法，该方法提出了基于注意的双向长短时记忆网络(AttBLSTM)来捕捉句子中最重要的语义信息，利用双向LSTM编码每个词的表示，该模型如图6所示：

图6 带注意力机制的双向LSTM模型

该方法实验使用的数据集也是SemEval-2010任务8，综合F₁值达到了84%，效果优良。

特征向量的方法、核函数的方法和深度学习方法对比

	基于特征向量方法	基于核函数方法	基于神经网络方法
优点	简单实用计算速度较快	能够有效挖掘结构化信息	人工干预小，可扩性好，适用于大规模数据环境
缺点	难以进一步挖掘有效的平面特征，性能很难进一步提高	句法分析的错误引入了噪声，同时由于树核的计算度非常慢，很难开发实用系统	可解释性差训练时间长

表2 关系抽取方法对比

6.2 实体关系联合抽取方法

给定一个句子，需要识别句子中的实体以及实体之间的关系。比如"乔布斯创立了苹果公司"这句话，要对这句话进行实体关系联合抽取，可得到创始人(乔布斯，苹果公司)类似的实体关系。

Zheng等人^[19]将实体关系联合抽取转化为一个序列标注问题，该方法首先提出了一种新的标记方案，将联合提取任务转化为标记问题，然后，在此标记方案的基础上，研究不同的端到端模型，直接提取实体及其关系，而不需要分别识别实体和关系。详细操作为：1. 对每个关系，将其与（Begin，Inside，End，Single）以及头实体和尾实体的序号（1，2）组合。 2. 额外考虑一个Other标签，表示不属于任何一个关系。3. 如果总共有|R|个关系，那么一共有2 ∗4 ∗|R| + 1个标签。 4. 根据标注结果得到三元组。此方法的标记方案示例如图7所示：

图7 实体关系标记方法示例

该标注方法还尝试了分别使用长短期记忆神经网络融合马尔科夫随机场方法(LSTM+CRF)、双向长短期记忆神经网络(LSTM+LSTM)和双向长短期记忆神经网络加偏置(LSTM+LSTM+bias)三种方法进行序列标注，已达到关系抽取的目的，这三种方法的综合网络模型如图8所示：

图8 Bi-LSTM方法网络模型

该方法使用使用弱监督的NYT数据集，看做监督数据。训练集包括353k个三元组，测试集包括3880个三元组，总共24种关系，在上文所说的三种抽取方法中，双向长短期记忆神经网络加偏置(LSTM+LSTM+bias)在大多数情况下是表现最好的，其实验结果如图所示：

图9 LSTM+CRF、LSTM+LSTM和LSTM+LSTM+bias实验对比

6.3 多关系抽取方法

传统的判别式模型，一个token只能输出一个标签，现在给定一个句子需要识别句子中的实体以及实体之间的关系，句子中可能包含多个三元组时，它们之间可能会发生重叠，需要把所有的三元组都抽取出来，比如说"姚明是一名中国籍的篮球运动员"这句话，需要抽取出两个三元组职业(姚明,运动员)和国籍(姚明,中国)。

这项工作有个比较困难的点是，当句子中包含多个三元组时，它们之间可能会发生重叠，为了弥补这个问题，Zeng等人^[20]提出了一种融合拷贝机制的端到端模型，根据三元组重叠程度将句子分为三类：普通型、实体对重叠型和单个实体重叠型。该模型可以从任意类的句子中联合提取关系事实，将自然语言句子编码成一个定长的语义向量视为编码过程，将该语义向量直接解码成各个三元组作为解码过程。在译码过程中，该方法采用了两种不同的策略:只使用一个联合译码器或使用多个分离译码器。其模型示意图如图10所示：

拷贝机制来源于对话生成^[21]，对话生成等序列到序列模型在生成句子时：词可以来源于词表，还可以来源于上文的句子。因此，不仅需要计算词表中每个词的置信度，还计算源句子中每个词的置信度。在多关系抽取任务中：不需要从词表中生成词，因此只需要计算源句子中每个词的置信度，选择置信度最高的词作为被拷贝的词。

图10 融合拷贝机制的端到端模型

该方法的实验评测使用的是远程监督数据集NYT数据集，但是把它看作有监督数据来用，同时也使用了有监督的WebNLG数据集来进一步验证实验效果，实验结果表明，该模型有一定的效果，且由于传统方法，其实验结果如图11所示：

图11 NYT数据集和WebNLG数据集实验对比

6.4 远程监督关系抽取方法

前面所提到的关系分类、实体关系联合抽取、多关系抽取方法都存在一些缺陷，如都依赖有监督数据、有监督数据标注费时费力等，所以基于远程监督的关系抽取方法吸引了大批学者进行研究。远程监督关系抽取方法利用知识库对文本自动进行回标得到远程监督数据集，无需人工参与，获取代价低，容易扩展到大规模的场景。但是远程监督关系抽取也存在很多问题，如无法确定关系的类型、无法获取训练语料等。

2009年，Mintz等人^[22]首次提出了使用知识库中的关系，启发式地标注训练语料的思想。通过包级别的标签预测：远程监督关系抽取需要给未知的包预测语义标签，最常用的数据集是通过Freebase回标纽约时报得到的NYT数据集，但是这又有一个难点：数据噪声问题如何解决？基于远程监督的关系分类有以下三种主要方法：1. 基于概率图的方法，Riedel、Hoffmann和Surdeanu等人[23,24,25]将句袋和句子的标签视为隐变量，将关系抽取视为对隐变量赋值的过程，在基于概率图的关系抽取领域做出了较好的成果。2. 基于矩阵补全的方法，Fan、Zhang等人^[26,27]认为远程监督关系抽取中的特征、标签都有噪声，因此观测矩阵是由一个低秩矩阵加上一个噪声矩阵所构成，一定程度解决了远程监督关系抽取模型噪声的影响。3. 基于深度学习的方法，分段卷积神经网、注意力机制、多实例学习、强化学习等^[28,29]深度学习方法都被使用到了关系抽取模型中。

在远程监督领域近，几年有突破性的研究成果有多实例学习方法^[30]，Zeng等人[30]提出了一个分段卷积神经网络(PCNNs)的多实例学习模型，为了解决启发式对齐可能会失败，导致错误的标签的问题，将远程监督关系抽取视为一个多实例问题，其中考虑了实例标签的不确定性；为了解决特征提取过程中产生的噪声会导致性能下降的缺陷，提出了一种采用卷积架构分段最大池来自动学习相关特征的方法，避免了做大量特征工程损失精度，此方法关系分类模型如图12所示：

图12 PCNNs关系分类模型

分段卷积神经网络(PCNN)方法使用了远程监督数据集NTY数据集进行测试，其实验结果如图13所示，由图可见，PCNNs模型的效果更优。

图13 PCNNs模型实验对比

7. 开放式关系抽取

传统的关系抽取是基于特定领域、特定关系类别的，这会让关系抽取成本较大且不利于知识库扩展，开放式关系抽取逐渐受到学者的青睐，开放式关系抽取无需预先定义关系类别，这让关系抽取的限定条件变得更宽松，也使得知识库更容易扩展，但也带来一个缺陷，语义没有归一化，没有同一套准则，使得不同知识库之间数据难以连通。

李航程等人[31]利用一种叫和声搜索算法(HS)的群体智能算法结合BP神经网络提出了一种新颖的关系规则抽取框架，该框架主要针对连续性数据集，从连续性数据集抽取出一种叫加权模糊产生式规则的知识表达，该知识表达不同于之前的实体三元组关系表达，主要由IF-THEN和一个权重组成，实验表明，该知识抽取框架可行，该框架如图14所示：

图14 HS+BP知识抽取框架

Sun等人^[32]在深度学习开放式信息抽取的基础上引入了拷贝机制，结合序列标注和序列模型，从源句子中拷贝句子片段作为抽取出的三元组，该方法使用序列到序列的范式(称为逻辑学)训练一个端到端神经模型，将句子转换为事实，同时此论文还以众包的方式提出一个数据集，叫SAOKE，该抽取模型与上文远程监督的深度学习方法类型，如图15所示，实验结果表明，该方法具有不错的性能。

图15 开放关系抽取模型

8. 总结

8.1 关系抽取总结

随着近年来学者的不断研究，关系抽取方法已经得到不断的改进，关系抽取性能也得到不断的提升，目前已被广泛的应用在知识图谱、问答系统、文本挖掘当中。总结出现关系抽取主流方法还是传统的机器学习方法和新兴的深度学习方法，传统的机器学习方法，如基于特征和核函数的方法，如有监督的支持向量机方法和核函数方法，半监督的卷积神经网络方法和无监督的聚类方法等，将关系抽取转化为序列标注的远程监督方法等，这些方法的模型性能都十分依赖人工标注特征数据的规模和准确率，如果能有一个自动抽取出数据特征的方法这个缺陷将会得到解决。深度学习方法具有自学习的特点，能够自动抽取特征，减少人工依赖，深度学习方法主要有有监督和远程监督两种方法，其中(CNN,RNN,LSTM,GCN)各种复杂网络拓扑及其变体都有应用。基于深度学习的方法大大的促进了关系抽取领域的发展，针对特定领域深度学习方法模型性能更好，但其解释性和移植性较差。同时，基于开放式的关系抽取也吸引了广大研究者，但开放式的关系抽取目前还没有完整的评判体系，仍需要完善。

8.2 未来展望

1. 目前来说，随着智能化的要求及普及越来越严格，实体间关系也要求越来越高，关系抽取方法会从单一的关系分类慢慢过渡到实体关系联合抽取和多关系抽取。

2. 基于远程监督的关系抽取方法将会得到更大的发展，传统的有监督学习方法获取训练数据代价太大，太依靠人工标注的规模及准确率，基于远程监督的关系抽取方法能够较好的综合大量需求和精确率之间的平衡。

3. 基于限定域关系抽取得到的关系太过单一，且抽取流程局限较多，很难得到较完美的数据，基于开放式的关系抽取方法将会逐渐兴起，并吸引大量的学者研究。

参考文献：

李冬梅,张扬,李东远,林丹琼.实体关系抽取方法研究综述[J].计算机研究与发展,2020,57(07):1424-1448.
Q. Wang, Z. Mao, B. Wang and L. Guo, “Knowledge Graph Embedding: A Survey of Approaches and Applications,” in IEEE Transactions on Knowledge and Data Engineering, vol. 29, no. 12, pp. 2724-2743, 1 Dec. 2017, doi: 10.1109/TKDE.2017.2754499.
赵军, 刘康, 何世柱,等. 《知识图谱》[J]. 中文信息学报, 2020, 34(9):1.
Jing X , Liang G , Zhou B , et al. An Unsupervised Method for Entity Mentions Extraction in Chinese Text[C]// Asia-pacific Services Computing Conference. Springer International Publishing, 2016.
Recasens M , Pradhan S . Evaluation Campaigns[M]. Springer Berlin Heidelberg, 2016.
Ji H , Nothman J , Hachey B . Overview of TAC-KBP2014 Entity Discovery and Linking Tasks.
Nakov, P., Rosenthal, S., Kiritchenko, S. et al. Developing a successful SemEval task in sentiment analysis of Twitter and other social media texts. Lang Resources & Evaluation 50, 35–65 (2016).
Riedel, Sebastian, Limin Yao, and Andrew McCallum. "Modeling relations and their mentions without labeled text."Joint European Conference on Machine Learning and Knowledge Discovery in Databases. Springer, Berlin, Heidelberg, 2010.
Zheng H , Wen R , Chen X , et al. PRGC: Potential Relation and Global Correspondence Based Joint Relational Triple Extraction[J]. 2021.
S.-Y. Xu, X. Huang, and K.-L. Cheong, “Recent Advances in Marine Algae Polysaccharides: Isolation, Structure, and Activities,” Marine Drugs, vol. 15, no. 12, p. 388, Dec. 2017, doi: 10.3390/md15120388.
Kambhatla, Nanda. Combining lexical, syntactic, and semantic features with maximum entropy models for extracting relations. 2004:22-es.
Zhou G , Su J , Zhang J , et al. Exploring Various Knowledge in Relation Extraction[C]// ACL 2005, 43rd Annual Meeting of the Association for Computational Linguistics, Proceedings of the Conference, 25-30 June 2005, University of Michigan, USA. 2005.
Jing J , Zhai C X . A Systematic Exploration of the Feature Space for Relation Extraction[C]// Human Language Technology Conference of the North American Chapter of the Association of Computational Linguistics, Proceedings, April 22-27, 2007, Rochester, New York, USA. DBLP, 2007.
Zelenko D , Aone C , Richardella A . Kernel Methods for Relation Extraction[J]. Journal of Machine Learning Research, 2003, 3(3):1083-1106.
F Reichartz, Korte H , Paass G . Dependency Tree Kernels for Relation Extraction from Natural Language Text[C]// European Conference on Machine Learning & Knowledge Discovery in Databases. Springer-Verlag, 2009.
Zhang X , Gao Z , Man Z . Kernel methods and its application in Relation Extraction. IEEE, 2011.
Zeng D , Liu K , Lai S , et al. Relation classification via convolutional deep neural network. 2014.
Peng Z , Wei S , Tian J , et al. Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification[C]// Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers). 2016.
Zheng S , F Wang, Bao H , et al. Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme[J]. 2017.
Zeng X , Zeng D , He S , et al. Extracting Relational Facts by an End-to-End Neural Model with Copy Mechanism[C]// Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2018.
Gu J , Lu Z , Li H , et al. Incorporating Copying Mechanism in Sequence-to-Sequence Learning[J]. 2016.
Mintz M , Bills S , Snow R , et al. Distant supervision for relation extraction without labeled data[C]// ACL 2009, Proceedings of the 47th Annual Meeting of the Association for Computational Linguistics and the 4th International Joint Conference on Natural Language Processing of the AFNLP, 2-7 August 2009, Singapore. Association for Computational Linguistics, 2009.
Riedel S, et al. Modeling Relations and Their Mentions without Labeled Text. ECML PKDD 2010
Hoffmann et al. Knowledge-Based Weak Supervision for Information Extraction of Overlapping Relations. ACL 2011
Surdeanu et al. Multi-instance Multi-label Learning for Relation Extraction. EMNLP 2012
Miao Fan et al. Distant Supervision for Relation Extraction with Matrix Completion. ACL 2014
Qing Zhang, Houfeng Wang. Noise-Clustered Distant Supervision for Relation Extraction: A Nonparametric Bayesian Perspective. EMNLP 2017
Jiang et al. Relation Extraction with Multi-instance Multi-label Convolutional Neural Networks. COLING 2016
Feng et al. Reinforcement Learning for Relation Classification from Noisy Data. AAAI 2018
Zeng D, Liu K, Chen Y, et al. Distant supervision for relation extraction via piecewise convolutional neural networks. EMNLP 2015
H. -C. Li, K. -Q. Zhou, L. -P. Mo, A. M. Zain and F. Qin, “Weighted Fuzzy Production Rule Extraction Using Modified Harmony Search Algorithm and BP Neural Network Framework,” in IEEE Access, vol. 8, pp. 186620-186637, 2020, doi: 10.1109/ACCESS.2020.3029966.
Sun M, et al. Logician: A unified end-to-end neural approach for open-domain information extraction. WSDM 2018

你可能感兴趣的:(知识图谱,知识图谱,人工智能,深度学习,机器学习,神经网络)

从规则到神经网络：机器翻译技术的演进与未来展望 Echo_Wish 前沿技术人工智能神经网络机器翻译人工智能
从规则到神经网络：机器翻译技术的演进与未来展望引言还记得早些年用翻译软件翻译一句简单的英文句子，却发现翻译结果让人啼笑皆非的日子吗？从“我喜欢吃苹果”被翻译成“我喜欢吃苹果电脑”，到今天的神经网络机器翻译（NeuralMachineTranslation,NMT）能够生成语义流畅、接近人类水平的翻译，我们见证了机器翻译技术的巨大飞跃。但机器翻译技术是如何一步步发展到今天的？未来又将走向何方？本文将
LangGraph系列-1：用LangGraph构建简单聊天机器人梦想画家机器学习 LangGraph LangChain
在快速发展的人工智能和大型语言模型（llm）世界中，开发人员不断寻求创建更灵活、更强大、更直观的人工智能代理的方法。虽然LangChain已经改变了这个领域的游戏规则，允许创建复杂的链和代理，但对代理运行时的更复杂控制的需求也在不断增长。LangGraph是建立在LangChain之上的重要模块，它将彻底改变我们设计和实施人工智能工作流的方式。在这篇博客中，我们提供了一个关于构建聊天机器人和彻底改
探索OpenAI Python SDK: 智能编程新里程周澄诗Flourishing
探索OpenAIPythonSDK:智能编程新里程openai-pythonTheofficialPythonlibraryfortheOpenAIAPI项目地址:https://gitcode.com/gh_mirrors/op/openai-python如果你对人工智能和自然语言处理有浓厚的兴趣，那么这个项目将为你开启新的探索之门——。这是一个由OpenAI开发的Python库，用于与他们的A
Upgini: 智能数据搜索与丰富化引擎 - 提升机器学习和人工智能模型准确性的利器 2401_87189860 人工智能机器学习
Upgini:智能数据搜索与丰富化引擎在当今数据驱动的世界中,机器学习和人工智能模型的准确性至关重要。然而,提高模型准确性往往是一项艰巨的任务,需要大量的特征工程和数据处理工作。幸运的是,Upgini这一创新的Python库为数据科学家和机器学习工程师提供了一个强大的解决方案。Upgini的核心功能Upgini是一个智能数据搜索和丰富化引擎,专为机器学习和AI设计。它的主要功能包括:自动特征发现与
CopilotForXcode: 为Xcode带来AI辅助编程的强大扩展 2401_87189860 xcode 人工智能 macos
CopilotForXcode:为Xcode带来AI辅助编程的强大扩展在人工智能快速发展的今天，AI辅助编程工具正在成为开发者提升效率的重要助手。对于使用Xcode进行iOS、macOS等Apple平台开发的Swift程序员来说，一款名为CopilotForXcode的扩展正在受到越来越多的关注。本文将详细介绍CopilotForXcode的主要功能、安装配置过程以及使用技巧，帮助开发者充分利用这
《机器学习实战》——在python中使用Matplotlib注解绘制树形图哆啦AA梦 python 机器学习 python 机器学习
#encoding=utf-8#使用文本注解绘制树形图importmatplotlib.pyplotaspltdecisionNode=dict(boxstyle="sawtooth",fc="0.8")leafNode=dict(boxstyle="round4",fc="0.8")arrow_args=dict(arrowstyle="<-")#上面三行代码定义文本框和箭头格式#定义决策树决策
DeepSeek：突破传统的AI算法与下载排行分析 smart_ljh 行业搜索人工智能 AI
DeepSeek的AI算法突破DeepSeek相较于OpenAI以及其它平台的性能对比DeepSeek的下载排行分析（截止2025/1/28AI人工智能相关DeepSeek甚至一度被推上了搜索）未来发展趋势总结在人工智能技术飞速发展的当下，搜索引擎市场也迎来了新的变革。DeepSeek，作为一款基于深度学习技术和大数据算法的搜索引擎，以其独特的优势在国内外市场上引起了广泛关注。下面介绍一下针对De
【外文原版书阅读】《机器学习前置知识》1.线性代数的重要性，初识向量以及向量加法 Icomi_ 807.《机器学习前置知识》机器学习人工智能计算机视觉深度学习神经网络 c++c语言
目录编辑编辑1.Chapter2WhyLinearAlgebra?2.Chapter3WhatIsaVector?个人主页：Icomi大家好，我是Icomi，本专栏是我阅读外文原版书《BeforeMachineLearning》对于文章中我认为能够增进线性代数与机器学习之间的理解的内容的一个输出，希望能够帮助到各位更加深刻的理解线性代数与机器学习。若各位对本系列内容感兴趣，可以给我点个关注跟进内容
Python 实现车牌识别菜狗小测试 Python技术专栏 python 计算机视觉 opencv
一、车牌识别的基本原理车牌识别主要包括以下几个步骤：图像采集：通过摄像头或其他图像采集设备获取包含车牌的图像。图像预处理：对采集到的图像进行灰度化、滤波、增强等操作，以提高图像的质量和清晰度，便于后续的处理。车牌定位：从预处理后的图像中找出车牌的位置。这可以通过一些特征提取和机器学习算法来实现，例如基于颜色特征、边缘特征等方法来定位车牌区域。字符分割：将定位到的车牌区域中的字符分割开，以便对每个字
数学与机器学习：共舞于智能时代的双璧每天五分钟玩转人工智能机器学习人工智能
随着人工智能的崛起，机器学习作为其核心技术之一，正引领着新一轮的科技革命。而在这场革命中，数学以其深邃的理论和精妙的工具，为机器学习提供了坚实的支撑。数学与机器学习之间的关系，如同琴瑟和鸣，共同编织出智能时代的华美乐章。数学，作为自然科学的皇后，以其严谨的逻辑和精确的推理，为机器学习提供了坚实的理论基础。机器学习算法的设计、优化和应用，都离不开数学的支持。无论是线性代数、概率统计，还是微积分、最优
【车牌识别】卷积神经网络CNN车牌识别【含 GUI Matlab源码 2638期】 Matlab仿真科研站 matlab
欢迎来到Matlab仿真科研站博客之家✅博主简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，Matlab项目合作可私信。个人主页：Matlab仿真科研站博客之家代码获取方式：扫描文章底部QQ二维码⛳️座右铭：行百里者，半于九十；路漫漫其修远兮，吾将上下而求索。⛄更多Matlab图像处理（仿真科研站版）仿真内容点击Matlab图像处理（仿真科研站版）⛄一、CNN车牌识别简介1车牌定位1.
深入解析ncnn::Net类——高效部署神经网络的核心组件又吹风_Bassy 人工智能深度学习 ncnn ncnn Net ncnn使用示例
最近在学习ncnn推理框架，下面整理了ncnn::Net的使用方法。在移动端和嵌入式设备上进行高效的神经网络推理，要求框架具备轻量化、高性能以及灵活的扩展能力。作为腾讯开源的高性能神经网络推理框架，ncnn在这些方面表现出色。而在ncnn的核心组件中，ncnn::Net类扮演了至关重要的角色。本文将详细介绍ncnn::Net类的结构、功能及其使用方法，帮助开发者更好地理解和利用这一强大的工具。目录
动物产生式识别系统（人工智能实验）不爱编程的程序媛人工智能数据结构算法
1.实验原理首先，定义两个整数数组`base`和`temp`，分别用于存储特征值和临时存储输入的特征值。输出特征值代表的信息，包括每个特征值对应的动物类型。提示输入特征值的总数，并使用`Scanner`类从控制台读取输入。使用循环遍历输入的特征值，将其存储在`temp`数组中，并在`base`数组中将对应特征值的位置设为1。根据输入的特征值，设置`base`数组中其他位置的值。例如，如果输入的特征
大模型应用：探索AI大模型的50个应用场景：让科技改变生活。 AGI大模型资料分享员人工智能科技生活 agi 语言模型自然语言处理
随着人工智能技术的迅猛发展，AI大模型在各个领域的应用日益广泛。百度创始人、董事长兼首席执行官李彦宏在2024年世界人工智能大会上表示，目前AI技术发展路线发生了方向性改变，已从过去辨别式人工智能转向了未来生成式人工智能。他更是呼吁：“大家不要卷模型，要卷应用！”本文将为大家盘点AI大模型的50个应用场景，并按应用频率从高到低进行排列，带您了解AI如何深刻改变我们的工作与生活。1.自然语言处理(N
从模型到实际：人工智能项目落地的关键要素 IT猫仔科技人工智能语言模型自然语言处理搜索引擎服务器机器学习
引言近年来，人工智能技术从实验室走向实际应用，其潜力在各行各业得到了初步的验证。然而，AI技术的落地并非一蹴而就，许多企业在尝试部署AI项目时，却发现自己陷入了“模型很好看，应用却难做”的困境。无论是数据准备不足、算法与场景的不匹配，还是缺乏持续优化的机制，这些问题都可能导致项目停滞，甚至功亏一篑。前排提示，文末有大模型AGI-CSDN独家资料包哦！对于企业来说，人工智能的价值不仅在于模型的高精度
大模型产品架构全景解读：从应用场景到技术支持的完整路径健忘的派大星架构人工智能语言模型 ai agi LLM AI大模型
前言随着人工智能技术的迅猛发展，大模型逐渐成为推动各行业智能化转型的核心动力之一。大模型不仅可以处理大量数据，进行复杂任务的自动化，还能通过微调、蒸馏等技术在特定场景中表现出色。本文将结合大模型产品架构图，详细解读每一个组成模块，帮助读者理解从应用场景到技术支持的完整路径，洞察大模型如何在实际业务中落地。一、落地场景：赋能业务的智能化解决方案大模型的实际价值首先体现在各个业务场景的落地应用中。在架
scikit-learn基本功能和示例代码 weixin_30777913 深度学习机器学习 python scikit-learn
scikit-learn（简称sklearn）是一个广泛使用的Python机器学习库，提供了丰富的工具和算法，涵盖了数据预处理、模型训练、评估和优化等多个方面。scikit-learn是一个功能强大的机器学习库，涵盖了数据预处理、分类、回归、聚类、降维、模型选择与评估等多个方面。通过上述代码示例，您可以快速上手并使用scikit-learn进行机器学习任务。以下是对scikit-learn主要功能
2000-2021年上市公司数字化转型数据（MD&A报告词频、文本统计） m0_71334485 数据 #上市公司上市公司数字化转型数字化转型上市公司
2000-2021年上市公司数字化转型数据（MD&A报告词频、文本统计）1、时间：2000-2021年2、来源：上市公司NB3、范围：上市公司4、指标：包括人工智能技术、大数据技术、云计算技术、区块链技术、数字技术运用和数字技术应用、互联网商业模式、智能制造、现代信息系统等9个维度175个词频类别、股票代码、股票简称、年报标题、年份、MD&A文本-文本总长度、MD&A文本仅中英文-文本总长度、人工
There was a problem confirming the ssl certificate: [SSL:CERTIFICATE_ VERIFY_ FAILED]certificate解决方案爱编程的喵喵 Python基础课程 python pip SSL certificate 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Therewasaproblemco
（新春特辑）腾讯开源MimicMotion整合包，最强图片生成跳舞视频的动作视频模型，动作丝滑没有破绽 struggle2025 人工智能计算机视觉机器学习 AI作画腾讯云AI代码助手
一、项目介绍：（文末提供下载）腾讯图片生成跳舞视频的项目MimicMotion，高质量人类动作视频生成与置信感姿势。亮点：丰富的细节，良好的时间平滑性，以及长视频长度。效果同时支持面部特征和唇形同步，不止可以搞跳舞视频，也可以做数字人。本文信息图片均来源于GitHub开源地址：https://github.com/Tencent/MimicMotion二、效果展示三、概述近年来，生成式人工智能在图
使用 Python 和 scikit-learn 实现 KNN 分类：以鸢尾花数据集为例弥树子 python scikit-learn 分类
在机器学习的世界里，K-NearestNeighbors（KNN）算法是一种简单而强大的分类方法。它基于一个直观的想法：相似的数据点往往属于同一类别。本文将通过Python的scikit-learn库实现KNN分类，以经典的鸢尾花数据集为例，展示从数据加载到模型评估的完整流程。1.KNN算法简介KNN是一种监督学习算法，主要用于分类和回归任务。它的工作原理非常简单：对于一个新的数据点，算法会查找训
DeepSeek--通向通用人工智能的深度探索者油泼辣子多加专业名词解释人工智能
一、词源与全称“DeepSeek"由"Deep”（深度）与"Seek"（探索）组合而成，中文译名为"深度求索"。其全称为"深度求索人工智能基础技术研究有限公司"，英文对应"DeepSeekArtificialIntelligenceResearchInstitute"。这一命名体现了企业对深度学习技术与未知领域持续探索的双重追求。二、发展历程初创期（2023）公司成立于中国杭州，创始团队汇聚了来自
git clone出现fatal: unable to access Failed to connect to github.com port 443: Timed out解决方案爱编程的喵喵 Python基础课程 git github timeout port 443 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了gitclone出现fatal:un
Gradio 快速构建机器学习web可视化界面心得算法小菜鸟成长心得 python
1.操作完成提示try:#对输入的字符串代码进行编译运行exec(get_test_code_example)gr.Info("Modeltestingcompletedsuccessfully.")except:raisegr.Error("Modeltestingfailed.")用到了gr.Info()和gr.Errot(）
linux git clone出现fatal: unable to access Failed to connect to github.com port 443: Timed out解决方案 herosunly C/C++/Linux解决方案 linux git github timeout port 443
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了linuxgitclone出现fatal:unabletoaccessF
LSTM的推导与实现 YZXnuaa NLP Python库
最近在看CS224d，这里主要介绍LSTM(LongShort-TermMemory)的推导过程以及用Python进行简单的实现。LSTM是一种时间递归神经网络，是RNN的一个变种，非常适合处理和预测时间序列中间隔和延迟非常长的事件。假设我们去试着预测‘IgrewupinFrance...（很长间隔）...IspeakfluentFrench’最后的单词，当前的信息建议下一个此可能是一种语言的名字
flask+layui学生信息管理系统元宇宙中的程序员 flask layui python
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。一、数据库建模1、创建数据模型classStudentORM(db.Model):stu_id=d
Python 3.9它来啦！！！ python程序员小'鹏 python 编程语言经验分享程序人生
Python3.9，来了！小编本身就是一名python开发工程师，我自己花了三天时间整理了一套python学习教程，从最基础的python脚本到web开发，爬虫，数据分析，数据可视化，机器学习，等，这些资料有想要的小伙伴"点击"即可领取过去一年，来自世界各地的开发者们一直在致力于Python3.8的改进。Python3.9beta版本已经存在了一段时间，第一个正式版本于2020年10月5日发布。每
AI智能制造软件有什么用处雪叶雨林行业资讯 AI 人工智能制造
随着信息技术与制造业的深度融合，人工智能（AI）逐渐成为提升制造效率和灵活性的重要工具。AI智能制造软件通过集成数据分析、机器学习和自动化流程，为企业提供了优化生产、降低成本和提高质量的新途径。生产过程优化实时监控与反馈AI智能制造软件能够实时收集生产线上的各类数据，如温度、压力、速度等参数，并通过机器学习算法进行分析处理。一旦检测到异常情况，系统会立即发出警报并提供改进建议，帮助企业快速响应问题
ModuleNotFoundError: No module named ‘pywin32_bootstrap‘解决方案爱编程的喵喵 Python基础课程 python ModuleNotFound win32_bootstap 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ModuleNotFoundErro
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/