hehesakura

关系抽取综述总结

文章目录

1.摘要
2.介绍
3.数据集
4.技术分类

**4.1监督方法**

**4.1.1 Feature based**
**4.1.2 Kernel based**
**4.1.3 Joint Extraction of Entities and Relations****
**4.1.4 Graphical Models based Approach**
**4.1.5 Structured Prediction**

**4.2 Semi-supervised Approaches**

**4.2.1 Bootstrapping Approaches**
**4.2.2 Active Learning**
**4.2.3 Label Propagation Method**
**4.2.4 Evaluation**

**4.3 Unsupervised Relation Extraction**

**4.3.1 Clustering based approaches**
**4.3.2 Other approaches**（属于无监督）

**4.4 Open Information Extraction**

5.论文简介
6.存在问题
7.Recent Advances in Relation Extraction
8.总结
**参考文献**

1.摘要

随着互联网的出现，每天都会以新闻文章，研究出版物，博客，问答论坛和社交媒体的形式生成大量的数字文本。重要的是开发从这些文档中自动提取信息的技术，因为许多重要信息都隐藏在其中。该提取的信息可用于改进对大文本语料库中隐藏的知识的访问和管理。诸如问答，信息检索等几个应用程序将受益于此信息。人们注意的信息主要有三类：命名实体、实体关系、事件。对应这三个需求，就诞生了对应的任务，分别是命名实体识别、关系抽取、事件抽取（子任务有事件监测、事件分类）。
在这篇文章中，主要介绍几种重要的监督，半监督和无监督的RE技术。

2.介绍

relation 是两个或更多个实体间的well-defined关系，关系有特别的意义。比如：PERSON、ORG的MEMBER-AFFILIATION relation，PRODUCT、 FEATURE的HAS relation，PERSON、 BOOK-TITLE的AUTHOR-OF relation等等。

针对二元关系，假说一个关系的NE mentions都在同一个句子里（不一定，可能垮句子）。同时一个句子里并非任意一对NE mentions都存在关系。

[John Smith]PERSON had visited [Bank of America]ORG in August 2003.
[Bill Gates]PERSON announced that [John Smith]PERSON will be [the chief scientist]P ERSON of [Microsoft Corporation]ORG.

关系抽取是信息抽取的一个重要的子任务，使用远程监督可以获得大量的数据集，从而可以使用远程监督进行深度学习。

无结构的信息可以用过机器或者程序进行表示，从其中抽取有用的结构信息即信息抽取。抽取到的信息可以应用到检索、QA。

来源：基于知识库，eg Freebase、DBpedia，它们包含了大量有用信息，但不完整，可以使用信息抽取进行扩展。

子任务：NER、RE、EE等
Global level Vs Mention level

  global level：给某种语义关系生成一系列的实体对。通常输入是大量文本语料，输出是一系列的实体对。

  Mention level：输入是一对实体对、以及包含这对实体对的句子，输出是这对实体对是否包含某种关系。

3.数据集

ACE 2005 dataset ：（Automatic Content Extraction）有关新闻、邮件；7大类，599篇文档。其中6类有足够实例（平均每类有700个实例）。包括实体检测和关系检测两个任务。

局部整体关系(PART-WHOLE)，地理位置关系(PHYS)，类属关系(GEN-AFF)，转喻关系(METONYMY)，制造使用关系(ART)，组织结构从属关系(ORG-AFF)，人物关系(PER-SOC)

SemEval-2010 Task 8 dataset： 10,717 samples （8,000 for training， 2,717 for testing）。9类关系且有向，则一共有19类(2 × 9 + 1 for Other class)。

NYT：训练语料包括从1987至2007年间纽约时报（New York Times）大概294k篇新闻中抽取的1.18M个句子。此外有395个句子由人工标注用作测试数据。通过 Stanford NER 工具并结合 Freebase知识库进行标注的。53类关系（包括NA），训练集：522,611句子、281,270 entity pairs、18,252 relational facts. 测试集： 172,448 sentences、 96,678 entity pairs 、1,950 relational facts.

TACRED
The Few-Shot Relation Classification Dataset (FewRel)：

4.技术分类

4.1监督方法

4.1.1 Feature based

特征分类：Word based features、Base phrase chunking based features、Features based on semantic resources

Zhou et al. 特征+SVM，发现依存树、parse tree的作用较小；phrase based chunking features作用显著，原因主要是ACE的数据大多是短距离关系、特征也较为简单，多为word，所以chunking特征就足以了。
Jiang 、 Zhai 对RE的特征空间进行了系统研究，并评估了不同特征子空间的有效性。他们定义了特征空间的unified graphic representation unified graphic representation ，并使用3个特征子空间进行了实验，这些子空间对应于序列，句法分析树（syntactic parse trees）和依赖解析树（dependency parse trees）。实验结果表明，每个子空间本身都是有效的，句法分析树子空间是最有效的。此外，组合三个子空间并没有产生太大的改进。他们观察到，在每个特征子空间内，仅使用基本单元特征已经可以提供相当好的性能，并且添加更复杂的特征可能不会大大提高性能。
Nguyen et al. 引入了一些新的特征，用SVM进行关系分类。为每个关系类型半自动的得出一些关键词。引入了core tree表示relation instance，它包括两个实体间的最短依赖路径，还将最短路径上的节点与关键词进行关联，这颗子树就阔以用来挖掘特征。
Chan 、 Roth 观察ACE数据集，根据数据集的特征进行一些规则和模式匹配。

在监督方法中，数据集存在class imbalance的问题，负样本（no relation）的数量远多于正样本（含有某种预定义中的关系），这就导致分类器倾向于分类为None，则容易出现高Precision低Recall。Kambhatla 提出了based on voting among a committee of classifiers，提高了Recall。

基于特征的方法，只要特征设计好了，分类器就能使用任何一种ML的方法。前提则是特征设计恰当，这需要对各个特征的贡献、潜在语言知识进行仔细分析。

4.1.2 Kernel based

核方法避免了显示的自行设计特征，使用核函数来计算两个relation instances的相似性，用SVM进行分类。表示relation instances的方法有sequences、syntactic parse trees等。大多数技术通过关系实例共有的sub-representions进行相似度计算。

Sequence Kernel

关系实例表示为序列，kernel计算共有子序列的相似度。Bunescu and Mooney 提出序列核。构建序列的最简单方式：将句子中从第一个mention到第二个mention之间的词序列表示为一个实体序列。作者提出将每个词泛化为一个特征向量。每一个关系实例表示为一个特征向量的序列，每一个词用一个特征向量表示。特征有：所有词、POS tags、generalized POS tags、entity types。

Top leaders of Italy’s left-wing government were in Venice.

Syntactic Tree Kernel

将句子的结构属性编码为constituent parse tree，描述了句子成分的句法，比如noun phrases (NP), verb phrases (VP), prepositional phrases (PP), POS tags
(NN, VB, IN, etc.) as non-terminals and actual words 。句法通常根据Context Free Grammar (CFG)描述。
- Collins et al. 、 Miller et al. ：提出用统计parsing模型从文本中抽取关系。
- Collins、 Duffy ：提出 Convolution Parse Tree Kernel (KT ) 计算两个句法树的相似性。计算公共子树（子树要多于一个节点，productions要包含每一个亟待呢）的数目。kernel嫁给你每一个可能的子树映射为一个维度。
Dependency Tree Kernel

依赖树可以表示句子中单词间的关系，单词表示为树的节点，单词间的依赖关系表示为树的边。除了root之外，每个节点都只有一个父节点。边的方向表示单词间的从属性。如下图是一颗依赖树：
- Culotta and Sorensen 提出用kernel计算两颗依赖树的相似性。
- Relation Instance Representation：考虑包含两个实体对的句子的最小子树。每一个节点包含多种特征，比如POS tag、generalized POS tag，chunk tag等。如下图：
  
  Dependency Graph Path Kernel
Bunescu and Mooney 提出dependency path based kernel。两个实体间的关系，能由其依赖树图的之间的最短路径进行捕捉。kernel用来捕捉最短以来路径的相似度。

For the relation instance , the shortest path is :
leaders→were←in←Venice.

完全词汇化的路径会导致数据稀疏，所以词就用词的类进行表示 with varying degrees of generality。用词的POS、generalized POS、实体类型进行表示。

4.1.3 Joint Extraction of Entities and Relations**

Roth and Yih [28]：Integer Linear Programming based Approach

独立学习两个实体识别、关系抽取的局部分类器。During inference, given a sentence, a global decision is produced such that the domain-specific or task-specific constraints are satisfied.实验结果显示，提高了实体分类的质量。
Roth and Yih探索了其他全局推理技术
Chan and Roth 纳入背景知识，例如关系类型的层次结构，共同参考信息等

4.1.4 Graphical Models based Approach

Roth and Yih：graphical models approach for jointly identifying entities and relations。先独立学习两个局部分类器，实体和关系之间的依赖通过bayesian belief network实现。效果优于独立关系分类器。

4.1.5 Structured Prediction

Li and Ji 提出了增量联合框架，早期的方法建立了独立的局部分类器，用于识别实体和关系。即使稍后采取了最佳的全局决策，在训练期间也禁止实体提取和RE模块之间的交互。因此，作者提出将此问题重新表述为结构化预测问题。

联合提取实体和关系的大多数方法报告了对pipeline方法的重大改进。联合提取不仅提高了关系提取的性能，而且证明对实体提取有效。因为，与pipeline方法不同，联合模型便于使用关系信息进行实体提取。很难比较联合建模的各种方法，因为没有单一的标准数据集。其中一些方法（如[107,28,59]）仅通过联合推理实现联合建模，因为实体和关系的局部分类器是独立训练的。最近的一些方法（如[68,112]）执行实际的联合学习，其中学习单个模型来提取实体和关系。随着时间的推移，对这一系列研究有一些但始终如一的贡献，并且未来仍有更复杂的联合模型的范围。

4.2 Semi-supervised Approaches

4.2.1 Bootstrapping Approaches

Brin：DIPRE算法：先给定一些已知关系类型的实体对（seed instances），在web中找到出现了这些实体对的occurrences，再学习occurrences的pattern，根据学到的pattern在web中找更多的符合pattern的数据，并加入到seed中，迭代这个过程。
Agichtein and Gravano ：SnowBall系统：在pattern匹配步骤，加入了命名实体标签，有利于提高匹配性能。同时丢弃不够精确的pattern（因为很可能是误报）
Vyas et al. and Kozareva and Hovy [65]提供了在自举算法中选择的种子质量的分析

4.2.2 Active Learning

允许学习算法询问某些选定的未标记实例的真实标签。已经提出了各种标准来选择这些实例，其共同目标是在极少数情况下快速学习基础假设。优势在于，通过极少数标记实例可以实现与监督方法相当的性能。

4.2.3 Label Propagation Method

基于图的半监督方法，每一个instance用一个节点表示，边表示节点的相似度。任何节点的标签信息通过加权边缘迭代地传播到附近节点，最后在传播过程收敛时推断出未示例的标签。Chen et al. [20]将数据集中的每个实体对表示为图中的节点，并且还将特征向量与其相关联。特征向量包含表征关系实例的各种特征。这种方法效果比SVM、boosting效果还好。

4.2.4 Evaluation

半监督方法大多也是聚焦mention-level，也可以像监督方法一样，评估计算precision，recall。对于bootstrapping方法，是给某一个关系产生一系列的实体对，可以计算precision，但不好计算recall。只有测试集很小的时候，可以手动标注，从而可以计算recall。

4.3 Unsupervised Relation Extraction

4.3.1 Clustering based approaches

最早的聚类方法：Hasegawa et al.：NER；找到一起出现（如果两个词之间最多之隔N intermediate words）的实体对（考虑顺序）、记录其上下文（实体对和N intermediate words，出现在第一个实体左边，和第二个右侧的都不考虑在上下文中，这是个limitation）；这其中上下文相似的参与计算；计算他们的相似度（词向量、TF-IDF），然后聚类；每一个类就代表一个关系，自动分类一个标签（用高频词）。

Chen et al. ：对上一篇进行改进，用特征选择方法去除无信息的噪音词。
Yan et al.：不是将实体对作为一个单位，而是考虑wikipedia结构的concept pair（文章title，链接其他文章的词）。步骤：用 deep linguistic patterns（依赖树）形成concept pair，再用相似度聚类。文章质量高，找到的pattern就比Hasegawa et al. [48]使用的表面的词的准确度要高，第二步就聚焦于剩余的没聚类的concept pair。
Lin and Pantel ： DIRT (Discovery of Inference Rules) algorithm ：用分布相似假说寻找相似依赖路径，能倾向于找到same set of words.
Poon and Domingos：迭代聚类依存树片段，将表示一样信息的但语法表示不一样的进行聚类。USP (Unsupervised Semantic Parsing)
Yao et al. ：使用生成概率模型，类似于LDA这样的主题模型。实体示例包括entity mention types和基于依赖路径的不同特征。同时加入了关系类型约束、domain knowledge。

4.3.2 Other approaches（属于无监督）

Rosenfeld and Feldman：URES (Unsupervised RE System)，一种非聚类的无监督方法。输入：定义关系类型的interest（关系关键词、论元的实体类型）。（比如关系Acquisition，关键词可能有 acquired, acquisition）。
Romano et al.：unsupervised paraphrase acquisition。通过一个text expression表示target relation，找到paraphrases。

initial expression X interact with Y, paraphrase acquisition algorithm would produce new expressions - X bind to Y, X activate Y,X stimulate Y, interaction between X and Y, etc.

4.4 Open Information Extraction

传统的RE聚焦于准确的，预先特定的关系集。还需要人工设计抽取规则，或者人工打标签。因此，要迁移到不同的domain就很麻烦。Open IE从语料中自动发现可能的relations of interest 。迁移就不需要额外的efforts。

Banko et al.：最早的OpenIE系统 TextRunner system，使用CRF、自监督序列分类器。
Fader et al. ：提出ReVerb，是上一个的提升。包含语法、词法约束。

5.论文简介

2009-ACL-AFNLP–Distant supervision for relation extraction without labeled data （Mintz et al.）

Motivation:关系抽取任务大多是监督学习（比如ACE数据集，1000个文档，5-7个大类，23-24个子类，总共16771个关系实例），但是很多有label的数据很少。知识库中有很多无label的语料。

远程监督

if a relation exists between an entity pair in the KB, then every document containing the mention of the entity pair would express that relation.

说法1:假设出现在知识库中句子的每一对实体对，这个句子就包含了这对实体对的关系，就用包含这些实体对的句子的特征训练一个关系分类器（比如逻辑回归）。

说法2:两个实体间有关系，任何包含了这两个实体的句子都可能包含这种关系。

优点：由知识库监督，不容易过拟合，也不存在domain-dependence

对于一对实体，可能有很多个句子包含它们，该论文将多个包含着对实体的不同的句子进行特征的aggregate，在这些句子中，这对实体都是用同一个特征向量，以此训练分类器。如果一个句子出现了两个实体，这两个实体是freebase关系中的实例，则从这句话抽取特征，作为这个关系的特征向量。

特征：词法特征、句法特征、命名实体标签

evaluation：10000个实例，102中关系，P 67.6%

使用freebase（有116million实例，包含7300个关系，9million 实体）

可能存在的问题：任何一个句子也可能给出错误的线索（比如？），所以训练了一个multiclass的逻辑回归分类器，为每一个噪音特征学习权重。

缺点：这个假说过于绝对，即使出现了同一个实体对，但在不同的句子中，两个实体的关系也可能会不一样。

 (Bill Gates, Founder of, Microsoft) 

Bill Gates turn to philanthropy was linked to the antitrust problems Microsoft had in the U.S. and the European union.

改进：Riedel et al. (2010) ，

Simple CNN model (Liu et al., 2013)

最早的使用CNN自动学习特征进行端到端的编码、学习。

输入：词向量、词法特征、POS、实体类型

结构：特征输入 --> 一层CNN --> 一层NN --> softmax–>关系类别的概率分布

对同义词使用同一个向量，所以不是一个词一个 vector，randomly assigned to each synonym class

ACE 2005 dataset 比当时的state of the art提升了9点（F1）

CNN model with max-pooling (Zeng et al., 2014)

输入：（无标签的大语料）预训练的词向量、POS、词法特征、名词的wordNet上义词

结构：特征输入 --> 一层CNN --> max pooling --> softmax–>关系类别的概率分布

优点：CNN的特征映射的大小与输入句子的长度独立、能捕捉句子中最有用的一些特征。

结果：比使用了词法特征的基于SVM、MaxEnt的模型效果更好。Ablation study显示POS最多能提升F值 9点。

CNN with multi-sized window kernels(Nguyen and Grishman, 2015)

输入：词向量（初始为预训练的词嵌入，word2vec）、POS

结构：特征输入 --> 一层CNN --> max pooling --> softmax–>关系类别的概率分布

不同点：探索了filter的大小

相关论文：Relation Extraction:Perspective from Convolutional Neural Networks
输入：[词嵌入，当前词和第一个实体头的距离，当前词和第二个实体头的距离] x 每句的词数x 句子数

实验：

关系抽取：ACE 2005 ，P 71.25 ，R 53.91 ，F 61.32
关系分类：SemEval-2010 Task 8 ，F 82.8

Multi-instance learning models with distant supervision (Riedel et al. ,2010)

模型：MIMIL

假说：if a relation exists between an entity pair, then at least one document in the bag for the entity pair must reflect that relation.

a label is given to a bag of instances, rather than a single instance.
每一个实体对，定义一个bag，每个bag包括所有包含这个实体对的句子。给这个bag打label。

Piecewise Convolutional Neural Networks (Zeng et al., 2015)

Multi-instance learning

模型：PCNN

motivation：在Max-pooling阶段，隐藏层的大小被大幅度的减小，这不利于捕捉句子中实体间的关系，因此提出了分段pooling的方法。每个句子，根据实体对的位置，分成三段，分别对这三段进行pooling。
缺点：Loss，在训练和预测时只考虑了每一个bag中能让label概率分布最大的那个句子，即bag中其他大量有用的句子都被忽略了。尽管不是所有的句子都能表示正确的关系，但是只使用一个句子是一个很大限制。
结果：PCNNs+MIL > PCNNs > CNNs+MIL >CNNs

Selective Attention over Instances (Lin et al., 2016)

针对PCNN的问题，使用attention机制，给每个bag里的每个句子计算一个权重，每个bag的特征向量由所有可能的关系的加权求和表示，能自己找到哪个句子对分类最重要。

Multi-instance Multi-label CNNs (Jiang et al., 2016)

模型：MIMLCNN

针对PCNN的问题，using a cross-document max-pooling layer。

给bag里的每个句子进行一个向量表示，最后bag的特征表示由这些句子max pooling得到。

最终，每一个特征由最具代表性的文档表示，而非总的特征全部由所有文档中最有代表性的文档表示。

针对RE的overlapping relations问题，改用sigmoid激活函数，不用softmax，这样就独立的给每一个关系计算预测出一个概率，而不是在所有的关系上计算一个概率分布。

模型对比

Non DL models:Mintz (Mintz et al., 2009), MultiR (Hoffmann et al., 2011)， MIML (Surdeanu et al., 2012).

可以看出attention机制更robust，也能更有效的挖掘句子间的信息，比MIMLCNN中的cross-document max mechanism效果更好。

6.存在问题

语料少
multi-label
overlapping relations：不同实体对，在不同句子有可能有不同关系
(Steve Jobs, Founded, Apple) ，(Steve Jobs, CEO of, Apple)

7.Recent Advances in Relation Extraction

Universal Schemas：Riedel et al.提出了一种通用架构，是已知结构的数据库的关系类型的集合，以及用于Open IE的surface form的所有关系类型。在通用关系类型中学习asymmetric implicature。给定结构数据库中的已知的关系类型，通过asymmetric implicature推导出新的关系类型。比如：CapitalOf推导LocatedIn，但反之不能。类似的还有Chang et al. ， Fan et al. 。

n-ary Relation Extraction：一个关系中实体多于两个实体的称为 Complex \Higher Order \ n-ary relations，比如EMP-ORG-DES，表示 relation between a person, the organization where he/she is employed and his/her designation.（John Smith is the CEO of ABC Corp.）

McDonald et al. ：先解决2元关系，输入表示为图的2元关系（节点是实体，边代表关系），找到图的最大团，最大团中的实体代表某种n-ary关系。
Gildea and Jurafsky ：看作是Semantic Roles Labelling (SRL)，给定句子预测predicate and its arguments。

Cross-sentence Relation Extraction: 前面讨论的都是intra-sentential RE，一个关系的实体都在同一个句子中。

Swampillai and Stevenson ：可句内、可跨句。采用结构特征（比如parse tree）、实体共指co-reference。

Cross-lingual Annotation Projection：有标注的语料很少，只有像英语、中文等资源丰富的语言才有。Kim et al.提出了使用平行语料，映射从资源丰富的语言到资源poor的语言的relation annotations。

Domain Adaptation: 现有的监督方法都是基于训练集、测试集是同样的分布。但如果有一个misbatch，那RE 性能就会下降，实际应用表现为，一个监督系统要对一个out-of-domain的数据进行RE。这就需要domain adaptation技术。

8.总结

随着DL的流行，RE领域也开始使用有监督的DL方法，但是该领域存在语料过少的问题，针对这个问题Mintz et al.(2009)提出了远程监督的思想，想利用现有的包含大量实体对和关系信息的知识库，自动生成语料，从而解决语料不足的问题。紧接着，针对远程监督中的强假说造成的语料噪音，后续又有一系列的工作对其进行改进，比如放宽假说范围、使用selective attention机制、cross-document max pooling等方式都提升了性能。

还有的一些工作，通过探索relation path(Zeng et al., 2016) 、relation class ties(Ye et al., 2016) 从而探索关系间的交互。比如可以通过Father_of、Mother_of 可以挖掘出Spouse_of。

上文涉及了“关系提取”的定义、用法、任务描述，包括globe level、mention level的区别。

该任务的相关技术有监督（基于特征、基于内核等），该类方法的演变过程、评估方法。同时，可以发现在所有有监督方法中，基于句法树的内核技术是最有效的。当与其他内核组合成复合内核，或者使用dynamically determined tree span的效果最好。

同时抽取entity mention和关系的联合建模技术，很有意义。好的实体抽取有利于RE获得好的性能。联合建模能让这两个任务间的信息双向流动，性能上会比单独的建模更好。

然后介绍了半监督、无监督方法，减少了对有标签数据的依赖。在依次介绍了Open IE、远程监督。

几个有潜力的方向：

实体、关系的联合抽取
n-ary relations抽取
大多数RE任务都是针对英文、中文、阿拉伯语，因为ACE数据集只发了这三种语言。关于语言独立性、针对不同语言的NLP处理工具等都值得研究。
在RE任务中用到的NLP处理大多是词法、语法信息，较少使用语义程度的信息。使用semantics、 discourse level的信息会有助于提升。

参考文献

Kumar S . A Survey of Deep Learning Methods for Relation Extraction[J]. 2017.
Daojian Zeng, Kang Liu, Yubo Chen, and Jun Zhao.2015. Distant supervision for relation extraction via piecewise convolutional neural networks. In EMNLP. pages 1753–1762.
Daojian Zeng, Kang Liu, Siwei Lai, Guangyou Zhou, Jun Zhao, et al. 2014. Relation classification via convolutional deep neural network. In COLING. pages 2335–2344.
Wenyuan Zeng, Yankai Lin, Zhiyuan Liu, and Maosong Sun. 2016. Incorporating relation paths in neural relation extraction. arXiv:1609.07479 .
Duyu Tang, Bing Qin, and Ting Liu. 2015. Document modeling with gated recurrent neural network for sentiment classification. In EMNLP. pages 1422– 1432.
Mihai Surdeanu, Julie Tibshirani, Ramesh Nallapati, and Christopher D Manning. 2012. Multi-instance multi-label learning for relation extraction. In Pro- ceedings of the 2012 joint conference on empirical methods in natural language processing and com- putational natural language learning. ACL, pages 455–465.
Sebastian Riedel, Limin Yao, and Andrew McCallum. 2010. Modeling relations and their mentions with- out labeled text. In Joint European Conference on Machine Learning and Knowledge Discovery in Databases. Springer, pages 148–163.
Thien Huu Nguyen and Ralph Grishman. 2015. Rela- tion extraction: Perspective from convolutional neu- ral networks. In Proceedings of NAACL-HLT. pages 39–48.
Mike Mintz, Steven Bills, Rion Snow, and Dan Juraf- sky. 2009. Distant supervision for relation extrac- tion without labeled data. In Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP: Vol- ume 2-Volume 2. ACL, pages 1003–1011.

你可能感兴趣的:(关系抽取)

SciER：首个大规模科学文档中的实体和关系抽取数据集数据集
2024-10-28，为科学文档中的实体和关系抽取领域带来了突破，提供了一个包含106篇完整科学出版物、超过24,000个实体和12,000个关系的大规模数据集，这对于构建科学知识图谱和促进科学信息抽取技术的发展具有重要意义。数据集地址：SciER|科学信息提取数据集|人工智能数据集一、研究背景：在科学文档中，实体（如数据集、方法、任务）和它们之间的关系对于理解科学发现和推动研究进展至关重要。然而
什么是预训练？卡卡大怪兽自然语言处理
一、介绍预训练模型诞生背景:对于某种特殊任务只存在少量的相关训练数据，以至于模型不能从中学习到有用的规律（标注资源稀缺，无大数据支持）举例：想对一批法律领域的文件进行关系抽取，就需要投入大量的精力（意味着时间和金钱的大量投入）在法律领域的文件中进行关系抽取的标注，然后将标注好的数据“喂”给模型进行训练。但是即使是标注了几百万条这样的数据（实际情况中，在一个领域内标注几百万条几乎不可能，因为成本非常
Python中LLM的知识图谱构建：动态更新与推理二进制独立开发 GenAI与Python 非纯粹GenAI python 知识图谱开发语言自然语言处理人工智能分布式机器学习
文章目录引言1.知识图谱的基本概念1.1知识图谱的定义1.2知识图谱的构建流程2.利用LLM进行知识抽取2.1实体识别2.2关系抽取2.3属性抽取3.知识融合3.1实体对齐3.2冲突消解4.知识存储5.知识推理5.1规则推理5.2基于LLM的推理6.动态更新6.1增量更新6.2实时更新7.结论引言随着人工智能技术的飞速发展，知识图谱（KnowledgeGraph,KG）作为一种结构化的知识表示方法
基于 HanLP 的句子结构分析与关系抽取梦落青云知识图谱 java HanLP
一、引言自然语言处理（NLP）是人工智能领域的重要分支，旨在让计算机理解和处理人类语言。句子结构分析和关系抽取是NLP中的关键任务，它们可以帮助我们理解句子的语法结构和语义关系。HanLP是一款功能强大的中文自然语言处理工具包，提供了丰富的功能，包括分词、词性标注、依存句法分析等。本文将介绍如何使用HanLP进行句子结构分析与关系抽取。二、HanLP简介HanLP是由汉语言技术实验室开发的开源中文
python 命名实体识别_Python NLTK学习11（命名实体识别和关系抽取） weixin_39630762 python 命名实体识别
PythonNLTK学习11(命名实体识别和关系抽取)发表于:2017年7月27日阅读:18262除特别注明外，本站所有文章均为小杰Code原创本系列博客为学习《用Python进行自然语言处理》一书的学习笔记。命名实体识别命名实体识别(NER)系统的目标是识别所有文字提及的命名实体。可以分解成两个子任务：确定NE的边界和确定其类型。命名实体识别非常适用于基于分类器类型的方法来处理的任务。NLTK有
NLP学习——信息抽取 P-ShineBeam NLP基础学习
信息抽取自动从半结构或无结构的文本中抽取出结构化信息的任务。常见的信息抽取任务有三类：实体抽取、关系抽取、事件抽取。1、实体抽取从一段文本中抽取出文本内容并识别为预定义的类别。实体抽取任务中的复杂问题：重复嵌套，原文中多个实体之间共享片段不连续，一个实体由多个不连续片段组成2、关系抽取从文本中抽取一对实体和预定义的关系类型。传统的关系抽取任务实现方案是先进行实体抽取，再输入头尾实体与原文进行关系分
【无标题】 Komorebi_9999 知识图谱问答系统自然语言处理
要构建一个基于知识图谱的问答系统，你需要进行以下工作：知识图谱构建：数据采集：从各种来源（如公开数据库、API、网页等）收集与你的领域相关的数据。数据清洗和预处理：清洗数据，去除重复、错误或不相关的信息，对数据进行归一化、标准化处理。实体识别和关系抽取：从数据中识别出实体（如人、地点、概念等）和它们之间的关系。构建图谱：将实体和关系组织成图谱结构，通常使用图数据库来存储。自然语言处理（NLP）：分
windows下GitHub中.sh文件下载的问题解决方案 Anpedestrian NLP
一些github中的项目为了加快开发者的下载速度，一般不会将项目的数据集与项目绑定到一起，一般都是以.sh后缀的文件格式与项目绑定。比如实体关系抽取项目中的数据集下载问题：对于.sh格式的文件安装需要sh命令，而sh指令是git系统下的操作指令。Git是分布式版本控制系统，那么它就没有中央服务器的，每个人的电脑就是一个完整的版本库，这样，工作的时候就不需要联网了，因为版本都是在自己的电脑上。A.首
低资源学习与知识图谱：构建与应用 cooldream2009 AI技术知识图谱知识图谱人工智能低资源
目录前言1低资源学习方法1.1数据增强1.2特征增强1.3模型增强2低资源知识图谱构建与推理2.1元关系学习2.2对抗学习2.3零样本关系抽取2.4零样本学习与迁移学习2.5零样本学习与辅助信息3基于知识图谱的低资源学习应用3.1零样本图像分类3.2知识增强的零样本学习3.3语义与知识信息的利用结语前言在当今人工智能领域，低资源学习成为一个备受关注的话题，尤其是在少样本学习和零样本学习方面。这种学
【医学知识图谱自动补全关系抽取】生成模型 + 医学知识图谱 = 发现三元组隐藏的关系实体对 Debroon 医学大模型：个性化精准安全可控知识图谱人工智能
生成模型+医学知识图谱=发现三元组新关系实体对提出背景问题：如何自动发现并生成医疗领域中未被标注的实体关系三元组？CRVAE模型提出背景论文：https://dl.acm.org/doi/pdf/10.1145/3219819.3220010以条件关系变分自编码器（CRVAE）模型为基础，解决关系医疗实体对发现问题，并生成新的、有意义的医疗实体对。尽管有些疾病与症状之间的关系已经被广泛记录，但仍然
NER zelda2333
基操：超详细保姆级讲解&提供代码：基于深度学习的命名实体识别与关系抽取值得一看的命名实体识别的总结：中文命名实体识别总结师兄给的教程：GithubChineseNER针对教程讲解的文章：用深度学习做命名实体识别(附代码)
CRF条件随机场学习记录 V丶Chao 深度学习安全研究 -威胁情报学习
阅读建议仔细阅读书[1]对应的序列标注章节，理解该方法面向的问题以及相关背景，然后理解基础的概念。引言威胁情报挖掘的相关论文中，均涉及到两部分任务：命名实体识别（NamedEntityRecognition，NER）和关系抽取，大多数网安实现NER的方法，采用比较多的方法包含：BiLstm+CRF或者Bert+CRF。其中条件随机场（conditionalrandomfields,CRF），这个模
学习笔记CB003:分块、标记、关系抽取、文法特征结构利炳根
分块，根据句子的词和词性，按照规则组织合分块，分块代表实体。常见实体，组织、人员、地点、日期、时间。名词短语分块(NP-chunking)，通过词性标记、规则识别，通过机器学习方法识别。介词短语(PP)、动词短语(VP)、句子(S)。分块标记，IOB标记，I(inside，内部)、O(outside，外部)、B(begin，开始)。树结构存储分块。多级分块，多重分块方法。级联分块。关系抽取，找出实
Deepdive关系抽取：特征源码分析及优化加快信息提取 weixin_42001089 人工智能机器学习 DDLIB NLP deepdive
前言本篇不是Deepdive入门教程，而是对其一些源码细节进行了解读，换句话说要深入到内部去看看其具体是怎么做的，所以看本篇的前提是假设读者已经大概清楚了deepdive的使用流程，如果不是很熟悉，或是第一次使用建议先去看一下入门教程。本篇先是分析特征方面的源码，接着是实践部分，即使用ltp替换默认的斯坦福NLP信息抽取部分进而可优化该部分到数秒内，最后简单说一下其模型方面的问题以及其它补充其实关
实体关系抽取与属性补全的技术浅析 cooldream2009 NLP知识 AI技术知识图谱实体关系抽取关系抽取
目录前言1.实体关系抽取2实体关系抽取的方法2.1基于模板的方法2.2基于监督学习的关系抽取2.3基于深度学习的关系抽取2.4基于预训练语言模型的关系抽取3属性补全3.1属性补全任务简介3.1抽取式属性补全3.2生成式属性补全4未来发展趋势结语前言在信息爆炸时代，文本数据蕴含着丰富的知识，但要将这些知识整理成结构化的形式，关系抽取和属性补全成为至关重要的任务。本文将深入探讨实体关系抽取的任务定义、
面向中国企业关系抽取的双向门控递归单元神经网络精分天秤座的mystery 自然语言处理神经网络知识图谱人工智能
面向中国企业关系抽取的双向门控递归单元神经网络论文原文：论文原文摘要：为了帮助金融从业人员有效识别高风险企业、法人或股东，国内外学者构建了风险预警的企业知识图谱。从财经新闻等非结构化数据中提取企业关系是构建企业知识图的重要手段，但其数据结构的不规则性和处理工具的匮乏给关系提取带来了挑战。针对这一问题，本文提出了SDP-BGRU模型，从非结构化数据中提取企业关系，将企业关系提取视为一个分类问题。该模
知识图谱技术综述：构建智能信息网络的关键元素 cooldream2009 知识图谱 AI技术知识图谱人工智能
目录前言1知识图谱表示：有向标记图1.1节点表示1.2边的表示1.3知识图谱的动态性2知识图谱存储与查询：图数据存储2.1关系图存储技术2.2图查询语言2.3数据存储的优化3知识抽取：从多结构数据中抽取知识3.1概念抽取3.2实体识别3.3关系抽取3.4事件抽取4知识融合：多源数据的统一命名空间4.1实体对齐4.2本体映射4.3概念匹配5知识推理：基于符号和图结构的推理5.1基于符号的推理5.2基
知识抽取-事件抽取 Jarkata
此文为转载，原文链接：知识抽取-事件抽取-徐阿衡的文章-知乎https://zhuanlan.zhihu.com/p/50903358接上一篇知识抽取-实体及关系抽取。事件是促使事情状态和关系改变的条件[Donget.al.,2010]。目前已存在的知识资源（如维基百科等）所描述实体及实体间的关系大多是静态的，而事件能描述粒度更大的、动态的、结构化的知识，是现有知识资源的重要补充。与[关系抽取]相
用通俗易懂的方式讲解：实体关系抽取入门教程深度学习算法与自然语言处理机器学习自然语言处理人工智能深度学习
信息抽取主要包括３项子任务：实体抽取、关系抽取和事件抽取，而关系抽取是信息抽取领域的核心任务和重要环节。实体关系抽取的主要目标是从自然语言文本中识别并判定实体对之间存在的特定关系。本文为《实体关系抽取方法研究综述》论文的阅读笔记。文章目录技术提升关系抽取定义关系抽取评价指标实体关系抽取方法基于规则的关系抽取方法基于词典驱动的关系抽取方法基于机器学习的抽取方法基于深度学习的关系抽取方法流水线学习联合
IT行业都有哪些职位，初学者该如何选择活字印刷
互联网行业的薪资水准相对较高，刚入行一个月，半年，或者一年超过其他行业薪资很正常。那么，互联网行业究竟有哪些职位呢，又分别适合哪些传统行业转型？1.产品2.UI3.CSS4.JS5.后端（Java/php/python）6.DBA(mysql/oracle)7.运维（OP）8.测试（QA）9.算法（分类/聚类/关系抽取/实体识别）10.搜索（Lucene/Solr/elasticSearch）11
国科大-自然语言处理复习 Kilig* 自然语言处理人工智能
自然语言处理复习实体关系联合抽取流水线式端到端方法检索式问答系统流水线方式信息检索（IR）阶段阅读理解（RC）阶段基于证据强度的重排基于证据覆盖的重排结合不同类型的聚合端到端方式Retriever-Reader的联合学习基于预训练的Retriever-Free方法情感分析联合三元组抽取谨以此博客作为复习期间的记录实体关系联合抽取流水线式流水线式抽取（Pipline）:把关系抽取的任务分为两个步骤，
图机器学习年度汇集道亦无名人工智能机器学习人工智能
一、深度学习模型优化在图机器学习领域，深度学习模型的优化尤为重要。今年的主要进展包括了利用先进的优化算法提高模型精度、减少训练时间以及对大规模图数据的适应性。部分团队还推出了定制化的深度学习模型，特别适用于复杂的图形结构和交互。二、知识图谱技术升级随着知识图谱在多个领域的广泛应用，技术层面也在迅速进化。今年，知识图谱的语义理解、实体链接、关系抽取等技术取得了显著突破。此外，多模态知识图谱的发展，使
人工智能论文解读精选 | PRGC：一种新的联合关系抽取模型 NLP论文解读
©NLP论文解读原创•作者|小欣论文标题：PRGC:PotentialRelationandGlobalCorrespondenceBasedJointRelationalTripleExtraction论文链接：https://arxiv.org/pdf/2106.09895.pdf代码：https://github.com/hy-struggle/PRGC前言1.论文的相关背景关系抽取是信息抽
论文浅尝 | 基于神经网络的实体识别和关系抽取联合学习开放知识图谱
本文转载自公众号：PaperWeekly。作者丨罗凌学校丨大连理工大学博士生研究方向丨深度学习，文本分类，实体识别联合学习（Jointlearning）一词并不是一个最近才出现的术语，在自然语言处理领域，很早就有研究者使用基于传统机器学习的联合模型（Jointmodel）来对一些有些密切联系的自然语言处理任务进行联合学习。例如实体识别和实体标准化联合学习，分词和词性标注联合学习等等。最近，研究者们
论文浅尝 | 通过对比学习优化用于命名实体识别的双编码器开放知识图谱学习深度学习机器学习自然语言处理人工智能
笔记整理：陆星宇，东南大学硕士，研究方向为自然语言处理链接：https://arxiv.org/abs/2208.14565动机命名实体识别（NER）是识别与命名实体相关的文本片段并将其分类到预定义的实体类型（如人物、位置等）的任务。作为信息提取系统中的基本组件，NER已被证明对各种下游任务如关系抽取、指代消解和细粒度观点挖掘有益。以往的工作主要将NER作为序列标记或跨度分类来处理，存在许多局限性
一篇关于大模型在信息抽取（实体识别、关系抽取、事件抽取）的研究进展综述 AI知识图谱大本营 chatgpat 知识图谱 gpt
信息提取（IE）旨在从普通自然语言文本中提取结构化知识（如实体、关系和事件）。最近，生成式大型语言模型（LLMs）展现了在文本理解和生成方面的卓越能力，使得它们能够广泛应用于各种领域和任务。因此，已经有许多研究致力于利用LLMs的能力，为信息提取任务提供可行的解决方案。为了全面系统地回顾和探索LLMs在信息提取任务中的应用，本研究对这一领域的最新进展进行了调查。首先，我们进行了广泛的概述，将这些研
不用再找了，这就是 NLP 方向最全面试题库深度学习算法与自然语言处理大模型实战大模型 NLP与大模型自然语言处理人工智能深度学习机器学习 python
大家好，本篇文章总结了自然语言处理(NLP)面试需要准备的学习笔记与资料，该资料目前包含自然语言处理各领域的面试题积累。热门面试题（校招、社招）、公司级专项真题、大厂常考题等，在我们社群具有总结，喜欢记得收藏、关注、点赞。文章目录技术交流群四、NLP学习算法常见面试篇4.1信息抽取常见面试篇4.1.1命名实体识别常见面试篇4.1.2关系抽取常见面试篇4.1.3事件抽取常见面试篇4.2NLP预训练算
大型语言模型在实体关系提取中的应用探索(二) colorknight 人工智能自然语言处理 LLM 知识图谱实体关系抽取 ChatGPT Llama2
上一篇文章我们探讨了如何使用大语言模型进行实体关系的抽取。本篇文章我们将进一步探索这个话题。比较一下国内外几款知名大模型在相同的实体关系提取任务下的表现。由于精力有限，我们无法全面测试各模型的实体关系抽取能力，因此，看到的效果以及分析的结论，也仅限于在该任务下的探讨，不能作为各大模型在该方面能力的结论。这次我们选中用于实验的大模型如下：国外：ChatGPT3.5(OpenAI)、Bard(Goog
文档级关系抽取中一个指标 Ign F1的计算方法 wanncy
相信很多做document-level关系抽取的朋友在实验部分都会遇到一个叫IgnF1的参数，这个参数大致是image.png具体参考文章DocRED:ALarge-ScaleDocument-LevelRelationExtractionDataset,Yao,2019ACLReasoningwithLatentStructureRefinementforDocument-LevelRelati
24 LLM错误代码补全：机器学习顶会NeurIPS‘23 智能体评估：自行构建数据集Buggy-HumanEval、Buggy-FixEval+错误代码补全+修复模型【网安AIGC专题11.22】是Yu欸科研笔记与实践机器学习 AIGC 人工智能论文阅读 AI编程 copilot 笔记
LargeLanguageModelsofCodeFailatCompletingCodewithPotentialBugs写在最前面论文名片对于命名实体识别、关系抽取任务的启发课堂讨论实验自己构建的数据集价值1、论文介绍相关工作：代码补全存在的问题研究的重点论文结论与改进2、Buggy-CodeCompletion代码补全任务的基本概念有错误的代码补全的挑战方案设计的其他考虑3.评估方法评估方法
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S