Gmeas_HuiMing

[ ACL 2019 ] DocRED: A Large-Scale Document-Level Relation Extraction Dataset

ACL 2019 | DocRED: A Large-Scale Document-Level Relation Extraction Dataset

论文：https://arxiv.org/abs/1906.06127
代码：https://github.com/thunlp/DocRED
Leaderboard：https://competitions.codalab.org/competitions/20717

DocRED数据集是由清华大学整理的文档级关系抽取数据集，近几年的文档级关系抽取的最新工作基本都是将此数据集作为主要的实验对象。

摘要

文档中的多个实体通常表现出复杂的句间关系，现有的关系提取 (RE) 方法通常侧重于提取单个实体对的句内关系，因此无法很好地处理这些问题。为了加速对文档级 RE 的研究，我们引入了 DocRED，这是一个由 Wikipedia 和 Wikidata 构建的新数据集，具有三个特点：（1）DocRED 同时标注了命名实体和关系，是最大的纯文本文档级关系抽取人工标注数据集； (2) DocRED需要阅读文档中的多个句子，通过综合文档的所有信息来提取实体并推断它们之间的关系； (3) 除了人工标注的数据，我们还提供大规模的远程监督数据，这使得 DocRED 可以用于监督和弱监督场景。为了验证文档级 RE 的挑战，我们实施了最近最先进的 RE 方法，并在 DocRED 上对这些方法进行了全面评估。实证结果表明，DocRED 对现有的 RE 方法具有挑战性，这表明文档级 RE 仍然是一个悬而未决的问题，需要进一步努力。基于对实验的详细分析，我们讨论了未来研究的多个有前景的方向。

为了加速文档级关系抽取的研究，本文提出了一个新的文档级关系抽取数据集——DocRED，这个数据集有三大特点，并且通过实验验证了DocRED 对现有的关系抽取方法具有挑战性，文档级关系抽取值得进一步去研究。

一、简介

每个文档中的样例中，标注有命名实体识别（named entity mentions）、共指信息（coreferance information）、句内和句间关系（intra- and inter-sentence relations）、支持证据（supporting evidence）。在文档中大量关系事实==（什么是关系事实？）==是通过多个句子来表达的。

句子1-(Stockholm, the capotal of, Sweden) + 句子4-(Riddarhuset, locate in, Stockholm) $\to$ (Riddarhuset, country, Sweden).该过程需要阅读和推理文档中的多个句子，根据本文从维基百科文档中抽取的人工注释语料库统计，至少有 40.7% 的关系事实只能从多个句子中提取出来，这是不可忽略的。因此，有必要将 RE 从句子级别推进到文档级别。

现有的一些文档级关系抽取数据集：

非人工标注：Quirk and Poon (2017) and Peng et al. (2017)是远程监督生成的数据集，没有人工标注，噪声大。

特定领域：BC5CDR（Li et al，2016）是一个人工注释的文档级RE数据集，由1500个PubMed文档组成，这些文档在生物医学的特定领域仅考虑“化学诱导的疾病”关系，使其不适合开发通用的文档级RE的目的方法。

特定方法：Levy等人（2017）通过使用阅读理解方法回答问题从文档中提取关系事实，其中问题从实体关联对转换。由于这个工作中提出的数据集是针对特定方法量身定制的，因此它也不适用于文档级RE的其他潜在方法

存在各种问题，所以提出了DocRED

即现有的文档级 RE 数据集要么只有少量手动注释的关系和实体，要么显示来自远程监督的嘈杂注释，要么服务于特定领域或方法。为了加速文档级RE的研究，我们迫切需要一个大规模的、人工标注的、通用的文档级RE数据集。

DocRED是由维基百科和维基数据构建而成的大规模人工标注的通用文档级关系抽取数据集，有以下特点：

DocRED 在 5, 053 个维基百科文档上包含注释的 132, 375 个实体和 56, 354 个关系事实，使其成为最大的人工注释文档级 RE 数据集。
由于DocRED中至少有40.7%的关系事实只能从多个句子中提取，DocRED需要阅读文档中的多个句子，通过综合文档的所有信息来识别实体并推断它们之间的关系。这将 DocRED 与那些句子级别的 RE 数据集区分开来。
我们还提供大规模的远程监督数据来支持弱监督的RE研究。

为了评估 DocRED 的挑战，本文实施了最近最先进的 RE 方法，并在各种设置下对 DocRED 进行了彻底的实验。实验结果表明，现有方法在 DocRED 上的性能显着下降，表明文档级 RE 该任务比句子级 RE 更具挑战性，仍然是一个悬而未决的问题。此外，对结果的详细分析还揭示了多个值得追求的有前途的方向。

二、数据收集

数据集构建的最终目标：包含命名实体识别、实体共指、所有实体对的关系和关系实例的支持证据的人工标注数据和大规模远程监督数据的数据集。

2.1 人工标注数据收集

（1）为维基百科文档生成远程监督标注。
（2）标注文档中提及的所有命名实体和共指信息。
（3）将命名实体提及链接到维基数据项。
（4）标签关系及相应的支持证据。

根据ACE 注释过程其中（2）、（4）步都需要对数据进行三次迭代：(1) 使用命名实体识别 (NER) 模型生成命名实体，或使用远程监督和 RE 模型生成关系推荐。 (2) 人工更正和补充建议。 (3) 审查并进一步修改第二遍的注释结果，以提高准确性和一致性。为了确保注释者得到良好的训练，采用了有原则的训练程序，并且要求注释者在注释数据集之前通过测试任务。并且只有经过精心挑选的有经验的标注者才有资格进行第三遍标注。

使用维基百科文档多种的介绍部分作为语料库（corpus），因为它们通常是高质量的并且包含大部分关键信息。

而维基数据是与维基百科紧密集成的大规模知识库，语料库的文本和知识库之间是强对齐的。

We use the 2018-5-24 dump of English Wikipedia and 2018-3-20 dump of Wikidata.

Stage 1: Distantly Supervised Annotation Generation

为维基百科文档生成弱监督标注

使用 spaCy 实现NER；
将这些提及的命名实体链接到维基数据的数据项，合并其中具有KB id的命名实体提及；
查询Wikidata标记文档中每个合并的命名实体对之间的关系。

长度小于128字的文档被丢弃。为了鼓励推理，我们进一步丢弃包含少于4个实体或少于4个关系实例的文档

输入：维基百科文档、维基数据数据项

输出：107,050个具有远程监督标签的文档，其中我们随机选择5053个文档和最常见的96个关系进行人工注释。

Stage 2: Named Entity and Coreference Annotation

人工注释人员首先审查、更正和补充stage 1中生成的命名实体提及建议，然后合并那些引用相同实体的不同提及，这提供了额外的共指信息。

生成的中间语料库包含各种命名实体类型，包括不属于上述类型的人员、位置、组织、时间、数量和其他实体的名称。

输入：stage 1中的命名实体提及建议

输出：修正后的实体提及和共指信息

Stage 3: Entity Linking

将每个提到的命名实体链接到多个Wikidata项，以便为下一阶段提供远程监督的关系建议。
特别地，数字和时间是语义匹配的。

输入：命名实体和维基数据项

输出：关系建议

Stage 4: Relation and Supporting Evidence Collection.

关系和支持证据的注释基于阶段2，并面临两个主要挑战。第一个挑战来自文档中大量的潜在实体对。一方面，考虑到文档中潜在实体对的数量是实体数量的二次元数(平均19.5个实体)，穷竭地标记每个实体对之间的关系会导致繁重的工作量。另一方面，文档中的大多数实体对不包含关系。第二个挑战在于我们的数据集中存在大量细粒度关系类型。因此，注释者从头开始标记关系是不可行的。通过为人工注释人员提供来自RE模型的建议，以及基于实体链接的远程监督(阶段3)来解决这个问题。 $\to$ 为了缓解标注压力，说明提供给人工注释人员哪些关系建议

平均而言，我们建议每个文档从实体链接获得19.9个关系实例，从RE模型获得7.8个关系实例作为补充。我们要求注释人员检查建议，删除不正确的关系实例并补充遗漏的实例。我们还要求注释者进一步选择所有支持保留关系实例的句子作为支持证据。保留的关系必须体现在文件中，而不依赖于外部世界的知识。最后，从实体链接中保留57.2%的关系实例，从正则模型中保留48.2%的关系实例。

输入：关系建议

输出：关系实例、支持证据

2.2 远程监督数据收集

从106926个文档中删除了5053个人工注释文档，并使用剩下的1010873个文档作为远程监督数据的语料库。

为了确保远程监督数据和人类注释的数据共享相同的实体分布，使用BERT的双向编码器表示重新识别命名实体，该表示对第2.1节中收集的人类注释数据进行了微调，并达到了90.5%的F1分数。（命名实体识别）
我们通过基于启发式的方法将提到的每个命名实体链接到一个Wikidata项，该方法联合考虑目标Wikidata项的出现频率及其与当前文档的相关性。（实体链接）
然后我们用相同的KB id合并命名实体。（共指消解）
最后，通过远程监督标记每个合并实体对之间的关系。（关系建议）

三、数据分析

将分析DocRED的各个方面，以便更深入地理解数据集和文档级RE的任务。

3.1 数据规模

代表性关系抽取数据集：

SemEval-2010 Task 8：SemEval数据集来自于2010年的国际语义评测大会中Task 8：“Multi-Way Classification of Semantic Relations Between Pairs of Nominals ”，常用作全监督的关系抽取任务。下载地址、关系抽取数据集介绍。
ACE 2003-2004：MUC会议停开后，ACE将关系抽取任务作为一个子任务从2002至2007年共持续六年。关系抽取任务也被定义的更加规范和系统。其中，获得认可的一届关系抽取任务主要是ACE-2004，其数据来源于语言数据联盟（LDC），分成广播新闻和新闻专线两部分，总共包括451和文档和5702个关系实例。ACE20014提供了丰富的标注信息，从而为信息抽取中的实体识别、指代消解和关系抽取等子任务提供基准的训练和测试语料库。关系抽取常用的数据集和工具。
TACRED：TACRED 是一个大型关系提取数据集，包含 106,264 个示例，这些示例基于新闻专线和网络文本，来自每年TAC 知识库人口 (TAC KBP) 挑战中使用的语料库。TACRED 中的示例涵盖了 TAC KBP 挑战中使用的 41 种关系类型（例如，per:schools_attended和org:members ），或者如果没有定义关系，则标记为*no_relation 。*这些示例是通过结合来自 TAC KBP 挑战和众包的可用人工注释创建的。【数据集分析】TACRED关系抽取数据集分析（一）—— 理解单条实例、TAC 关系抽取数据集。
FewRel：FewRel 是一个Few -shot Relation分类数据集，它包含 70, 000 个自然语言句子，表达 100 个由众包标注的关系。适用于few-shot关系分类任务的大规模监督数据集。a Few-shot Relation classification dataset、论文笔记：FewRel 2.0: Towards More Challenging Few-Shot Relation Classification。
BC5CDR：BC5CDR语料库由 1500 篇 PubMed 文章组成，其中包含 4409 种带注释的化学物质、5818 种疾病和 3116 种化学-疾病相互作用。BC5CDR (BioCreative V CDR corpus)。

DocRED在很多方面都比现有的数据集要大，包括文档、单词、句子、实体的数量，特别是在关系类型、关系实例和关系事实方面。我们希望大规模的DocRED数据集能够推动从句子级到文档级的关系提取。

3.2 命名实体类型

DocRED涵盖了人(18.5%)、地点(30.9%)、组织(14.4%)、时间(15.8%)、数字(5.1%)等多种实体类型。它还涵盖了不属于上述类型的各种各样的实体名称(15.2%)，如事件、艺术作品和法律。每个实体平均被注释1.34次。

These types include “Person (PER)”, “Organization (ORG)”, “Location (LOC)”, “Time (TIME)”, “Number (NUM)”, and “other types (MISC)”(miscellaneous entity names). The types of named entities in DocRED and their covered contents are shown in Table 9.

3.3 推理类型

我们从开发和测试集中随机抽取300个文档，其中包含3820个关系实例，并手动分析提取这些关系所需的推理类型。表2显示了我们数据集中主要推理类型的统计数据。从推理类型的统计中，我们发现:

大多数关系实例(61.1%)需要推理来识别，而通过简单模式识别可以提取的关系实例只有38.9%，这说明在文档级正则中，推理是必不可少的。
在有推理的关系实例中，大多数(26.6%)需要逻辑推理，其中两个实体之间的关系是通过桥梁实体间接建立的。逻辑推理要求RE系统能够对多个实体之间的交互进行建模。
相当多的关系实例(17.6%)需要共指推理，其中必须首先执行共指消解以识别丰富上下文中的目标实体；
相似比例的关系实例(16.6%)必须基于常识推理来识别，读者需要将文档中的关系事实与常识结合起来完成关系识别。

总之，DocRED需要丰富的推理技能来综合文档的所有信息。

3.4 句间关系实例

我们发现每个关系实例平均与1.6个支持句相关，其中46.4%的关系实例与一个以上支持句相关。此外，详细分析表明，40.7%的关系事实只能从多个句子中提取，这表明DocRED是文档级RE的一个很好的基准。我们还可以得出结论，对于文档级RE来说，多句阅读、综合和推理能力是必不可少的。(40.7%的关系事实只能从多个句子中提取和大多数关系实例(61.1%)需要推理来识别，这两个数据的差别在哪些地方？)

3.5 关系列表

四、基准设置

我们分别为监督和弱监督场景设计了两种基准测试设置。对于这两种设置，RE系统都在高质量的人工注释数据集上进行评估，这为文档级RE系统提供了更可靠的评估结果。表3显示了用于这两种设置的统计数据。

4.1 监督设置

使用5053个监督文档，随机分为训练集，开发集和测试集。监督设置为文档级RE系统带来了以下两个挑战：

第一个挑战来自执行文档级RE所需的丰富推理技巧。如第3节所示，大约61.1%的关系实例依赖于复杂的推理技能，而不是模式识别来提取，这要求正则系统超越识别单个句子中的简单模式，并对文档中的全局和复杂信息进行推理。
第二个挑战在于对长文档建模的高计算成本和文档中大量的潜在实体对，这与文档中的实体数量(平均19.5个实体)有关。因此，使用二次或更高计算复杂度的算法对上下文信息进行建模的 RE 系统（Sorokinand Gurevych，2017；Christopoulou 等人，2018）对于文档级 RE 来说效率不够高。因此上下文感知的效率RE系统需要进一步完善以适用于文档级RE。

4.2 弱监督设置

此设置与监督设置相同，只是训练集被远程监督数据替换（第 2.2 节）。除了上述两个挑战外，远程监督数据不可避免的错误标记问题是弱监督环境下 RE 模型的主要挑战。许多努力致力于缓解句子级 RE 中的错误标签问题（Riedel 等人，2010 年；Hoffmann 等人，2011 年；Surdeanu 等人，2012 年；Lin 等人，2016 年）。然而，文档级远程监督数据中的噪声明显多于句子级的噪声。例如，对于在人类注释数据收集的第 4 阶段（第 2.1 节）中头尾实体同时出现在同一个句子中的推荐关系实例（即句内关系实例），41.4% 被标记为不正确，而 61.8% 的句间关系实例被标记为不正确，表明错误标记问题对于弱监督文档级 RE 更具挑战性。因此，我们相信在 DocRED 中提供远程监督数据将加速文档级 RE 远程监督方法的发展。此外，还可以联合利用远程监督数据和人工注释数据来进一步提高 RE 系统的性能。

五、实验

为了评估 DocRED 的挑战，我们进行了综合实验，以评估数据集上最先进的 RE 系统。具体来说，我们在监督和弱监督基准设置下进行实验。我们还评估人类表现并分析不同支持证据类型的表现。此外，我们进行消融研究以调查不同特征的贡献。通过详细分析，我们讨论了文档级 RE 未来的几个方向。

5.1 模型

CNN (Zeng et al., 2014) based model
LSTM (Hochreiter and Schmidhuber, 1997) based model
bidirectional LSTM (BiLSTM) (Caiet al., 2016) based model
Context-Aware model (Sorokin and Gurevych, 2017)

前三个模型仅编码器不同。将文档 $D$ 利用CNN/LSTM/BiLSTM作为编码器得到隐藏状态向量 $\{h_i\}^{n}_{i=1}$ ，然后计算实体的表示，最后预测每个实体对的关系。

对于每个词，提供给编码器的特征是其 GloVe 词嵌入（Pennington 等人，2014 年）、实体类型嵌入和共指嵌入的串联。实体类型嵌入是通过使用嵌入矩阵将分配给单词的实体类型（例如，PER、LOC、ORG）映射到向量中获得的。实体类型由人工为人工标注数据分配，由微调的 BERT 模型为远程监督数据分配。与同一实体相对应的命名实体提及项被分配了相同的实体 ID，该 ID 由其在文档中首次出现的顺序确定。实体 ID 作为共指嵌入映射到向量中。

命名实体提及的词向量由隐状态的平均得到，实体的词向量由命令实体提及的平均得到。

$[\cdot;\cdot]$ 表示连接， $d_{ij}$ 和 $d_{ji}$ 是文档中两个实体第一次提及的相对距离， $E$ 是嵌入矩阵， $r$ 是关系类型， $W_r$ ， $b_r$ 是依赖于关系类型的可训练参数。

5.2 评价指标

$\frac{(TP+TN)}{(TP+TN+FP+FN)}$

$\frac{TP}{(TP+FP)}$

$\frac{TP}{(TP+FN)}$

$\frac{2*(Precision*Recall)}{(Precision+Recall)}$

F1值就是Precision和Recall的调和平均数，如果只考虑精确度或者只考虑召回率都不能够作为评价一个模型好坏的指标，所以使用F1值来调和两者，兼容到精确度和召回率。F1值最大值为1，最小值为0，精确度越高越好，召回率越高越好，可以在0~1的这个值域内，F1越大越好。

然而，一些相关事实同时存在于训练集和开发/测试集中，因此模型可能会在训练期间记住它们之间的关系，并以一种不受欢迎的方式在开发/测试集上取得更好的性能，从而引入**评估偏差。**然而，训练集和开发/测试集之间的关系事实重叠是不可避免的，因为许多共同的关系事实可能在不同的文档中共享。因此，我们还报告了F1分数不包括训练集和开发/测试集共享的那些相关事实，表示为 Ign F1。

AUC（Area Under Curve）被定义为ROC曲线下与坐标轴围成的面积，显然这个面积的数值不会大于1。ROC曲线全称为受试者工作特征曲线（receiver operating characteristic curve），它是根据一系列不同的二分类方式（分界值或决定阈），以真阳性率为纵坐标，假阳性率为横坐标绘制的曲线。

$TP_{Rate}=\frac{TP}{TP+FN}$

$FP_{Rate}=\frac{FP}{FP+TN}$

5.3 模型性能

结果：

用人工注释数据训练的模型通常优于在远程监督数据上训练的模型。这是因为虽然通过远程监督可以很容易地获得大规模的远程监督数据，但错误标记问题可能会损害 RE 系统的性能，这使得弱监督设置变得更加困难。
一个有趣的例外是，在远程监督数据上训练的 LSTM、BiLSTM 和 Context-Aware 获得了与在人工注释数据上训练的那些相当的 F1 分数，但在其他指标上的分数明显较低，表明训练和训练之间的重叠实体对开发/测试集确实会导致评估偏差。因此，报告 Ign F1 和 Ign AUC 是必要的。
利用丰富的上下文信息的模型通常可以获得更好的性能。 LSTM 和 BiLSTM 优于 CNN，表明在文档级 RE 中建模长依赖语义的有效性。上下文感知实现了有竞争力的性能，但是，它不能显着优于其他神经模型。这表明在文档级 RE 中考虑多个关系的关联是有益的，而当前的模型不能很好地利用相互关系信息。

5.4 人类性能

为了评估人类在DocRED上的文档级RE任务中的表现，我们从测试集中随机抽取了100个文档，并要求其他众包工作人员识别关系实例和支持证据。以与第2.1节相同的方式确定的关系实例被推荐给众包工作者提供帮助。第2.1节中收集的原始注释结果作为ground truth。我们还提出了联合识别关系实例和支持证据的子任务，并设计了一个管道模型。表5显示了RE模型和人的性能。人类在文档级RE任务(RE)和联合识别关系和支持证据任务(RE+Sup)上都取得了有竞争力的结果，说明DocRED的上限性能和注释者之间的一致性都比较高。此外，RE模型的总体性能明显低于人类的性能，这表明文档级RE是一项具有挑战性的任务，并表明有足够的改进机会。

5.5 表现和支持性证据类型

为了研究从不同类型的支持性证据中综合信息的难度，我们将开发集中的12,332个关系实例分为三个不相干的子集。

single：6,115个关系实例只有一个支持句（表示为单句）；
mix：1,062个关系实例有多个支持句，并且实体对至少共同出现在一个支持句中（表示为混合句）；
multiple：4,668个关系实例有多个支持句，并且实体对没有共同出现在任何支持句中，这意味着它们只能从多个支持句中提取（表示为多重句）。

TP知道、FN知道，当一个模型预测了一个错误的关系时，我们不知道哪些句子被用作支持证据，因此预测的关系实例不能被归入上述子集？

因此只能计算recall，不能计算precision。

单一的召回率为51.1%，混合的召回率为49.4%，而多重的召回率为46.6%。这表明，虽然mix中的多个支持性句子可以提供互补的信息，但要有效地综合丰富的全局信息是具有挑战性的。此外，对多个句子的表现不佳表明，RE模型在提取句子间的关系方面仍有困难

5.6 特征消融

我们对 BiLSTM 模型进行特征消融研究，以研究不同特征在文档级 RE 中的贡献，包括实体类型、共指信息和实体之间的相对距离（等式 1）。表 6 显示上述特征都对性能有贡献。具体来说，实体类型由于对可行关系类型的约束而贡献最大。共指信息和实体之间的相对距离对于合成来自多个命名实体提及的信息也很重要。这表明 RE 系统在文档级别利用丰富的信息很重要。

5.7 支持证据预测

我们提出了一项新任务来预测关系实例的支持证据。一方面，联合预测证据提供了更好的可解释性。另一方面，从文本中识别支持证据和推理相关事实自然是具有潜在相互促进作用的双重任务。我们设计了两种支持证据的预测方法：（1）启发式预测器。我们实现了一个简单的基于启发式的模型，该模型将所有包含头部或尾部实体的句子视为支持证据。 (2) 神经预测器。我们还设计了一个神经支持证据预测器。给定一个实体对和一个预测关系，句子首先通过单词嵌入和位置嵌入的串联转换为输入表示，然后输入 BiLSTM 编码器进行上下文表示。受 Yang 等人 (2018) 的启发，我们将 BiLSTM 在第一个和最后一个位置的输出与可训练关系嵌入连接起来，以获得句子的表示，用于预测该句子是否被用作给定关系的支持证据实例。如表 7 所示，神经预测器在预测支持证据方面明显优于基于启发式的基线，这表明 RE 模型在联合关系和支持证据预测方面的潜力。

5.8 讨论

从以上的实验结果和分析中我们可以得出结论，文档级的RE比句子级的RE更具挑战性，需要加紧努力来缩小RE模型的性能与人类之间的差距。我们认为以下研究方向是值得关注的。

模型的推理能力：探索明确考虑推理的模型；
模型能收集和综合利用句子间的信息：设计更具表现力的模型架构来收集和综合句子间的信息；
模型能利用好远程监督数据集：利用远距离监督的数据来提高文档级RE的性能。

六、相关工作

近年来为RE构建了多种数据集，极大地促进了RE系统的发展。

句子级关系抽取数据集
- Hendrickx 等人 (2010)、Doddington 等人 (2004) 和 Walker 等人 (2006) 构建了关系类型和实例相对有限的人工注释 RE 数据集。
- Riedel et al (2010) 通过远程监督将纯文本与 KB 对齐来自动构建 RE 数据集，但存在错误标记问题。
- Zhang et al (2017) 和 Han et al (2018b) 进一步将外部推荐与人工注释相结合，构建大规模高质量数据集。
文档比句子提供更丰富的信息，将研究从句子级别转移到文档级别是许多领域的流行趋势，事件提取和验证、阅读理解、情感分类、摘要和机器翻译等都是如此。对于RE来说也有一些文档级数据集，但存在一些问题。
- 通过远程监督构建的（Quirk 和 Poon，2017 年；Peng 等人，2017 年），存在不可避免的错误标签问题。
- 仅限于特定领域（Li 等人，2016 年；Peng 等人，2017 年）。

DocRED 由具有丰富信息的众包工作者构建，并且不限于任何特定领域，这使其适合训练和评估通用文档级 RE 系统。

七、总结

为了促进RE系统从句子层面到文档层面的发展，我们提出了DocRED，一个大规模的文档级RE数据集，其特点是数据量大，要求对多个句子进行阅读和推理，并为促进弱监督的文档级RE的发展提供了远距离监督数据。实验表明，人类的表现明显高于RE基线模型，这表明未来有大量的改进机会。

你可能感兴趣的:(论文阅读,自然语言处理,深度学习,nlp)

蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
自然语言处理-基于预训练模型的方法-笔记
自然语言处理-基于预训练模型的方法-笔记【下载地址】自然语言处理-基于预训练模型的方法-笔记《自然语言处理-基于预训练模型的方法》由哈尔滨工业大学出版，深入探讨了NLP领域的前沿技术与预训练模型的应用。本书系统介绍了预训练模型的基本概念、发展历程及常见模型的原理，并通过丰富的实践案例与代码实现，帮助读者掌握这些技术在自然语言处理任务中的实际应用。无论是初学者、研发人员，还是希望提升NLP能力的研究
DeepSeek在智能教育评估中的应用：试题检索 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 easyui 前端 javascript ai
DeepSeek在智能教育评估中的应用：试题检索关键词：DeepSeek、智能教育、试题检索、自然语言处理、知识图谱、个性化学习、评估系统摘要：本文探讨了DeepSeek大模型在智能教育评估系统中的试题检索应用。我们将深入分析如何利用先进的自然语言处理技术和知识图谱构建高效的试题检索系统，实现个性化学习路径推荐和精准评估。文章将从核心概念、技术原理到实际应用场景，全面解析这一创新教育技术解决方案。
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
四种微调技术详解：SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
当谈到人工智能大语言模型的微调技术时，我们进入了一个令人兴奋的领域。这些大型预训练模型，如GPT-3、BERT和T5，拥有卓越的自然语言处理能力，但要使它们在特定任务上表现出色，就需要进行微调，以使其适应特定的数据和任务需求。在这篇文章中，我们将深入探讨四种不同的人工智能大语言模型微调技术：SFT监督微调、LoRA微调方法、P-tuningv2微调方法和Freeze监督微调方法。第一部分：SFT监
从新闻到知识图谱：用大模型和知识工程“八步成诗”打造科技并购大脑许泽宇的技术分享知识图谱科技人工智能
一句话摘要：本文带你用现代NLP和知识图谱技术，把科技公司并购新闻变成结构化的知识大脑，过程全景揭秘，理论与实战齐飞，代码只用伪代码，干货与段子齐发，助你成为AI知识工程老司机！前言：为什么要把新闻变成知识图谱？想象一下，你是个投资分析师，老板让你一周内梳理全球科技并购大事件，找出谁在买谁、花了多少钱、背后有哪些大佬、涉及哪些新技术……你会怎么做？A.手动Ctrl+F，Excel狂敲，熬夜爆肝？B
Longformer: The Long-Document Transformer（2020-4-10）不负韶华ღ 深度学习（NLP）transformer 深度学习人工智能
模型介绍目前基于Transformer的预训练模型在各项NLP任务纷纷取得更好的效果，这些成功的部分原因在于Self-Attention机制，它运行模型能够快速便捷地从整个文本序列中捕获重要信息。然而传统的Self-Attention机制的时空复杂度与文本的序列长度呈平方的关系，这在很大程度上限制了模型的输入不能太长，因此需要将过长的文档进行截断传入模型进行处理，例如BERT中能够接受的最大序列长
搜索架构中的NLP技术：提升搜索准确性的关键搜索引擎技术架构自然语言处理人工智能 ai
搜索架构中的NLP技术：提升搜索准确性的关键关键词：搜索架构、NLP技术、查询理解、语义搜索、相关性排序、意图识别、BERT模型摘要：本文将深入探讨现代搜索架构中NLP技术的核心应用，从查询理解到结果排序的全流程，揭示NLP如何提升搜索准确性。我们将通过生动的比喻解释复杂概念，分析关键技术原理，并提供实际代码示例，帮助读者全面理解搜索系统背后的NLP魔法。背景介绍目的和范围本文旨在解析NLP技术在
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
Python深度学习：3步实现AI人脸识别，效果堪比专业软件！小筱在线 python 人工智能 python 深度学习
引言：AI人脸识别的时代已经到来在当今数字化时代，人脸识别技术已经从科幻电影走进了我们的日常生活。从手机解锁到机场安检，从银行身份验证到智能门禁系统，这项技术正以前所未有的速度改变着我们的生活方式。而令人振奋的是，借助Python和深度学习技术，普通人也能构建出专业级的人脸识别系统。本文将带领您通过三个关键步骤，使用Python深度学习技术实现一个准确率高达99%的人脸识别系统。这个系统不仅原理简
RNN案例人名分类器（完整步骤） AI扶我青云志 rnn 人工智能深度学习 nlp lstm gru
今天给大家分享一个NLP（自然语言处理）中的一个小案例，本案例讲解了RNN、LSTM、GRU模型是如何使用并进行预测的，一、案例架构人名分类器的实现可分为以下五个步骤:第一步:导入必备的工具包第二步:对data文件中的数据进行处理，满足训练要求第三步:构建RNN模型(包括传统RNN,LSTM以及GRU)第四步:构建训练函数并进行训练五步第:构建评估函数并进行预测二、实现步骤1.导包#导入torch
【论文笔记】RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation AustinCyy 论文笔记论文阅读
论文信息论文标题：RAGLAB:AModularandResearch-OrientedUnifiedFrameworkforRetrieval-AugmentedGeneration-EMNLP24论文作者：XuanwangZhang-NanjingUniversity论文链接：https://arxiv.org/abs/2408.11381代码链接：https://github.com/fat
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
深度学习实验：GPU加速，突破性能瓶颈 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
深度学习实验：GPU加速，突破性能瓶颈1.背景介绍随着深度学习模型变得越来越复杂和庞大，传统的CPU已经无法满足训练和推理的计算需求。GPU凭借其强大的并行计算能力和专门为矩阵运算优化的架构，成为了深度学习领域的核心加速器。本文将探讨如何利用GPU加速深度学习实验,突破性能瓶颈,提高模型训练和推理的效率。2.核心概念与联系2.1GPU架构GPU(图形处理器)最初是为了加速图形渲染而设计的,但由于其
深度学习相关指标工作笔记 Victor Zhong AI 框架深度学习笔记人工智能
这里写目录标题检测指标iou/Ｇou/Ｄiou/ＣiouMSE(MeanSquaredError)(均方误差)(回归问题)交叉熵损失函数(CrossEntropyErrorFunction)(分类问题)检测指标iou/Ｇou/Ｄiou/ＣiouIntersectionoverUnion(IoU)是目标检测里一种重要的评价值交并比令人遗憾的是IoU无法优化无重叠的bboxes如果用IoU作为loss
【深度学习新浪潮】基于扩散模型的图像编辑加速方法小米玄戒Andrew 深度学习新浪潮深度学习人工智能扩散模型 Transformer DiT 图像编辑模型加速
在基于扩散模型的图像编辑任务中，实现高质量与高效加速的平衡需要综合运用模型架构优化、采样策略创新、条件控制增强及硬件加速等多维度技术。一、一步反演与掩码引导的编辑框架通过一步反演框架将输入图像映射到可编辑的潜在空间，结合掩码引导的注意力重缩放机制，实现文本引导的局部编辑。例如，SwiftEdit通过一步反演和注意力重缩放，将编辑时间压缩至0.23秒，比传统多步方法快50倍。具体步骤包括：一步反演：
《从Backprop到Diffusion：深度学习的算法进化树全景图》 HeartException 学习人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《从Backprop到Diffusion：深度学习的算法进化树全景图》**展开系统性解析。全文基于算法原理-技术突破-产业重塑的三层逻辑链，融合2025年最新研究成果与产业数据，呈现深度学习四十年的底层技术迁徙路径从Backprop到Diffusion：深度学习的算法进化树全景图副标题：一部算法
多模态大模型：技术原理与实战看清GPT的进化史和创新点 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战看清GPT的进化史和创新点1.背景介绍1.1人工智能的发展历程1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习方法1.3大语言模型的出现1.3.1Transformer架构的提出1.3.2GPT系列模型的发展1.3.3多模态大模型的兴起2.核心概念与联系2.1
AI原生应用必知：5大高效多轮对话框架对比 AI原生应用开发 AI-native easyui 前端 ai
AI原生应用必知：5大高效多轮对话框架对比关键词：AI原生应用、多轮对话、对话框架、自然语言处理、上下文管理、意图识别、对话状态跟踪摘要：本文深入探讨了构建AI原生应用时必备的5大多轮对话框架，包括Rasa、Dialogflow、MicrosoftBotFramework、AmazonLex和IBMWatsonAssistant。通过对比分析它们的架构设计、核心功能和应用场景，帮助开发者选择最适合
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr