自然语言处理CS

UNIRE: A Unified Label Space for Entity Relation Extraction

UNIRE：一种用于实体关系抽取的统一标签空间

https://github.com/Receiling/UniRE

Abstract

(Zhong and Chen,ACL2020) 使用pipeline方法为实体检测和关系分类设置了两个独立的标签空间，并取得了SOTA。由于pipeline方法不能共享实体抽取和关系抽取的信息，因此作者为了促进两个任务的交互提出了一种可以共享标签空间的方法。作者采用表填充的方法实现，具体来说：输入一张 $s\times s$ 大小的表，这张表包含一个句子中所有的单词对，实体和关系由表格中的正方形和矩形表示（实体：实体内部所有字符都是相同的实体类型标签例如PER；关系：有关系的两个实体的字符都有相同的关系标签），实体都在对角线，关系在非对角线。作者实现了SOTA并且只用了一半的参数，而且速度更快

Figure 1：联合实体关系提取表的示例。每个单元格对应一个单词对。实体是对角线上的正方形，关系是对角线外的矩形。请注意，PER-SOC是无向(对称)关系类型，而PHY和ORG-AFF是有向(非对称)关系类型。

该表准确地表示重叠的关系，例如，PER实体“David Perkins”参与两个关系 $(“ D a v i d P e r k i n s ” ， “ W i f e ” ， P E R - S O C)$ 和 $(“ D a v i d P e r k i n s ” ， “ C a l i f o r n i a ” ， P H Y S)$ 。对于每个units，一个相同的双仿射模型预测其标签。联合解码器被设置为寻找最佳正方形和矩形

1 Introduction

人们认为联合模型可能会更好，因为它们可以减轻子模型之间的误差传播，具有更紧凑的参数集，并且统一地编码关于两个任务的先验知识。本文将已有的单独的标签空间转化为统一的标签空间，存在的难点：两个子任务通常被表述不同的学习问题（例如：作为序列标签的实体检测，作为多类分类的关系分类)，并且它们的标签被放置在不同的事物上(例如，词与词对)。

先前的一次尝试(郑等人，2017年)是用一个序列标记模型处理这两个子任务。设计了一个复合标签集来同时对实体和关系进行编码。然而，该模型的表现力被牺牲了：它既**不能检测重叠关系(即，参与多个关系的实体)，也不能检测孤立的实体(即，没有出现在任何关系中的实体).

作者定义一个新的统一标号空间的关键思想：将实体检测看作关系分类的特例。输入空间是一个二维表，每个条目对应于句子中的一个词对(图1)。联合模型从统一的标签空间(实体类型集和关系类型集的并集)为每个单元指定标签。在图形上，实体是对角线上的正方形，关系是对角线外的矩形。该公式保留了关于现有 $e n t i t y - r a l a t i o n$ 提取场景(例如，重叠关系、有向关系、无向关系)的完整模型表达能力。

基于表格形式，联合实体关系提取器执行两个操作：填充和解码。首先，填表是预测每个词对的标签，类似于依存句法分析中的弧形预测任务。采用双仿射注意机制(Dozat和Manning，2016)来学习词对之间的互动。本文还对表施加了两个结构约束。然后，给出带有标签日志的表填充，本文设计了一种近似联合解码算法来输出最终提取的实体和关系。基本上，它高效地在表中找到分割点来识别正方形和矩形(这也与现有的表填充模型不同，现有的表填充模型仍然应用某些顺序解码并递增地填充表)。

在三个基准测试(ACE04，ACE05，SciERC)上的实验结果表明，与目前最先进的提取器(zhong和Chen，2020)相比，该联合方法取得了与之相当的性能：在ACE04和Science ERC上性能更好，在ACE05.1上更具竞争力；同时，我们的新联合模型在解码速度上更快(比确切的流水线实现快10倍，与近似流水线相当，但性能较低)。它还有一个更紧凑的参数集：与单独的编码器相比，共享编码器只使用一半的参数。

2 Approach

2.1 Task Definition

给定一个句子 $s=x_1,x_2,...,x_{|s|}$ ( $x_i$ 是word)，目的是提取一组实体 $\varepsilon$ 和一组关系 $\mathcal{R}$ 。对于关系三元组 $e_1,e_2,l)$ ，其中 $\in \mathcal{Y_{r}}$ 是预定义的关系类型， $\mathcal{y_e}$ 、 $\mathcal{y_r}$ 表示预定义的实体类型和关系类型的集合。

对于句子 $s$ 维护一个表格 $T^{|s| \times |s|}$ ，其中 $∣ s ∣$ 表示句子长度。对于表 $T$ 中的每个单元格 $c e l l (i, j)$ ，为其分配一个标签 $y_{i,j} \in \mathcal{y}$ ，其中 $\mathcal{y_e} \cup \mathcal{y_r} \cup \{\perp\}$ ，( $\perp$ 表示没有关系)

对于每个实体e：对应的标签 $y_{i,j}(x_i\in e.span,x_j\in e.span)$ 应填写成 $e . t y p e$
对于每个关系 $r=(e_1,e_2,l)$ ：对应的标签 $y_{i,j}(x_i\in e_1.span,x_j\in e_2.span)$ 应填写成 $l$
对于其他的单元格填写$\perp $

本文将解码实体和关系转化为一个矩形查找问题，查找问题采用联合译码方法来解决。

2.2 Biaffine Model

通过BERT获取上下文表示 $h_i$ ${h_1,...,h){|s|}\}=PLM(\{x_1,...,x_{|s|}\})$

为了捕获长范围依存关系，将句子扩展成固定的窗口大小 $W$ （本文设为200），为了更好的编码表$T $中单词的方向信息，采用了深度双仿射注意力机制。

span start和end：
$h_i^{head}=MLP_{head}(h_i),\\ h_i^{tail}=MLP_{tail}(h_i)$
计算每个词span的得分： $g_{i,j} \in \mathcal{R^{|y|}}\\ Biaff(h_1,h2)=h_1^TU_1h_2+U_2(h_1 \oplus h_2)+b \\ g_{i,j}=Biaff(h_i^{head},h_j^{tail})$
其中 $U_1\in \mathcal{R^{|y|{\times d\times d}}}$ , $U_2\in \mathcal{R^{|y|{\times 2d}}}$ , $b\in \mathcal{R^{|y|}}$

2.3 Table Filling

将 $g_{i,j}$ 馈送到Softmax中预测相应标签，从标签空间 $\mathcal{y}$ 上产生概率分布： $P(y_{i,j}|s)=Softmax(dropout(g_{i,j}))$

实验中发现对 $g_{i,j}$ 利用dropout可以进一步提高性能,作者称为 $logit\ dropout$

使用交叉熵最小化目标函数： $\mathcal{L}_{entry}=-\frac{1}{|s|^2}\sum_{i=1}^{|s|}\sum_{j=1}^{|s|}logP(y_{i,j}=j_{i,j}|s)$ ，其中 $y_{i,j}$ 是gold label

2.4 Constraints

目标函数简化了训练过程，实际上还存在一些结构上的约束，实体和关系对应于表中的正方形和矩形，但是目标函数没有显示该约束，本文提出了两个直观的约束，对称和隐含，本文用记号 $\mathcal{P}\in \mathbb{R}^{|s|\times |s| \times |\mathcal{y}|}$ 表示句子 $s$ 中所有单词对的 $P(y_{i,j}|s)$ 堆叠

**Symmetry(对称)**与实体对应的正方形必须在对角线上，对于对称关系如 $e_1,e_2,l)$ 和 $e_2,e_1,l)$ 是等价的，因此在表格上对称关系也是关于对角线对称的(Figure 1所示 $(" h i s ", " w i f e ", P E R - S O C)$ and $(" w i f e ", " h i s ", P E R - S O C)$ 的矩形关于对角线对称）。

标签集 $\mathcal{y}$ 分为对称标签集 $y_{sym}$ 和非对称标签集 $y_{asym}$

对于矩阵 $\mathcal{P}_{:,:,t}$ 应该关于每个标签 $t\in \mathcal{y_{sym}}$ 的对角线对称，损失为： $\mathcal{L_{sym}=\frac{1}{|s|^2}\sum^{|s|}_{i=1}\sum_{|s|}^{j=1}\sum_{t\in \mathcal{y_{sym}}}|\mathcal{P_{i,j,t}-\mathcal{P}_{j,i,t}}|}$

Implication蕴含、包含一个关系存在，那么一定存在两个实体，反之就是，没有两个对应的实体，那么一定不可能存在。从概率的角度看，关系的概率大于每个实体的概率。通过蕴含思想，本文对 $\mathcal{P}$ 施加如下约束：对于对角线上的每个单词，其在实体类型空间 $\mathcal{y_e}$ 上的最大可能性不得低于关系类型空间 $y_r$ 上同一行或同一列中的其他单词的最大可能性。

蕴含损失表示为: $\mathcal{L_{imp}=\frac{1}{|s|}\sum_{i=1}^{||s}[\underset{l\in \mathcal{y_r}}{max}\{\mathcal{P_{i,:,l},\mathcal{P_{:i,l}}}\}-\underset{t\in y_e}{max}\{\mathcal{P_{i,i,t}}\}]}$ 其中 $u]_*=max(u,0)$ 是hinge loss.

总的损失: $\mathcal{L_{entry}+L_{sym}+L_{imp}}$

2.5 Decoding

在测试阶段，给定句子s的概率张量 $\mathcal{P}\in \mathbb{R}^{|s| \times |s|\times |y|}$ ，从中解码实体的正方形和关系的矩形。受到sun et al 2019的启发，本文提出了一个三步解码算法：1. 解码span(实体或实体间span)。2. 解码每个span的实体类型。3.解码实体对的关系类型。

span decoding:一个实体包含的词的行列是相同的，如果相邻的两行/列不同，说明在此处一定有实体边界
1. 从行的角度出发将 $\mathcal{P}\in \mathbb{R}^{|s| \times |s|\times |y|}$ 展平为 $\mathcal{P}^{row}\in \mathbb{R}^{|s| \times (|s|\cdot |y|)}$ ,然后计算行的欧几里得距离 $\mathcal{l_2}$
2. 类似的，从列的角度出发根据 $\mathcal{P}^{col}\in \mathbb{R}^{(|s|\cdot |y|) \times |s|}$ ,然后计算列的欧几里得距离
3. 将两个距离的平均值作为最终距离
4. 如果距离大于默认的阈值 $\alpha$ ( $\alpha=1.4$ )则此位置为分割位置(实体边界)，span解码的时间复杂度变成了 $\mathcal{O(|s|)}$
Entity Type Decoding通过span encoding得出 $s p a n (i, j)$ ,将得到的 $i, j$ 生成正方形来解码实体类型 $\overset{\wedge }{t} =argmax_{t\in y_e \cup\{\bot\}}Aug(\mathcal{P_{i:j,i:j,t}})$ ,如果 $\overset{\wedge}{t}\in y_e$ 则解码为一个实体,如果 $\overset{\wedge}{t}=\bot$ 则 $s p a n (i, j)$ 不是实体。 $s p a n (i, j)$ 在表格中是一个正方形，利用 $argmax(\cdot)$ 取出正方形中所有分数的最大值作为当前span的分数。
Relation Type Decoding在实体类型解码后，给定一个实体 $e_1=span(i,j)$ 和另一个实体 $e_2=span(m,n)$ ，解码一个关系 $(e_1,e_2,\overset{\wedge}{l})$ ,如果 $\overset{\wedge}{l}=\bot$ ,表示没有关系。

形式上表现为： $\overset{\wedge }{l} =argmax_{l\in y_r \cup\{\bot\}}Aug(\mathcal{P_{i:j,m:m,l}})$ ,如果 $\overset{\wedge}{l}\in y_r$ ，解码为一个关系 $(e_1,e_2,\overset{\wedge}{l})$ ,如果 $\overset{\wedge}{l}=\bot$ 则 $e_1,e_2$ 没有关系。将得到的span两两匹配，得到实体对之间的关系矩形，将矩形中最大的那个位置对应的关系标签作为最终的关系标签。

3 Experiments

句子长度设置为200，对于MLP层，将隐藏大小设置为d=150，并使用Gelu作为激活函数。我们使用了β1=0.9和β2=0.9的AdamW优化器。批大小为32，学习率为5e-5，权值衰减为1e-5，线性预热学习率调度器，预热率为0.2。用最多200个epochs(对于SciERC为300个纪元)训练模型，并采用提前停止策略。在Intel®Xeon®W-3175X CPU和NVIDIA Quadro RTX 8000 GPU上进行所有实验。

没卡的还是看个乐呵吧

总的来说，UNIRE在ACE04和SciERC上取得了最好的性能，在ACE05上取得了可比的结果。与之前最好的联合模型(Wang and Lu，2020)相比，该模型在ACE04和ACE05上显著提高了实体和关系的性能，即实体的绝对F1分别为+0.9和+0.7，关系的绝对F1分别为+3.4和+1.7。

对于最好的流水线模型(钟和陈，2020)(当前的SOTA)，该模型在ACE04和SciERC上取得了优异的性能，在ACE05上取得了相当的性能。与ACE04/ACE05相比，SciERC的规模要小得多，因此在SciERC上的实体性能大幅下降。由于(钟和陈，2020)是一种流水线方法，其关系绩效受到较差的实体绩效的严重影响。然而，我们的模型在这种情况下受到的影响较小，并且获得了更好的性能。此外，在ACE04上，即使实体结果较差，我们的模型也能获得较好的关系性能。实际上，我们的基础模型(BERTBASE)已经实现了竞争关系绩效，甚至超过了之前基于BERTLARGE(Li et al.，2019)和ALBERTXXLARGE(Wang and Lu，2020)的模型。

3.1 Ablation Study

具体地说，本文实现了一种朴素的比较解码算法，即“硬解码”算法，它以“中间表”作为输入。“中间表”是双仿射模型输出的概率张量P的硬形式，即选择概率最高的类作为每个单元的标签。

为了找到对角线上的实体正方形，它首先尝试判断最大的正方形( $∣ s ∣ \times ∣ s ∣$ )是否为实体。标准只是计算出现在正方形中的不同实体标签的数量，并选择出现频率最高的一个。如果最常用的标签是⊥，我们将正方形的大小缩小1，然后在两个 $(∣ s ∣ - 1) \times (∣ s ∣ - 1)$ 正方形上执行相同的工作，依此类推。为避免实体重叠，如果实体与标识的实体重叠，则将丢弃该实体。为了找到关系，每个实体对都用对应矩形中最频繁的关系标签进行标记。

从消融研究中，我们得到了以下观察结果:

移除其中一个额外损失后，性能将随不同程度下降(第2-3行)。具体地说，对称性损失对SCERC有显著影响(实体和关系绩效分别下降1.1分和1.4分)。而去除蕴涵损失会明显损害ACE05(1.0分)的关系绩效。它表明，这两种损失所包含的结构信息对这项任务是有用的。
与“Default”相比，“w/o logit Dropout”和“w/o CrossStatement Context”的性能下降幅度更大(第4-5行)。logit dropout可以防止模型过度拟合，而跨句上下文为这项任务提供了更多的上下文信息，特别是对于像SciERC这样的小型数据集。
hard decoding的性能最差(其关系性能几乎是“default”的一半)(第6行)。最主要的原因是“硬解码”将实体和关系分开解码。

结果表明，该译码算法综合考虑了实体和关系，对译码具有重要意义

3.2 Error Analysis

我们进一步分析了用于关系提取的其余错误，并给出了五种错误的分布情况：

跨度拆分错误(SSE)、实体未找到(ENF)、实体类型错误(ETE)、关系未找到(RNF)、和关系类型错误(RTE)

SSE”所占的比例相对较小，这证明了我们的跨度解码方法的有效性。

此外，无论是实体还是关系，“未发现错误”的比例都明显大于“类型错误”的比例。最主要的原因是填表存在类不平衡问题，即⊥的数量远远大于其他类。

深度学习——CNN（3）飘涯
前言：前面介绍了最基本的Lenet，下面介绍几种其他的网络结构CNN-AlexNet网络结构如下图：从图中可以看出，采用双gpu训练增加LRN归一化层：本质上，这个层也是为了防止激活函数的饱和的。采用dropout防止过拟合基于AlexNet进行微调，诞生了ZF-netCNN-GoogleNetGoogLeNet借鉴了NIN的特性，在原先的卷积过程中附加了11的卷积核加上ReLU激活。这不仅仅提升
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
AI 人工智能与 Copilot 碰撞出的火花 AI天才研究院 AI大模型企业级应用开发实战人工智能 copilot ai
AI人工智能与Copilot碰撞出的火花关键词：AI人工智能、Copilot、代码辅助、智能编程、人机协作、软件开发、技术创新摘要：本文深入探讨了AI人工智能与Copilot碰撞所产生的一系列效应。首先介绍了相关背景，包括目的、预期读者、文档结构和术语表。接着阐述了核心概念与联系，展示了其原理和架构的示意图及流程图。详细讲解了核心算法原理和具体操作步骤，并通过Python代码进行说明。同时给出了数
#Datawhale组队学习#7月-强化学习Task1 fzyz123 Datawhale组队学习强化学习人工智能 AI
这里是Datawhale组织的组队学习《强化学习入门202507》，Datawhale是一个开源的社区。第一章绪论1.1为什么要学习强化学习？强化学习（ReinforcementLearning,RL）是机器学习中专注于智能体（Agent）如何通过与环境交互学习最优决策策略的分支。与监督学习依赖静态数据集、无监督学习聚焦数据内在结构不同，强化学习的核心在于序贯决策：智能体通过试错探索环境，根据行动
微算法科技技术突破：用于前馈神经网络的量子算法技术助力神经网络变革 MicroTech2025 量子计算算法神经网络
随着量子计算和机器学习的迅猛发展，企业界正逐步迈向融合这两大领域的新时代。在这一背景下，微算法科技（NASDAQ:MLGO）成功研发出一套用于前馈神经网络的量子算法，突破了传统神经网络在训练和评估中的性能瓶颈。这一创新性的量子算法以经典的前馈和反向传播算法为基础，借助量子计算的强大算力，极大提升了网络训练和评估效率，并带来了对过拟合的天然抗性。前馈神经网络是深度学习的核心架构，广泛应用于图像分类、
微算法科技研究量子视觉计算，利用量子力学原理提升传统计算机视觉任务的性能
计算机视觉，作为人工智能领域的一个重要分支，致力于模拟人类视觉系统对图像或视频等视觉数据的理解与分析能力。它涵盖了图像识别、目标检测、图像分割等一系列复杂任务，广泛应用于自动驾驶、医疗影像分析、安防监控等多个领域。然而，随着数据规模的不断膨胀和任务复杂度的日益提升，传统计算机视觉算法在处理大规模、高维度数据时遇到了性能瓶颈。微算法科技(NASDAQ：MLGO)研究量子视觉计算，探索量子计算与经典卷
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
vLLM快速入门：开启高效推理与部署之旅
在如今这个人工智能飞速发展的时代，语言模型的应用已经深入到我们生活的方方面面，从智能聊天机器人到文本生成工具，都离不开强大的语言模型技术支持。而vLLM作为一个专注于高效推理和部署的开源项目，正在为研究人员和开发人员提供一种全新的解决方案，让语言模型的使用变得更加便捷、高效。初识vLLM：背景与意义vLLM（VeryLargeLanguageModelInference）是一个专注于大型语言模型推
深入解析 vLLM 分布式推理与部署策略
在当今人工智能快速发展的时代，大型语言模型（LLM）的推理和部署面临着诸多挑战，尤其是当模型规模日益庞大时，如何高效地利用硬件资源成为关键问题。vLLM作为一种强大的工具，为分布式推理和部署提供了多种策略，本文将详细探讨其相关技术和应用场景，希望能对您提供有价值的参考。分布式推理策略的选择在开始分布式推理和部署之前，明确何时采用分布式推理以及可选的策略至关重要。1.单GPU推理：如果模型能够在单个
英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）青云交大数据新视界 Java 大视界 java 大数据机器学习金融情绪指数投资决策量化策略情绪分析
Java大视界--Java大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）引言：正文：一、Java构建的金融市场情绪数据采集与预处理体系1.1多源异构数据接入引擎1.2数据采集延迟测试报告1.3情绪数据预处理管道二、Java驱动的金融市场情绪指数构建模型2.1多维度情绪指数计算框架2.2情绪指数与投资决策的映射模型三、Java在金融投资决策支持中的实战应用3.1量化私募情绪
Java NLP炼金术：从词袋到深度学习，构建AI时代的语言魔方墨夶 Java学习资料人工智能 java 自然语言处理
一、JavaNLP的“三剑客”：框架与工具链1.1ApacheOpenNLP：传统NLP的“瑞士军刀”目标：用词袋模型实现文本分类与实体识别代码实战：文档分类器的“炼成术”//OpenNLP文档分类器（基于词袋模型）importopennlp.tools.doccat.*;importopennlp.tools.util.*;publicclassDocumentClassifier{//训练模型
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr

UNIRE: A Unified Label Space for Entity Relation Extraction

UNIRE: A Unified Label Space for Entity Relation Extraction

UNIRE：一种用于实体关系抽取的统一标签空间

Abstract

1 Introduction

2 Approach

2.1 Task Definition

2.2 Biaffine Model

2.3 Table Filling

2.4 Constraints

2.5 Decoding

3 Experiments

3.1 Ablation Study

3.2 Error Analysis

你可能感兴趣的:(论文笔记,人工智能,机器学习,神经网络,深度学习,自然语言处理)