开放知识图谱

CCKS 2018 | 最佳论文：南京大学提出 DSKG，将多层 RNN 用于知识图谱补全

本文转载自公众号：机器之心。

选自CCKS 2018

作者：Lingbing Guo、Qingheng Zhang、Weiyi Ge、Wei Hu、Yuzhong Qu

机器之心编译

参与：Panda、刘晓坤

2018 年 8 月 14-17 日，主题为「知识计算与语言理解」的 2018 全国知识图谱与语义计算大会（CCKS 2018）在天津成功举办。该会议是由中国中文信息学会语言与知识计算专委会定期举办的全国年度学术会议，并致力于成为国内知识图谱、语义技术、链接数据等领域的核心会议。本届会议的最佳英文论文来自南京大学计算机软件新技术国家重点实验室和信息系统工程重点实验室，提出了一种用于知识图谱补全的深度序列模型 DSKG。机器之心对该论文进行了摘要介绍，感谢最佳论文作者胡伟教授对本文的确认。

论文：DSKG：一种用于知识图谱补全的深度序列模型（DSKG: A Deep Sequential Model for Knowledge Graph Completion）

论文下载：https://pan.baidu.com/s/1dItQ-H6bbVq5yhQ7RGJgpQ
项目地址：https://github.com/nju-websoft/DSKG

摘要：知识图谱（KG）补全的目标是填补知识图谱中缺失的事实，其中每个事实都可表示成一个形式为 (主体, 关系, 客体) 的三元组。当前的知识图谱补全模型都只能通过三元组中的两个元素（比如主体和关系）来预测剩余第三个元素。我们在这篇论文中提出了一种新模型，其中使用了专门针对知识图谱的多层循环神经网络（RNN）来将知识图谱中的三元组建模成序列。我们在两个基准数据集和一个更为困难的数据集上进行了传统的实体预测任务实验，结果表明我们的方法在许多评测指标上都优于多个之前最佳的知识图谱补全模型。此外，因为我们的模型具有序列特性，所以只需给定单个实体，就能预测整个三元组。我们的实验表明我们的模型在这种三元组预测新任务上表现也较好。

1 引言

Freebase [2] 和 WordNet [12] 等知识图谱（KG）通常会使用三元组来记录数以十亿计的真实世界事实，这些三元组可写成 (主体, 关系, 客体) 的形式（可简写为 (s,r,o)），其中 s 和 o 表示实体，r 表示 s 和 o 之间的关系。因为当前的知识图谱还远没有包含所有知识，所以还需要知识图谱补全任务。之前的模型关注的重点是被称为实体预测（也即链接预测）[3] 的一般任务，其要求基于给定的 (s,r,?) 或 (?,r,o) 来预测对应的 o 或 s，从而补全知识图谱中的三元组。图 1a 展示了一个实体预测的抽象模型。输入 s 和 r 首先被投射到某些向量或矩阵上，然后再组合这些向量或矩阵，得到一个连续表征 v_o，进而预测得到 o。

图 1：用于实体预测的不同模型。白圈和黑圈分别表示输入向量和输出向量。c 表示一个 RNN 单元，h 表示一个隐藏状态。DSKG 使用 c1、c2 来处理实体 s，使用 c3、c4 来处理关系 r。它们是不同的 RNN 单元。

尽管之前的模型已在实体预测上有良好的表现，但它们仍然可能不足以补全知识图谱。让我们假设一个模型可以基于给定的关系 r 而有效地补全一个实体 s。如果我们不提供任何关系，那么这个模型就无法填补 s，因为它无法选择用于完善这个实体的关系。实际上，知识图谱的底层数据模型并不允许任何不完整的元组 (s,r) 存在。

循环神经网络（RNN）是一种神经序列模型，已经在语言建模和机器翻译 [7,16] 等许多自然语言处理（NLP）任务上取得了优良的表现。知识图谱中的三元组可被近似地看作是一个长度为 3 的简单句子。比如，三元组 (USA, contains, NewYorkCity) 可被变换成句子「USA contains New York City」。这启发了我们使用 RNN 来建模知识图谱。但是，我们依然面临着以下难题：（1）三元组不是自然语言。它们是用一种固定的表达方式 (s,r,o) 建模的复杂结构。这样短的序列可能不足以为预测提供足够的上下文信息。与此同时，由于路径数量巨大，构建有价值的长序列又具有很高的成本且难度很大。（2）在三元组中，关系和实体是以固定顺序出现的两种不同类型的元素。将它们视为同类型元素很可能是不合适的。

为了解决上述问题，我们提出了 DSKG（用于知识图谱的深度序列模型），其使用了一种新结构的 RNN，并且使用了一种专门针对知识图谱的采样方法来进行训练。为了阐释我们的想法，我们设计了一个基本的 RNN 模型作为初始版本（如图 1b 所示）。这个基本模型将输入 s 和 r 视为同类型元素并循环式地处理它们。c 表示一个 RNN 单元，其以之前的隐藏状态和当前元素为输入，预测下一个隐藏状态。实体层中的单元处理像是 s 的实体，而关系层中的单元处理像是 r 的关系。在这个模型中，仅有一个单元按顺序处理所有输入元素，所以 s 和 r 是被输入同一个单元 c 来获得它们各自的输出。然后我们使用 h_s 来预测 s 和 h_r 的关系，进而预测 s→r 的客体。

由于这个基本 RNN 模型仅使用了一个 RNN 单元来处理所有输入序列，所以可能无法很好地建模复杂结构。在 NLP 领域，研究者通常会堆叠多个 RNN 单元来改善结果。我们借用这一思想构建了一个多层 RNN 模型（参见图 1c）。但因为实体和关系的特性非常不同，这个模型仍然不能准确建模知识图谱中的三元组。

如图 1d 所示，我们提出的 DSKG 分别使用了多层 RNN 来处理实体和关系。具体而言，DSKG 为实体层和关系层使用了不同的 RNN 单元，即图中的 c1、c2、c3、c4 全都是各不相同的 RNN 单元。我们相信这种专门针对知识图谱的架构可以在关系形式多样且复杂的情况下表现得更好。因为 DSKG 将预测实体（或关系）看作是一个分类任务，所以我们还提出了一种定制的采样方法，可根据当前训练标签的类型采样负例标签。此外，DSKG 还有能力预测一个实体的关系，这启发了我们使用一种方法来通过关系预测改善实体预测的结果。举个例子，在预测 (USA, contains, ?) 时，模型可以自动滤除人或电影这样的实体，因为这些实体与关系 contains 无关。

我们在两个基准数据集上执行了实体预测实验，结果表明 DSKG 在许多评测指标上都优于多种之前最佳的模型。更进一步，我们在 FB15K-237 [14] 上对 DSKG 进行了评估，结果表明 DSKG 优于其它模型。此外，我们还设计了一种用于三元组预测的知识图谱补全新实验，可作为实体预测的补充。我们的研究表明：相比于通用的多层 RNN 模型，DSKG 能得到更优的结果。我们已在线公开我们的源代码、数据集和实验结果。

3 方法

在这一节，我们首先将描述 RNN 及多层 RNN。然后，我们会提出 DSKG，这是一种专为知识图谱设计的多层 RNN 变体。为了有效地训练 DSKG，我们还提出了一种基于类型的采样方法。最后，我们会介绍一种使用关系预测增强实体预测的方法。

3.1 RNN 及多层 RNN

我们先来看仅有一个 RNN 单元的基本 RNN 模型。给定一个序列 (x_1,...,x_T) 作为输入，基本 RNN 模型的处理方式如下：

其中 f(·) 是一个激活函数，W_h、W_x、b 是参数。h_t 是在时间步骤 t 输出的隐藏状态。

多层 RNN 已经在 NLP 领域的复杂分层架构建模上得到了出色的表现 [5]。通过堆叠多个 RNN 单元，每个元素的复杂特征都可以被分层地处理（见图 1c）。我可以将其写成如下形式：

其中是第 i 个 RNN 单元的参数。是第 i 个 RNN 单元在时间步骤 t 的隐藏状态。因此，每个输入元素都会被每个单元按顺序处理，这可以看作是将深度神经网络（DNN）和 RNN 的概念结合到一起。最后，我们可以使用最后一个单元的隐藏状态作为时间步骤 t 的输出 h_t。

3.2 我们提出的深度序列模型

将知识图谱中的三元组看作是序列让我们可以使用 RNN 建模这个知识图谱。但是，这些长度为 3 的序列（即三元组）非常特别：每个三元组中的实体和关系都有非常不同特性而且总是互相交错在一起。因此，我们认为分别为实体和关系 RNN 构建各自的多层 RNN 能帮助模型学习到更为复杂的结构。根据这一直觉想法，我们提出了一种针对知识图谱的多层 RNN，其使用了不同的 RNN 单元来分别处理实体和关系。如图 1d 所示，使用这一架构，整个网络实际上是非循环式的，但仍然还是序列式的。我们可以将该结构写成如下形式：

其中 E 和 R 分别表示实体集和关系集。我们可根据 x_t 的类型选择当前的多层 RNN，然后应用公式 (2) 进行计算。

// 受限于篇幅，有关基于类型的采样方法和使用关系预测增强实体预测的方法在此略过。

4 实验

4.2 实体预测

遵照 [3,14,4] 以及其它许多研究，我们使用了 4 个评测指标：（1）排名第一的结果是正确实体的百分比（Hits@1）；（2）正确实体在排名前十的结果的百分比（Hits@10）；（3）平均倒数排名（MRR）；（4）平均排名（MR）。另外要说明，我们使用的是过滤后的排名 [3]，也就是说我们仅在排名阶段保留当前测试的实体。由于 DSKG 仅需单个实体就能预测关系，所以我们报告了所谓的「级联」结果。即，给定一个测试元组 (s,r,o)，DSKG 首先预测关系 (s,?) 来得到 r 的排名，然后再预测 (s,r,?) 中的实体，得到 o 的排名。最后，将这两个排名相乘，得到用于比较的结果（即最差排名）。

表 1 给出了在 FB15K 和 WN18 上的实验结果。因为这两个数据集都包含很多逆向三元组，所以仅能学习逆向关系的 InverseModel 也得到了很好的结果。此外，我们可以看到 DSKG 在多数指标上都优于其它模型。尤其是 DSKG 在 Hits@1 指标上是最佳的，这表明 DSKG 能够相当好地准确学习预测实体。即使我们以级联方式评估 DSKG，也仍然得到了相当的结果。

表 1：在两个基准数据集上的实体预测结果。† 表示我们自己使用原研究提供的源代码执行的模型，因为原文献没有使用其中某些指标；- 表示结果未知，因为原文献未报告且我们不能获得/运行源代码

表 2 给出了在 FB15K-237 上的实体预测结果。可以看到：（1）所有模型的表现都下降了。具体来看，InverseModel 完全无力处理这个数据集，这表明所有模型都再也不能通过使用逆向关系直接提升它们的表现了。（2）DSKG 在所有指标上都显著优于其它模型。DSKG（级联）还在某些指标上达到了之前最佳的表现，比如 Hits@10。

表 2：在 FB15K-237 上的实体预测结果

表 3：数据集的统计信息

4.3 三元组预测

DSKG 不仅能预测实体，而且还能预测整个三元组。为了评估 DSKG 在直接预测三元组上的表现，我们构建了一个具有较大窗口的波束搜索器。另外也还有一些能够提升序列预测结果的复杂方法 [8]。具体而言，我们首先要求模型以所有实体为输入来预测关系，然后选出前 10 万个 (实体, 关系) 对来构建出 (s,r,?) 这样的不完整三元组。然后，该模型以这些不完整三元组为输入，预测它们的最后一个实体。最后，我们选择前 100 万个三元组作为输出，并按降序方式对它们进行排序以便评估。

我们使用了精度来评测这些输出的三元组。设为输出的最佳 n 个三元组的集合，表示一个知识图谱的所有正确三元组的集合（包括测试集、验证集和训练集），表示预测得到三元组的集合（包括测试集和验证集）。则与最佳 n 个输出三元组相关的精度 p_n 的计算方式为：

其中，分别表示中正确的、预测的和错误的三元组数量。由此，我们可绘制 p_n 随 n 变化的曲线。

我们在三个数据集上执行了实验，并将 DSKG 与两个通用模型 G2 和 G4 进行了比较。G2 是一个通用的 2 层 RNN 模型（见图 1c）。G4 是一个通用的 4 层 RNN 模型，因为 DSKG 也使用了 4 个不同的 RNN 单元。它们也都应用了 DSKG 中所用的所有功能（采样器、dropout 等）。

图 2：在三个数据集上的三元组预测结果

从图 2 上面一行可以看到，DSKG 在所有数据集上都显著优于 G2 和 G4，尤其是在 FB15K-237 上。另外，G4 的表现也比 G2 差。这可能是因为更深度的网络和更多参数会让实体和关系嵌入不适合训练。图 2 下面一行给出了 DSKG 的三元组预测的详细比例。在 FB15K-237 上，DSKG 以 0.47 的精度（前 10 万）正确预测了超过 2000 个三元组。在另外两个更简单的数据集上，DSKG 表现更好。在 FB15K 上以 0.87 的精度（前 40 万）正确预测了 34155 个三元组，在 WN18 上以 0.91 的精度（前 17 万）正确预测了 5037 个三元组。注意，DSKG 在 WN18 上的精度最后出现了陡然下降，这是因为 WN18 仅有 10000 个三元组供预测，而 DSKG 已经输出了所有其所能预测的三元组。

5 分析

5.1 与其它模型的比较

为了分析 DSKG 各个部分的贡献，我们开发了一系列仅包含部分功能的子模型：

NR：在训练中没有使用关系损失的 DSKG。构建这个模型的目的是评估最小化关系损失对实体预测的影响。
NS（非序列）：我们使用了 4 个全连接层（ReLU 作为激活函数）来替换 DSKG 中的 RNN，并减少了关系层和实体层之间的连接。最后，我们添加了一个密集层来组合这两个层的输出。这个模型与 DSKG 仍有一些其它共有特性（比如 dropout 和采样器）。构建该模型的目的是了解序列特性的影响。
NRE：没有使用基于关系预测增强实体预测的 DSKG（3.4 节）。

图 3：DSKG 以及其它模型在 FB15K-237 上的表现

图 3 给出了这些模型以及 G2 和 G4 模型在 FB15K-237 的验证集上的表现。我们可从结果中观察到：

序列特性是 DSKG 的关键点。对比 DSKG 和 NR 与 NS，我们可以发现：（1）尽管 NR 保有序列结构，但它的表现仍不及 DSKG，因为 NR 没有学习预测关系；（2）NS 没有使用序列结构，也没有学习预测关系。因此，它是图 3 中结果最差的。
针对知识图谱的多层 RNN 架构能显著提升表现。在 FB15K-237 上，DSKG 在所有指标上都优于 G2 和 G4，即使 DSKG 没有使用关系预测增强也一样。注意，在第 4.3 节，我们已经表明 DSKG 在三元组预测上优于 G2 和 G4。因此，DSKG 中使用的架构建模知识图谱的能力比通用型多层 RNN 模型更好。
关系预测增强方法能进一步优化实体预测结果。DSKG 的表现总是优于 NRE，即使在 MR 指标上也是如此，因为 DSKG 能直接去除很多不正确的实体。

5.2 层数的影响

表 4：在 FB15K-237 上，不同层数的 DSKG 的实体预测结果；‡ 一行是第 4 节所使用的主要结果

5.3 嵌入大小的影响

表 5：在 FB15K-237 上，不同嵌入大小的 DSKG 的实体预测结果

-End-

实验室介绍：南京大学万维网软件（Websoft）研究组在瞿裕忠教授的带领下，长期从事知识图谱（语义网）及相关技术的研发，研究组成员包括胡伟副教授、程龚副教授以及30余位博士和硕士研究生，近期的研究方向主要包括：智能问答、知识融合和语义搜索。
联系方式：胡伟，[email protected]，微信号：whu1982
网站：http://ws.nju.edu.cn

OpenKG.CN

中文开放知识图谱（简称OpenKG.CN）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文，进入 OpenKG 博客。

postgresql的用户、数据库和表 Ray.1998 postgresql 数据库 postgresql oracle
在PostgreSQL中，用户、数据库和表是关系型数据库系统的基本组成部分。理解这些概念对数据库管理和操作至关重要。下面是对这些概念的详细解释：1.用户（User）在PostgreSQL中，用户（也称为角色）是一个用于身份验证和授权的实体。每个用户都有一个唯一的名称，并且可以有不同的权限（比如连接数据库、创建表、查询数据等）。超级用户（Superuser）：拥有所有权限，能够执行任何操作，包括绕过
Dockerfile的作用 Ray.1998 docker docker
Dockerfile是Docker镜像构建的核心文件，它是一个包含一系列指令的文本文件，定义了如何从基础镜像开始，逐步构建出一个符合需求的镜像。通过Dockerfile，可以自动化构建镜像的过程，使得镜像构建过程可重复且一致。*Dockerfile是一个文本文件，用于定义如何构建一个Docker镜像Dockerfile文件包含了镜像构建过程中的所有步骤，它们按照顺序执行，以生成一个定制化的镜像。D
基于Python的招聘系统——应聘兼职功能设计与实现 IT实战课堂—x小凡同学 Python毕业设计项目数据库
摘要：随着互联网的快速发展，招聘行业逐渐实现了线上化、自动化。本文提出了一种基于Python的招聘系统，特别关注应聘兼职功能的设计与实现。系统通过集成职位发布、简历管理、在线应聘、面试安排等功能模块，为招聘方和应聘者提供了一个高效、便捷的线上交流平台。本文首先分析了招聘系统的需求，然后详细阐述了应聘兼职功能的设计与实现过程，最后对系统进行了测试与评估。实验结果表明，该系统能够有效提高招聘效率，降低
微前端架构 qiankun qq_36437172 前端微前端 qiankun
背景：随着业务功能的扩展，原有开发模式已无法满足需求。上线后出现问题时，排查过程变得异常复杂，新开发人员也难以迅速理解现有代码。同时，系统间界面风格和交互差异较大，导致跨系统办理业务时工作量增加。因此，引入微前端架构，以支持团队协作、实现独立部署，并提升开发效率。微前端微前端qiankun：基于single-spa实现的微前端框架，允许多个子应用在一个主应用中独立运行且互不干扰，适用于大型应用或多
2023年顶级编程语言：企业的技术趋势程序员后端
在当今时代，编程语言种类繁多，据不同来源统计，总数约达2,500种。面对如此众多的选择，为项目挑选合适的编程语言变得颇具挑战性。正因如此，我们决定概述2023年将占据主导地位的顶级编程语言及技术趋势。我们期望通过分享对2023年编程语言趋势的深入洞察，助您做出明智的选择。我们审视了每种语言的核心优势与不足，这些技术不仅高效服务于业务任务，还广受开发人员社区的认可。由此，您将能更清晰地判断哪些语言最
Linux 如何使用dd命令来复制和转换数据？ linux
简介Linux中的dd命令是一个功能强大的数据复制和转换实用程序。它以较低级别运行，通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务。dd全称可以为：dataduplicator、diskdestroyer和DataDefinition功能和能力磁盘映像：创建整个磁盘或分区的精确、逐位副本数据擦除：使用零或随机数据安全地覆盖驱动器文件转换：ASCII和EBCDIC之间的转换、字节顺序
序列化和反序列化 Json 字符串 @JsonProperty 小林想被监督学习类以及方法 json
@JsonProperty是JacksonJSON库中的一个注解，用于控制JSON序列化和反序列化过程中字段的映射。具体来说，它可以帮助开发者指定JSON对象中的键名，以及控制字段的序列化和反序列化行为。以下是@JsonProperty注解的详细说明和常见用法：基本用法指定JSON键名：用于将Java类中的字段映射为JSON对象中的键名。例如，@JsonProperty("Mid")表示在JSON
知识篇：（五）JavaScript 数组进阶操作：对象属性操作、数组转换与求和全栈探索者chen 前端 javascript 知识分享 javascript 开发语言 ecmascript
JavaScript数组进阶操作：对象属性操作、数组转换与求和JavaScript数组的操作功能非常强大，尤其在处理数组中对象的属性、二维数组的转换、数组求和等场景下，能极大简化开发工作。本文将介绍几个进阶的数组操作方法及其代码示例。知识篇：（四）JavaScript数组操作方法详解及示例1.计算数组中对象的属性之和1.使用reduce()这是最常见、简洁的方式，用于对数组中的对象属性求和。let
如何制作一个自己的社区招聘软件新微云小编辑小程序前端后端需求分析性能优化个人开发产品运营
本项目旨在开发一个本地化的社区招聘软件，通过小程序实现多端适配，确保苹果和安卓手机用户都能便捷使用。该软件将允许用户发布所在社区或工业园区的招聘就业信息，并支持多种行业分类，以便不同行业的岗位信息能够以适合的方式展示。1.用户注册与登录支持手机号码注册和第三方登录（如微信、QQ）。用户信息管理，包括个人资料编辑和密码修改。2.招聘信息发布用户可以发布招聘信息，包括职位名称、公司简介、工作地点、薪资
K8S中Pod控制器之DaemonSet(DS)控制器元气满满的热码式 kubernetes 容器云原生
DaemonSet(DS)控制器DaemonSet类型的控制器可以保证在集群中的每一台（或指定）节点上都运行一个副本。一般适用于日志收集、节点监控等场景。也就是说，如果一个Pod提供的功能是节点级别的（每个节点都需要且只需要一个），那么这类Pod就适合使用DaemonSet类型的控制器创建。DaemonSet控制器的主要特点包括：自动部署：在集群的所有节点上自动部署Pod的副本。动态适应：当向集群
@property ww哈哈哈ww 前端
@property的概念在Python中，@property是一个装饰器（decorator），它用于将一个方法转换为一个属性来访问。这使得我们可以像访问普通属性一样访问方法的返回值，而不需要显式地调用方法。简单来说，它提供了一种简洁的方式来定义和访问类中的属性，同时允许在获取和设置属性值时添加自定义的逻辑。使用@property的基本步骤定义一个类并使用@property装饰器例如，定义一个Re
python定义函数时-＞ ww哈哈哈ww python python 开发语言
在Python中，函数定义时使用的->符号用于表示函数的返回值类型注解。虽然Python是动态类型语言，这种注解并非强制要求，但它能提高代码的可读性和可维护性，也有助于类型检查工具（如mypy）进行静态类型检查。以下是关于函数定义中->的详细介绍：1.基本语法deffunction_name(parameters)->return_type:"""函数文档字符串"""#函数体returnvalue
2025美赛数学建模-备战2025数学建模美赛——神经网络预测模型详解 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模算法 2025年数学建模美赛 2025年 2025年美赛神经网络人工智能
（全部都是公开资料，不代写论文，请勿盲目订阅）2025年数学建模美赛期间，会发布思路和代码，赛前半价，赛前会发布往年美赛的经典案例，赛题会结合最新款的chatgpto1pro分析，会根据赛题难度，选择合适的题目着重分析，没有代写论文服务，只会发布思路和代码，因为赛制要求，不会回复私信。内容可能达不到大家预期，请不要盲目订阅。已开通200美元/月的chatgptpro会员，会充分利用chatgpto
陕西省2022年7月行政区划及道路网SHP文件：GIS分析的利器左李滢Just
陕西省2022年7月行政区划及道路网SHP文件：GIS分析的利器【下载地址】陕西省2022年7月行政区划及道路网SHP文件本仓库提供了一份详细的陕西省行政区划及道路网SHP文件，涵盖了2022年7月的数据。该资源包括陕西省的省级、地市级、区县级行政区划边界，以及详细的道路网和铁路网信息。这些SHP文件非常适合用于GIS（地理信息系统）分析和相关研究项目地址:https://gitcode.com/
使用OpenAI Functions进行信息提取：深入探索数据结构化提取 hgSdaegva easyui 前端 javascript python
在当今信息泛滥的时代，如何从大规模的非结构化数据中提取出有价值的结构化信息成为了一项重要的任务。本篇文章将带你深入了解如何利用OpenAIFunctions进行高效的信息提取。技术背景介绍非结构化数据，如文本，图片，视频等构成了互联网的大部分内容。然而，许多应用程序需要结构化的数据来进行自动化处理和决策。信息提取技术正是将非结构化数据转化为结构化形式的关键技术。而OpenAIFunctions通过
从0到1搭建SpringBoot整合Quartz定时任务框架（保姆级教学+Gitee源码）黄团团 SpringBoot Java Spring spring boot 后端 java
前言：这边我自己从0到1搭建了一套简化版的Quartz定时任务纯后端框架，把搭建的整个过程中的逻辑都在这篇博客写下来了，用于开源分享，干货满满！目录一、Quartz简介二、项目整体结构图三、代码实现3.1、导入pom.xml依赖3.2、ScheduleConstants常量类3.3、SysJob实体类3.4、SpringUtils工具类3.5、核心配置类3.5.1、JobExecuteUtils执
关于CCleaner 卸载程序删除所有软件文件的现象 GivemeAK windows 经验分享
现象描述：CCleaner的卸载程序将所有的软件删除了如图：CCleaner卸载程序正在卸载\software目录下的Matlab软件这明显是错误的！说明卸载程序把/software目录下的文件从A开头已经删到了M开头原因：1、安装时，没有在/software目录下新建一个软件专有目录，而CCleaner安装程序选择安装路径时，它是不会自动再创建一个专门的文件夹存放软件文件的。所以实际上软件安装在
使用ChatLlamaCpp和Llama CPP Python进行聊天模型集成 AWsggdrg llama python 开发语言
在这篇文章中，我们将探讨如何使用ChatLlamaCpp和LlamaCPPPython库来搭建一个强大的聊天模型。我们将详细讲解如何进行模型集成，并提供完整的代码示例以帮助您快速上手。技术背景介绍随着自然语言处理技术的不断发展，越来越多的应用需要集成复杂的聊天模型以提高交互能力。ChatLlamaCpp是一个基于LlamaCPPPython库构建的聊天模型，支持多种功能调用和结构化输出，非常适合用
java微服务中消息队列处理中间件基础语法学习，零基础学习慧香一格学习消息队列 java java 中间件消息队列处理
在Java微服务中，消息队列处理中间件可以帮助实现服务之间的异步通信、解耦和负载均衡。常用的Java消息队列工具包括RabbitMQ、ApacheKafka和ActiveMQ。下面我将详细介绍这些消息队列工具在Java中的基础语法和使用方法。1.RabbitMQRabbitMQ是一个广泛使用的开源消息代理软件，支持多种协议（AMQP、MQTT、STOMP等）。我们可以使用SpringAMQP来简化
Next.js 实战 (十)：中间件的魅力，打造更快更安全的应用白雾茫茫丶 Nextjs15 实战系列 Next.js middleware
什么是中间件？在Next.js中，中间件（Middleware）是一种用于处理每个传入请求的功能。它允许你在请求到达页面之前对其进行修改或响应。通过中间件，你可以实现诸如日志记录、身份验证、重定向、CORS配置、压缩等任务。中间件是构建高效和安全的web应用的重要组成部分。应用场景身份验证你可以在中间件中检查用户的身份验证状态，比如从cookie或头部信息中读取JWT令牌，并根据验证结果决定是否允
C# 与 Python 代码互相调用的实践一只小灿灿 net Python c#python
一、引言在当今的软件开发领域，不同的编程语言都有其独特的优势和适用场景。C#是一种功能强大、面向对象的编程语言，主要应用于Windows平台开发、企业级应用开发以及游戏开发（借助Unity引擎等）等领域；而Python则以其简洁的语法、丰富的库以及在数据科学、机器学习、自动化脚本等众多方面的出色表现备受青睐。在实际的项目开发中，有时候我们希望能够结合这两种语言的优势，实现C#与Python代码的互
【教程】Ollama 部署 MindSpore 训练的大模型 Hsiayukoo llama python
gguf-mindspore本项目（gguf-mindspore）帮助用户快速的将MindSpore生成的大模型的ckpt文件，转换为Ollama可以加载的GGUF格式文件，主要思路是针对已有的如Huggingface上的对应模型的GGUF文件，利用MindSpore生成的ckpt文件，替换掉GGUF文件中的张量信息部分，生成自己的GGUF文件。依赖gguf==0.6.0mindsporenump
时间序列预测综述 Super_Whw 时序预测
文章目录非周期时间序列预测1.转化为监督学习数据集，使用xgboot/LSTM模型/时间卷积网络/seq2seq(attention_based_model)2.Facebook-prophet，类似于STL分解思路3.深度学习网络，结合CNN+RNN+Attention，作用各不相同互相配合参考：非周期时间序列预测1.转化为监督学习数据集，使用xgboot/LSTM模型/时间卷积网络/seq2s
为什么使用 char[] 而不是 String 作为密码存储的类型？肉三 Java java 开发语言
在Swing中，密码字段有一个getPassword()(returnschar[])方法，而不是通常的getText()(returnsString)方法。同样，我遇到了一个建议不要使用它String来处理密码。为什么String说密码会有安全隐患呢？感觉用起来很不方便char[]。将密码收集并存储在类型的对象中似乎合乎逻辑java.lang.String。但是，这里有一个警告：Object类型
如何创建自定义聊天模型类 srudfktuffk 人工智能 python
在当今的AI开发中，聊天模型成为了一个非常重要的领域。本文将介绍如何使用LangChain的抽象来创建一个自定义的聊天模型，旨在帮助你轻松地将自己的语言模型集成到现有的LangChain程序中。通过包装自定义的LLM（大语言模型）到标准的BaseChatModel接口中，你不仅能与现有程序无缝集成，而且还能自动享受LangChain的各种优化，包括批处理、异步支持和流式API等。技术背景介绍聊天模
使用RAG-Chroma与OpenAI构建高效问答系统 srudfktuffk 人工智能 python
在AI驱动的应用场景中，检索增强生成(Retrieval-AugmentedGeneration,RAG)是一种强大的技术，可以提升问答系统的精度和效能。在这篇文章中，我们将深入探讨如何使用Chroma与OpenAI结合，构建一个基于RAG的问答系统。技术背景介绍RAG是一种结合信息检索（IR）和自然语言生成（NLG）的技术。它通过先检索与问题相关的信息，然后生成答案，提高了问答系统的准确性和相关
Django学习笔记 Atmanlee python SQL Django
Django跟着“自强学堂”学习django。。。。。感谢学堂！！！https://code.ziqiangxuetang.com/django/django-tutorial.html（自强学堂）Django使用python开发的免费开源的web框架，用于快速搭建网站。特点之一就是拥有强大的数据库操作接口(QuerySetAPI),如果需要也可以执行原生SQLDjango概览urls.py网址入
使用Neo4j-Semantic-Ollama构建智能交互代理 safHTEAHE neo4j oracle 数据库 python
在现代应用中，结合图数据库与语义层的智能代理能够极大提升数据交互的效率和灵活性。本文将展示如何使用Neo4j-Semantic-Ollama模板来开发一个能够通过语义层与Neo4j图数据库交互的智能代理。我们将关注其如何利用Mixtral作为JSON格式的代理，通过用户意图与数据库进行交互。技术背景介绍Neo4j是一种高性能的图数据库，它适合于处理结构复杂的数据。在此基础上，加入语义层可以让应用程
FastAPI教程：快速构建高性能API 迪小莫学AI fastapi python
FastAPI教程：快速构建高性能API介绍FastAPI是一个现代的、快速的（高性能）Web框架，用于构建APIs，基于标准的Python类型提示。它非常适合用于构建高效、易于维护的API服务。FastAPI支持自动生成文档，输入数据验证和异步编程，且性能接近Go和Node.js。本教程目标本教程将带领你构建一个简单的FastAPI应用，包括：1.创建FastAPI项目2.定义和处理API端点3
如何有效控制 KV 缓存的内存占用，优化推理速度？ m0_70960708 笔记缓存
使用KV缓存技术的目的是在生成过程中计算过去tokens的键和值张量时，将这些张量存储（“缓存”）在GPU内存中，从而避免在每个生成步骤中重新计算这些tokens的键和值张量。KV缓存是一种妥协：我们以内存的消耗换取计算量的减少。在这篇文章中，我们将了解KV缓存的容量有多大、会带来哪些挑战，以及面对这些挑战最常用的应对策略是什么。01KV缓存的容量有多大？这相当简单：对于每个batch中每个序列的
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

CCKS 2018 | 最佳论文：南京大学提出 DSKG，将多层 RNN 用于知识图谱补全

你可能感兴趣的:(CCKS 2018 | 最佳论文：南京大学提出 DSKG，将多层 RNN 用于知识图谱补全)